语言

 

中文

 

English

 

CopyRight  © 2017 中科聚信信息技术(北京)有限公司 All Rights Reserved.       京ICP备14046623号-3

模糊匹配(Mplus)
地址、公司名等非结构化数据的结构化和标准化,并进行模糊匹配比对的技术

长久以来,非结构化数据一直占据历史数据的很大容量,但这部分数据一直未能很好地为分析服务,甚至在很多时候都难以进行数据管理,包括对数据有效性的检查及数据标准化的管理,使得长期以来大量地址、公司名称这类非结构化数据占据了海量的存储却没有发挥出应有的价值。

中科聚信使用的模糊匹配技术包含了非结构化数据的标准化及模糊比对处理,既能对地址、公司名称等进行标准化处理,便于更好地进行数据治理和数据应用,也能对地址、公司名等数据进行模糊比对,发掘这些非结构化数据的异同,为自动信息比对、名单模糊比较、营销及欺诈侦测提供分析因子。中科聚信使用了包含基于统计的多义概率词库、自定义语法、同音字匹配、切词策略表、正则表达式等基于本地海量数据研发验证的中文模糊匹配技术,即能在一开始就提供高精准度的地址、公司名称的模糊匹配,也为用户提供了未来拓展及自定义的自由,可以充分满足业务不断发展变化的需要。

欺诈侦测与防控