在电商、物流等领域,增强用户体验的一个小细节,就是能够把用户复制或图像识别出的一段杂乱无章的文本,自动填充到对应的位置,不用一步步下拉选择省市区或填写收件人信息。再或者能够把一些电商系统导出的客户收货人地址信息,经过批量自动化的解析处理后便于物流系统归类。
天行数据提供了一个收货地址智能解析接口,通过这个接口,可以智能解析出复杂文本中的各项关键物流信息。
我们来进行具体的测试,通常用户复制的或者电商系统导出收货人信息会有下几种常见格式:
1,马云13800138000杭州市滨江区网商路699号310052 2,杭州市滨江区网商路699号马云1380013800 3,快递地址:杭州市滨江区网商路699号 收件人马小姐 电话:13800138000
第一种,基础应用,可以看到即使这段文本中间没有任何分隔符号或空格,也非常完美的解析到结果。
第二种,去掉了邮编,打乱了顺序。由于中文的特殊性,中文姓名和中文地址中间的识别,一直是个难题。这次混排了在了一起,依然完美识别。(近期优化:优先解析显示文本中邮编,否则显示默认的区县级邮编)
第三种,我们增加了与核心内容无关干扰信息,把马云改成了马小姐。可以看到地址清洗后依然完美的匹配出了各字段的结果。
天行数据近期升级了收货地址解析接口的算法,对收货信息中的人名,进行了很好的识别,当人名或地址混排时,不在需要用符号或空格分隔也有非常好的识别结果了。欢迎大家测试反馈!