一种基于最小距离编辑法的模糊地址识别模型

来源 :电力大数据 | 被引量 : 0次 | 上传用户:little_ant2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于受到客户方言及语言习惯因素影响,加之客户服务中心客服坐席手工记录客户地址的形式不统一,难以实现精确筛选细化到小区、村庄级别的相近地址,支撑定位客户反映的频繁停电等问题。该文提出了一种地址模糊匹配模型,根据地址信息的文本和拼音形式,利用最小编辑距离算法量化非结构化客户地址间的偏差程度。进一步应用支持向量机分类技术,结合地址文本信息和拼音信息的编辑距离计算结果,实现对相近地址的有效识别。试验结果表明,该方法可以克服谐音字对地址识别的影响,具有计算速度快且识别能力强的优势,能够支撑筛选频繁停电地址等场景应用
其他文献
目的分析淋巴管肌瘤病(LAM)胸部及腹部的临床与CT表现。方法对13例经病理证实的LAM胸腹部的临床与CT表现进行回顾性分析。结果12例以肺内表现首发,均有进行性呼吸困难;其他表现包
患者男,56岁,发现左侧腮腺区无痛性肿块2个月。查体:面神经功能无异常。左侧腮腺区轻度隆起,可扪及直径约2cm肿物,无明显压痛。彩超:左侧腮腺内见约1.4cm×2.7cm囊实性肿物
目的观察肝局灶性脂肪浸润与周围相对正常肝组织是否存在血流灌注的差异。方法应用低机械指数对比脉冲系列成像技术分析20例25处肝局灶性脂肪浸润与周围相对正常肝组织,比较
目的观察内科胸腔镜下胸膜滑石粉粘连术治疗恶性胸腔积液的疗效。方法将25例恶性胸腔积液患者随机分为两组,治疗组12例采用内科胸腔镜下喷洒滑石粉胸膜固定法;对照组13例采用常