【案例】北京地铁96123服务热线：用AI实现智能服务升级( 二 )

文章图片
●ASR（自动语音识别）“听清”用户说的“是什么” ，准确识别来自五湖四海的口音
-原心引擎对全部地铁站名进行分词，对于不在词典中的包含数字的词作为新词插入字典，并标注发音，解决数字与汉字并存的站点识别难题；-对地铁站名增加无调多发音，以对应识别外籍人士的“无语调”普通话；-优化语言模型，设计询问站点的常用话术，如：我要去“目的地”、终点站是“目的地”；以预测式解码的方法，解决对于站点的语音识别问题；-原心引擎针对口音识别进行优化，全国各地的口音都不会难住智能语音机器人。
针对亿通行地铁站点实体的语音识别，主要存在难点是：1.词语长度不一，有长有短，既有如“北京大学东门”这种语义确定的长词，也有如：“上地”“四惠”这种既短又有其他场景有实际意义的词（上帝、四会）；2.数字与汉字并存，如三元桥， 2号航站楼，这种特殊词导致后处理难， 3.使用人群范围广，游客、留学生、以及其他带口音的人群等均是产品客户，这些无疑给语音识别系统带来了难点；
针对这些问题我们采用如下方式解决，列举全部477个地铁站点，首先将所有地铁站名进行分词，对于不在词典中的包含含有数字的词作为新词插入字典，并标注发音，针对老外的“无语调”普通话，对地铁站名增加无调多发音，同时设计询问站点的常用话术，优化语言模型，如我要去{{目的地}} ，终点站是{{目的地}} ，最后解码器以“原心引擎”的预测式解码的方法，基本解决了对于站点的语音识别问题。
●NLP（自然语言处理）“听懂”用户说的是“什么意思” ，准确理解出发地、目的地
-在文本输入部分，沃丰科技语音机器人NLP模型，根据如易行提供的地铁站点名称进行文本前置纠错，在槽位提取前增加提取成功率，比如：“管庄”与“关庄” ，解决相似度高的站点名称；-在槽位提取的部分，模型针对全部地铁站点名称进行强化训练，实现地铁站名称的准确识别；-结合上下文信息、句法分析与规则约束，实现准确识别出用户说的地铁站是“出发地”还是“目的地” 。比如本轮已识别“出发地” ，如果用户下轮没有明确表示出再次查询的还是“出发地” ，只说了地铁站名，则标记其为“目的地”；-用户一次性说明出发地、目的地，系统直接采集成功；用户说法中缺失出发地或目的地，则机器人增加澄清询问，机器人结合用户前后发言进行理解处理，以获取完整出发地、目的地，完成路线信息采集。
亿通行地铁站实体的槽位提取，一共包含三种情况：1.仅包含{{出发地}}；2.仅包含{{目的地}}；3.既包含{{出发地}}又包含{{目的地}} 。主要难点是：1.语句一般都比较短，或者仅包含铁站名称；2.地铁站名称识别要求严格，传递给亿通行系统接口的站名必须严格属于477个地铁站点名称；3.传递给亿通行系统接口时，需要识别出地铁站名称属于{{出发地}}或者{{目的地}} 。
针对亿通行的系统接口严格要求， NLP处理部分，首先在文本输入部分根据亿通行提供的477个地铁站点名称进行文本前置纠错，在槽位提取前增加提取成功率，比如:“管庄”与“关庄”；在槽位提取的部分，模型中加入全部477个地铁站点名称进行强化训练，实现地铁站名称的识别，并结合上下文信息、句法分析与规则约束实现对识别出的地铁站点标注为{{出发地}}或{{目的地}} ，比如已经识别出{{出发地}} ，如果用户下轮没有明确的表示出再次查询的还是{{出发地}} ，如果只说了地铁站名，则标记其为{{目的地}} 。