【案例】北京地铁96123服务热线:用AI实现智能服务升级( 二 )


【案例】北京地铁96123服务热线:用AI实现智能服务升级
文章图片
●ASR(自动语音识别)“听清”用户说的“是什么” , 准确识别来自五湖四海的口音
-原心引擎对全部地铁站名进行分词 , 对于不在词典中的包含数字的词作为新词插入字典 , 并标注发音 , 解决数字与汉字并存的站点识别难题;-对地铁站名增加无调多发音 , 以对应识别外籍人士的“无语调”普通话;-优化语言模型 , 设计询问站点的常用话术 , 如:我要去“目的地”、终点站是“目的地”;以预测式解码的方法 , 解决对于站点的语音识别问题;-原心引擎针对口音识别进行优化 , 全国各地的口音都不会难住智能语音机器人 。
针对亿通行地铁站点实体的语音识别 , 主要存在难点是:1.词语长度不一 , 有长有短 , 既有如“北京大学东门”这种语义确定的长词 , 也有如:“上地”“四惠”这种既短又有其他场景有实际意义的词(上帝、四会);2.数字与汉字并存 , 如三元桥 , 2号航站楼 , 这种特殊词导致后处理难 , 3.使用人群范围广 , 游客、留学生、以及其他带口音的人群等均是产品客户 , 这些无疑给语音识别系统带来了难点;
针对这些问题我们采用如下方式解决 , 列举全部477个地铁站点 , 首先将所有地铁站名进行分词 , 对于不在词典中的包含含有数字的词作为新词插入字典 , 并标注发音 , 针对老外的“无语调”普通话 , 对地铁站名增加无调多发音 , 同时设计询问站点的常用话术 , 优化语言模型 , 如我要去{{目的地}} , 终点站是{{目的地}} , 最后解码器以“原心引擎”的预测式解码的方法 , 基本解决了对于站点的语音识别问题 。
●NLP(自然语言处理)“听懂”用户说的是“什么意思” , 准确理解出发地、目的地
-在文本输入部分 , 沃丰科技语音机器人NLP模型 , 根据如易行提供的地铁站点名称进行文本前置纠错 , 在槽位提取前增加提取成功率 , 比如:“管庄”与“关庄” , 解决相似度高的站点名称;-在槽位提取的部分 , 模型针对全部地铁站点名称进行强化训练 , 实现地铁站名称的准确识别;-结合上下文信息、句法分析与规则约束 , 实现准确识别出用户说的地铁站是“出发地”还是“目的地” 。 比如本轮已识别“出发地” , 如果用户下轮没有明确表示出再次查询的还是“出发地” , 只说了地铁站名 , 则标记其为“目的地”;-用户一次性说明出发地、目的地 , 系统直接采集成功;用户说法中缺失出发地或目的地 , 则机器人增加澄清询问 , 机器人结合用户前后发言进行理解处理 , 以获取完整出发地、目的地 , 完成路线信息采集 。
亿通行地铁站实体的槽位提取 , 一共包含三种情况:1.仅包含{{出发地}};2.仅包含{{目的地}};3.既包含{{出发地}}又包含{{目的地}} 。 主要难点是:1.语句一般都比较短 , 或者仅包含铁站名称;2.地铁站名称识别要求严格 , 传递给亿通行系统接口的站名必须严格属于477个地铁站点名称;3.传递给亿通行系统接口时 , 需要识别出地铁站名称属于{{出发地}}或者{{目的地}} 。
针对亿通行的系统接口严格要求 , NLP处理部分 , 首先在文本输入部分根据亿通行提供的477个地铁站点名称进行文本前置纠错 , 在槽位提取前增加提取成功率 , 比如:“管庄”与“关庄”;在槽位提取的部分 , 模型中加入全部477个地铁站点名称进行强化训练 , 实现地铁站名称的识别 , 并结合上下文信息、句法分析与规则约束实现对识别出的地铁站点标注为{{出发地}}或{{目的地}} , 比如已经识别出{{出发地}} , 如果用户下轮没有明确的表示出再次查询的还是{{出发地}} , 如果只说了地铁站名 , 则标记其为{{目的地}} 。