嘈杂场景语音识别准确率怎么提?脸书:看嘴唇( 二 )
但是基于现实使用方面的考虑 , 有学者提出了一些担忧 。
其中 , 华盛顿大学的人工智能伦理学专家OsKeye就提到 , 对于因患有唐氏综合征、中风等疾病而导致面部瘫痪的人群 , 依赖读唇的语音识别还有意义吗?
对此 , Meta方面研究人员回应称 , AV-HuBERT方法更多关注于唇部动作 , 并非整个面部 。
而且与大多数AI模型类似 , AV-HuBERT的性能“与训练数据中不同人群的代表性样本数量成正比” 。
论文地址:
https://arxiv.org/abs/2201.02184
https://arxiv.org/abs/2201.01763
GitHub地址:
https://github.com/facebookresearch/av_hubert
参考链接:
【嘈杂场景语音识别准确率怎么提?脸书:看嘴唇】https://venturebeat.com/2022/01/07/meta-claims-its-ai-improves-speech-recognition-quality-by-reading-lips/
- 网络支付|智能音箱WiFi通信技术,ESP32-S3物联网芯片,高性能语音唤醒识别应用
- 亚略特|技术为根,深扎场景,亚略特获得深圳市“专精特新”企业认证
- 宇宙深处出现罕见场景,两个黑洞相撞后,释放的能量是太阳的8倍
- 红米手机|红米K60Pro曝光:超视觉直屏+全场景影像,真香机预定
- 有线网络部署麻烦或WIFI覆盖受局限的场景前段时间有人跟我咨询|看家护院影院级画质,览邦4G插卡摄像头S9 4K版引领智能监
- 饿了么|广州蓝景技术分享 — 闭包原理以及使用场景
- 聚焦场景,开放生态,宇视进击AIoT「无限新视界」
- 5G NB-IOT智能门锁,在不同场景下的解决应用
- 卡尔蔡司镜头|拍出质感大片,全新vivo X80 Pro满足你多场景的拍摄需求
- 铖昌科技|铖昌科技产品可应用至卫星互联网、5G毫米波通信等场景
