嘈杂场景语音识别准确率怎么提？脸书：看嘴唇( 二 )

但是基于现实使用方面的考虑，有学者提出了一些担忧。
其中，华盛顿大学的人工智能伦理学专家OsKeye就提到，对于因患有唐氏综合征、中风等疾病而导致面部瘫痪的人群，依赖读唇的语音识别还有意义吗？
对此， Meta方面研究人员回应称， AV-HuBERT方法更多关注于唇部动作，并非整个面部。
而且与大多数AI模型类似， AV-HuBERT的性能“与训练数据中不同人群的代表性样本数量成正比” 。
论文地址：
https://arxiv.org/abs/2201.02184
https://arxiv.org/abs/2201.01763
GitHub地址：
https://github.com/facebookresearch/av_hubert
参考链接：
【嘈杂场景语音识别准确率怎么提？脸书：看嘴唇】https://venturebeat.com/2022/01/07/meta-claims-its-ai-improves-speech-recognition-quality-by-reading-lips/

网络支付|智能音箱WiFi通信技术，ESP32-S3物联网芯片，高性能语音唤醒识别应用
亚略特|技术为根，深扎场景，亚略特获得深圳市“专精特新”企业认证
宇宙深处出现罕见场景，两个黑洞相撞后，释放的能量是太阳的8倍
红米手机|红米K60Pro曝光：超视觉直屏+全场景影像，真香机预定
有线网络部署麻烦或WIFI覆盖受局限的场景前段时间有人跟我咨询|看家护院影院级画质，览邦4G插卡摄像头S9 4K版引领智能监
饿了么|广州蓝景技术分享 — 闭包原理以及使用场景
聚焦场景，开放生态，宇视进击AIoT「无限新视界」
5G NB-IOT智能门锁，在不同场景下的解决应用
卡尔蔡司镜头|拍出质感大片，全新vivo X80 Pro满足你多场景的拍摄需求
铖昌科技|铖昌科技产品可应用至卫星互联网、5G毫米波通信等场景