零样本学习超越CLIP!谷歌提出首个多模态稀疏化模型LIMoE( 二 )
只不过有的会主要处理图像 , 有的主要处理文本 , 或者二者兼具 。
还有在大多数情况下 , 都会有一个专家来处理所有包含文本表示的图像patch 。

文章图片
除了性能上的提升 , 使用稀疏化模型的好处还体现在降低计算成本上 。
因为“多专家”的模式意味着 , 尽管多设了很多子模型 , 模型容量显著增加 , 但是实际计算成本并没有明显变化 。
如果一次任务中只使用了一个子模型 , 那它的成本和标准Transformer的差不多 。
比如LIMoE-H/14总共有5.6B参数 , 但是通过稀疏化 , 它只会使用每个token的675M参数 。
OneMoreThing稀疏化模型一直是谷歌深度研究的一个方向 , 已经提出了MoE、GLaM在内的多个模型 。
这次LIMoE也不是谷歌第一次魔改MoE 。
去年6月 , 他们提出了V-MoE , 是一种新型的视觉架构 , 今年已将全部代码开源 。
参考链接:
https://ai.googleblog.com/2022/06/limoe-learning-multiple-modalities-with.html—完—
量子位QbitAI·头条号签约
- 零售业|确定涨价!iPhone14四款新机全面涨价!国行也在其中!
- 网友热议|母亲回应3个孩子2个上清华:只能教孩子做人诚实守信 学习都靠自己努力
- 你可能不信:新手机都用旧零件 iPhone也不例外
- 零售业|2022年全球物联网PaaS市场现状及发展趋势预测分析(图)
- 又一款“P50 Pro”上市,价格仅为华为的零头,小姐姐都说好
- iPhone|4款几乎“零差评”的手机,覆盖低端和高端,闭眼买就行
- 凯迪拉克|全新凯迪拉克Celestiq内饰设计曝光,零配件采用3D打印技术打造!
- 安卓|目前这3部几乎“零差评”的手机最值得买,用到2027年不成问题
- 格力电器|不要再说Python难了,按照这个学习路线,四周速成Python
- 澎湃早晚报丨6月25日早餐湃·上海本土零新增
