<!--StartFragment-->
**中国计算机学会TF70沙龙:**
**跨模态前沿AI技术有哪些产业应用?**
![image.png](https://dev-media.amazoncloud.cn/150837889c4d4f959eeef0082f1cf2bd_image.png "image.png")
**随着AI逐步落地,产业需求不断深入,在单模态领域,如翻译等相关应用,AI的能力已经可以达到媲美人类的水平。但随着技术和产业的进一步发展,多模态成为了AI技术和产业突围的新方向,更多场景应用需要多模态大模型来支撑,例如跨模态检索、智能问答、文学艺术创作、视频配音、视频摘要等等。**
**如今跨模态AI技术有哪些前沿的研究成果及优秀的产业应用?未来的发展之路又将走向何方?本期活动邀请到Jina AI高级AI工程师王峰、超对称技术首席科学家吴恒魁、网易有道NLP算法专家程桥等企业专家,深入分享跨模态AI技术的相关思考及产业实践。CCF TF算法与AI SIG主席、网易有道首席科学家、段亦涛担任主持人。**
<!--EndFragment-->
<!--StartFragment-->
**1.《神经搜索在3D场景中的研究与应用》**
<!--EndFragment-->
<!--StartFragment-->
<!--EndFragment-->
![image.png](https://dev-media.amazoncloud.cn/ca196030af1440458baa76d565526df8_image.png "image.png")
<!--StartFragment-->
<!--EndFragment-->
<!--StartFragment-->
<!--StartFragment-->
王峰分享内容
来自Jina AI 王峰的报告题目是《神经搜索在3D场景中的研究与应用》,3D 物体的表征形式多种多样,相比于文本、图像,其包含了物体更加丰富的信息。精确建模与理解这些3D物体可以帮助我们更好地实现对 3D 模型进行分类、搜索、以及管理。将深度表征学习与 3D 模型数据结合可以将 3D 物体的特征更好的展现出来,以此支持各个领域下对 3D 物体数据的搜索需求。
<!--StartFragment-->
**2.《让预训练语言模型读懂数字:10亿参数时序-文本跨模态模型Big Bang Transformer》**
<!--EndFragment-->
<!--EndFragment-->
<!--StartFragment-->
<!--EndFragment-->
![image.png](https://dev-media.amazoncloud.cn/fc0f3b0812b5401dbb37099e0efc455f_image.png "image.png")
<!--StartFragment-->
吴恒魁分享内容
来自超对称技术的吴恒魁在报告中主要分享了超对称技术公司发布的10亿参数金融预训练语言模型BigBang Transformer(乾元),基于时序-文本跨模态架构,融合训练文本和时序两种模态数据,下游任务准确率较T5同级别模型提升近10%,并大幅提高时序预测的R2 score,跨模态架构能让语言模型识别时序数据的变化并通过人类语言来分析和阐述其发现。
<!--EndFragment-->
<!--StartFragment-->
**3.《Cross-modal Multi-task Learning for Speech Translation》**
<!--EndFragment-->
<!--StartFragment-->
<!--EndFragment-->
![image.png](https://dev-media.amazoncloud.cn/6289a06224684fa1ac9bb4b027bad05c_image.png "image.png")
<!--StartFragment-->
程桥分享内容
网易有道在语音翻译,图片释义,文档理解等很多实际业务中都面临着跨语言跨模态的场景,跨语言跨模态应用通常面临着训练数据不足,不同模态之间语义存在差异,系统多个模块之间错误传播等问题。来自网易有道的程桥在报告中介绍了有道在跨语言跨模态场景中的相关应用,以及使用多任务学习框架解决跨语言跨模态场景下的语音翻译相关问题。
<!--EndFragment-->
<!--StartFragment-->
**4.参会者连麦提问讨论**
<!--EndFragment-->
<!--StartFragment-->
<!--EndFragment-->
![image.png](https://dev-media.amazoncloud.cn/069387807801424dbe50b3aadcb0177a_image.png "image.png")
<!--StartFragment-->
<!--EndFragment-->
![image.png](https://dev-media.amazoncloud.cn/feac96f2c2db4d348d0cb8ef116b7a08_image.png "image.png")
<!--StartFragment-->
<!--EndFragment-->
![image.png](https://dev-media.amazoncloud.cn/40520bb7c4cf490f8787edb0ac79e281_image.png "image.png")
<!--StartFragment-->
在提问互动环节中,除了有参会者积极连麦与讲者进行线上交流,交流群内也有众多参会者提问讨论,并纷纷对讲者的解答表示感谢。人工智能技术不断向前发展,如今已赋能到各种产品和场景中,多方位地走入人类的生活,当更多复杂的场景对 AI 技术的应用效果提出更高要求时,跨模态就成为了 AI 技术和产业突围的新方向。CCF TF 算法与AI SIG组织的本次“跨模态前沿AI技术与产业应用“活动,旨在加强技术交流,为相关从业者提供有效参考,感谢三位讲者的精彩分享及各位参会者的支持,敬请关注CCF TF算法与AI SIG 接下来的活动。
<!--EndFragment-->