中科院自动化所发布通用AI平台 可实现图文音“无缝转换”

时间:2021-07-13 10:37:44  来源:西安日报

分享到微信朋友圈

打开微信,点击 “ 发现 ” ,使用 “ 扫一扫 ” 即可将网页分享至朋友圈。

中科院自动化所发布通用AI平台 可实现图文音“无缝转换”

从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。


从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。

“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。

中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。

“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。

据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。(董瑞丰)

编辑:赵蕴清


分享到微信朋友圈

打开微信,点击 “ 发现 ” ,使用 “ 扫一扫 ” 即可将网页分享至朋友圈。
  • 了解陕西大事 关注陕西头条

网站简介 网站团队 本网动态 友情链接 版权声明 我要投稿 工作邮箱 陕西不良信息举报 新闻宣传自律管理承诺书

Copyright ©2006-2021 西部网(陕西新闻网) WWW.CNWEST.COM, All Rights Reserved.
本网站法律顾问:陕西洪振律师事务所主任 王洪
陕ICP备07012147号 互联网新闻信息服务许可证: 61120170002 信息网络传播视听节目许可证:2706142