从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。
“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。
中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。
“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。
据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。(董瑞丰)
编辑:赵蕴清
忒色 为进一步深化唐诗文化的现代表达,肯悦咖啡还与“西安好物”达成合作,将咖啡品牌基因与唐诗文脉相结合,依托“西安好物”创造性转化生成可消费的文化符号,共推唐诗IP产业化 2026-01-06
忒色 12月30日,“首届油泼辣子产业大会暨甘谷辣椒品牌升级发布会”在西安圆满落幕 2025-12-30
忒色 2025-12-26
忒色 此前,由西安三意社打造的首部秦腔微短剧《火焰驹》播出后,曾引发一场关于传统戏曲发展方式的热烈讨论 2025-12-25
忒色 声维漫游 人声为器 阿卡贝拉音乐会再度登陆西安大剧院实验剧场当乐器退场,人声成为唯一主角,一场穿越时空的听觉漫游拉开帷幕 2025-12-24
忒色 12月23日,陕西实验话剧院新型演艺空间“215戏剧空间”启动仪式在西安王府井Discovery正式启动,首部Sketch舞台作品《鞭炮喜剧之碎崽》也正式与观众见面 2025-12-24
忒色 陕西通过开展技能培训、培育乡村工匠等渠道稳就业促增收,织密脱贫人口就业保障网,脱贫人口务工就业连续5年超过210万人——铺就通往美好生活的技能之路12月20日,在陕西康嫂家政服务有限公司培训室,刘新颖手持婴儿模型,为学员演示抚触手法 2025-12-22
忒色 本报讯 (记者 李卫)12月17日,由文化和旅游部市场管理司主办,中央文化和旅游管理干部学院、陕西省文化和旅游厅联合承办的全国导游大赛获奖选手暨优秀导游宣讲活动(陕西西安站)成功举办 2025-12-22
忒色 作为国漫领域的口碑佳作,《一人之下6》此次聚焦"二十四节谷篇"核心剧情,将进一步探寻甲申之乱的关键线索与冯宝宝身世的隐秘关联 2025-12-20
忒色 2025-12-18
忒色 2025-12-04
