从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。
“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。
中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。
“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。
据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。(董瑞丰)
编辑:赵蕴清
忒色 2026-01-18
忒色 2026-01-15
忒色 《大唐遗宝——何家村窖藏出土文物展》 2026-01-14
忒色 2026-01-10
忒色 社区党支部以“社志融合”为契机,牵头成立“蒲公英爱心管家”志愿服务队,吸纳在职党员、退休干部、热心居民等59名骨干,通过党组织牵头、专业社会工作者赋能、志愿者参与的模式,实现了从“无人管”到“众人治”的转变 2026-01-08
忒色 群星荟萃+权威聚焦,大明宫宴引爆文旅新风潮大明宫宴凭借“文化+餐饮+沉浸演艺”的创新模式,已然成为西安文旅现象级IP,不仅吸引洪金宝、曹骏、米卡等多位知名艺人亲临体验,更获得陕西广播电视台、CCTV等权威媒体及百家媒体的聚焦报道,热度与影响力持续攀升 2026-01-07
忒色 为进一步深化唐诗文化的现代表达,肯悦咖啡还与“西安好物”达成合作,将咖啡品牌基因与唐诗文脉相结合,依托“西安好物”创造性转化生成可消费的文化符号,共推唐诗IP产业化 2026-01-06
忒色 12月30日,“首届油泼辣子产业大会暨甘谷辣椒品牌升级发布会”在西安圆满落幕 2025-12-30
忒色 2025-12-26
忒色 此前,由西安三意社打造的首部秦腔微短剧《火焰驹》播出后,曾引发一场关于传统戏曲发展方式的热烈讨论 2025-12-25
