从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。
“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。
中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。
“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。
据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。(董瑞丰)
编辑:赵蕴清
忒色 蜀河站客运值班员黄瑶用对讲机了解客车信息 2026-02-10
忒色 本报记者 杨露雅文/图1月28日,镇巴县水井街的镇巴宣纸展销门店里,陕西省非物质文化遗产代表性项目镇巴宣纸传统造纸技艺代表性传承人胡明富轻轻掀起宣纸一角,透过灯光,若隐若现的“秦宝”二字呈现在众人眼前 2026-02-04
忒色 农历马年临近,“中国泥塑之乡”陕西省宝鸡市凤翔区六营村的民间艺人们赶制泥塑,迎接新年 2026-02-03
忒色 从残片到全景,从修复现场到艺术解读,这场以高清复原为特色的寿峰寺壁画微展览,将文物保护工作的不易与中国传统艺术的非凡价值同时呈现,让历经数百年岁月洗礼的宜川县寿峰寺壁画,在时光长河中得以延续,成为今人与历史对话的重要桥梁 2026-02-02
忒色 2026-01-23
忒色 2026-01-18
忒色 2026-01-18
忒色 2026-01-15
忒色 《大唐遗宝——何家村窖藏出土文物展》 2026-01-14
忒色 2026-01-10
忒色 社区党支部以“社志融合”为契机,牵头成立“蒲公英爱心管家”志愿服务队,吸纳在职党员、退休干部、热心居民等59名骨干,通过党组织牵头、专业社会工作者赋能、志愿者参与的模式,实现了从“无人管”到“众人治”的转变 2026-01-08
忒色 群星荟萃+权威聚焦,大明宫宴引爆文旅新风潮大明宫宴凭借“文化+餐饮+沉浸演艺”的创新模式,已然成为西安文旅现象级IP,不仅吸引洪金宝、曹骏、米卡等多位知名艺人亲临体验,更获得陕西广播电视台、CCTV等权威媒体及百家媒体的聚焦报道,热度与影响力持续攀升 2026-01-07
