从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。
“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。
中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。
“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。
据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。(董瑞丰)
编辑:赵蕴清
忒色 2026-04-23
忒色 2026-04-17
忒色 2026-04-17
忒色 本报通讯员 李星棋摄本报通讯员 李星棋4月2日,延安市图书馆携手延安市科技馆,共同举办“书香润少年 科学筑梦想”小小科普朗读者展演活动 2026-04-17
忒色 2026-04-17
忒色 2026-04-17
忒色 这片梯田花海是近期咸阳乃至关中地区的网红打卡地,每日前来踏青赏花的游客络绎不绝 2026-04-09
忒色 2026-04-07
忒色 “此次渭南市3地成功入选2026年全国‘四季村晚’示范展示点,是对渭南市持续健全优质文化资源直达基层机制、深耕基层公共文化建设工作的充分认可,进一步彰显了渭南的乡村文化活力与文旅融合成效 2026-03-30
忒色 2026-03-30
忒色 “我们打造‘沉浸式’文旅专列,旨在让旅客在抵达庙会前,提前感受药王山庙会的独特魅力 2026-03-30
忒色 2026-03-28
