从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。
“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。
中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。
“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。
据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。(董瑞丰)
编辑:赵蕴清
忒色 本届宝鸡马拉松在组织运营上实现突破,将起跑阶段前5公里赛道由半幅改为全幅设计,有效疏导参赛人流,从源头化解了大型路跑赛事常见的出发拥堵问题 2025-10-31
忒色 2025-10-27
忒色 2025-10-27
忒色 2025-10-26
忒色 2025-10-26
忒色 昔日煤城,今朝蝶变。融入西安“半小时圈”,铜川机遇扑面而来!铝基新材料、半导体、汽车装备…链式集群,打造转型高地。 2025-10-26
忒色 60多年来,歌曲《唱支山歌给党听》承载着人们对新生活的歌颂,深沉的爱国爱党之情,唱遍大江南北,温暖几代人的记忆。 2025-10-26
忒色 千年窑火淬炼北方青瓷之都,冰裂纹中凝固盛唐气韵。药王山上铭刻大医精诚,薛家寨峭壁生长英雄信仰。 2025-10-26
忒色 白鹭在漆水河振翅朱鹮于沮河畔起舞,华北豹的足迹隐入苍茫山林……从工业记忆到山水画卷,铜川大地,正书写着动人的生态篇章 2025-10-26
忒色 “收藏170余万件文物”的陕西历史博物馆 带着3件国宝登上花呗皮肤 10月24日,陕西历史博物馆携3件国宝——镶金兽首玛瑙杯、鸳鸯莲瓣纹金碗、开元通宝金钱登上花呗文物皮肤,可在手机上免费获取 2025-10-24
忒色 此次KPRO肯律轻食与肯悦咖啡携手西马,不仅以“营养补给+能量唤醒”的双重保障践行品牌承诺,更通过与赛事精神的深度契合,让“安心品质”与“活力生活”的理念在古城西安的赛道上充分彰显 2025-10-23
忒色 恩施地心谷景区据悉,本次“知音湖北·超级文旅日”活动由湖北省统一打造,以每月17日(谐音“一起”)为载体,旨在通过文旅惠民深化“知音湖北”的文化内涵 2025-10-20
