从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。
“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。
中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。
“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。
据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。(董瑞丰)
编辑:赵蕴清
忒色 2025-12-04
忒色 同时,清盛斋也将探索线上销售、品牌授权等多元发展路径,开发泡馍定制礼盒、专用原汤包、冷链真空馍坯等衍生产品,让更多人在家也能品尝到正宗的西安泡馍 2025-12-02
忒色 活动现场,肯德基工作人员向大家介绍“食物驿站”公益项目的情况和领取规则,并向有需要的居民提供百余份余量食物,吸引众多社区居民有序领取,传递出浓浓暖意 2025-11-27
忒色 2025-11-27
忒色 阳光下,火晶柿子犹如一盏盏小灯笼挂满枝头,与周围的古建筑相映成趣,吸引了不少游客打卡拍照 2025-11-25
忒色 2025-11-24
忒色 一杯咖啡一份地图,票根经济赋能文旅融合11月3日,由曲江新区文化旅游局和肯悦咖啡联合举办的“金色曲江·银杏咖啡节”活动正式开启,西北首家独立肯悦咖啡店暨陕西肯悦咖啡30家门店也盛大启幕 2025-11-04
忒色 省林业局自然保护地与野生动植物保护处处长赵侠呼吁,各类参与鸟类保护的个人和社会团体应严格遵守野生动物保护法、自然保护区条例等法律法规,未经许可不得擅自进入保护区核心区等未开放区域 2025-11-04
忒色 本届宝鸡马拉松在组织运营上实现突破,将起跑阶段前5公里赛道由半幅改为全幅设计,有效疏导参赛人流,从源头化解了大型路跑赛事常见的出发拥堵问题 2025-10-31
忒色 2025-10-27
忒色 2025-10-27
忒色 2025-10-26
