从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。
“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。
中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。
“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。
据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。(董瑞丰)
编辑:赵蕴清
忒色 活动期间,游客可在爱菊健康文化体验园内观光游玩葫芦种植区、丝路好物区、非遗体验区、趣味游戏区四大主题区域 2025-07-11
忒色 宝鸡市文物普查队发现博山盖绿釉陶奁博山盖绿釉陶奁(资料照片) 2025-07-01
忒色 选手返程行囊满载特产,化身移动的“麟游名片”,推动农特产品依托赛事走向全国 2025-06-30
忒色 6月25日至27日,由省文化和旅游厅主办、渭南市文化和旅游局承办的陕西省濒危剧种展演在渭南大剧院上演。 2025-06-30
忒色 党建引领锻造“高原枫警”吉迈派出所将党建工作作为队伍建设的 “定盘星”,纵向建立“局党委—所支部—党员先锋岗”三级责任链,横向打造“民警+村警+义警”治安共同体,立体化构建“激励-约束-关怀”成长矩阵,用三维坐标重构高原警务生态 2025-06-23
忒色 第四届源点西部电影展在古城西安启幕 2025-06-23
忒色 2025-06-23
忒色 央视热播电视剧《护宝寻踪》圆满收官《吕氏乡约》再塑乡风文明底色蓝田县三里镇乔村文化墙上的《吕氏乡约》 2025-06-23
忒色 记者从久治县公安局获悉,G347综合检查站自2023年12月正式运行以来,已成为果洛州乃至青海省社会治安防控体系的关键支点,以“智慧警务+跨域协作”的创新模式,筑起一道坚不可摧的省界安全防线 2025-06-20
忒色 2025-06-21
忒色 6月18日,聚焦果洛“十四五”·共鉴发展新征程2025“网链果洛・融绘新篇”大型融媒体采风行,深入探访了果洛藏族自治州久治县河曲马良种繁育基地,记录下这里以特色产业助力乡村振兴的生动实践 2025-06-20