从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。
“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。
中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。
“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。
据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。(董瑞丰)
编辑:赵蕴清
忒色 如今,西安还有不少像万邦古旧书房一样的古旧书店,它们开辟出了一个平静独处的角落,为喜欢古旧书的读者留下一方精神家园 2024-04-23
忒色 1991年,韩城市历史文化名城保护委员会成立,出台《韩城市历史文化名城保护规划实施管理办法》,强化对古城的保护 2024-04-22
忒色 图为4月14日航拍宁陕县秦岭乡村绿道一角 2024-04-18
忒色 穿着华服的“花神”翩翩起舞 4月14日下午,12位身着华服的“花神”现身大唐芙蓉园并巡游,这也意味着曲江文旅2024长安踏春季活动正式启动 2024-04-16
忒色 一位“00后”“陪拍师”小张告诉记者,最近公园里不少来拍照的人手里拿着反光板、相机,甚至还带了小板凳、折叠梯——这其中很多都是“陪拍师” 2024-04-16
忒色 演员市场成熟、拍摄场景丰富、制作公司水平在全国都称得上数一数二,西安发展微短剧产业十分有优势 2024-04-16
忒色 赛事期间,杨凌示范区酒店延迟至15时退房,新增7辆“杨马”专列,赛前赛后安排摆渡车,为参赛选手提供免费营养早餐……今年的杨凌农科城马拉松赛上,还有4120名青年志愿者活跃在赛场各处,提供赛道补给、线路引导、物品发放、医疗救助等服务 2024-04-15
忒色 两只彩鹮现身西安浐灞国家湿地公园 西安浐灞国家湿地公园供图 本报讯 (首席记者 龚伟芳) “彩鹮的小伙伴也来啦!”近日,西安浐灞国家湿地公园又传来好消息,在清明节假期刚刚现身的国家一级重点野生保护动物彩鹮,引来了另一只彩鹮小伙伴,让人大呼惊喜 2024-04-11
忒色 努力营造全社会保护候鸟良好氛围 眼下,随着夏候鸟的陆续抵达,众多鸟类已开始进入繁殖期,西安迎来新的观鸟季,除了有关鸟类的新发现外,如何保护鸟类、更好地爱鸟也尤为引人关注,这些点点滴滴都折射着西安这座城的生态自觉 2024-04-11
忒色 4月6日,文化和旅游部公布2024年清明节假期文化和旅游市场情况,“花为媒”促进城市休闲和乡村旅游发展,赏花、踏青、乡村、露营、美食等主题游需求旺盛 2024-04-11
忒色 如今,“旅游搭子”“健身搭子”“通勤搭子”“逛街搭子”等“搭子”社交逐渐流行起来,成为都市年轻人日常的生活方式 2024-04-11