跳动百科

腾讯混元发布并开源图生视频模型 上线对口型与动作驱动等玩法

姚莲辰   来源:网易

【腾讯混元发布并开源图生视频模型,上线对口型与动作驱动等玩法】

近日,腾讯公司宣布其人工智能研究实验室——腾讯AI Lab开发的图生视频模型“混元”正式对外发布,并且将源代码进行开源。这一举动不仅标志着腾讯在人工智能领域的又一次重大突破,也体现了其开放共享、推动行业共同进步的企业精神。

“混元”模型能够实现从图像生成高质量视频的功能,尤其擅长于人物的面部表情、身体动作的模拟和生成,支持多种风格化处理,比如对口型、动作驱动等高级应用。用户只需上传一张图片或一段文本描述,即可自动生成相应的视频内容,极大地丰富了数字内容创作的可能性,为短视频制作、虚拟主播、在线教育等多个领域提供了新的技术支撑。

此次开源,意味着开发者可以基于此模型进行二次开发,探索更多创新应用场景,加速AI技术在各行各业中的融合与落地。同时,这也为全球范围内的研究者提供了一个研究平台,有助于促进学术界与工业界的交流与合作,共同推动人工智能技术的发展。

腾讯AI Lab表示,未来还将持续优化该模型性能,扩展更多功能,以满足不同场景下的需求,为用户提供更加丰富、智能的服务体验。