人工智能

腾讯混元文生图大模型宣布开源:首个中文原生DiT架构

字号+作者: 来源:站长之家 2024-05-14 15:25 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com) 5月14日 消息:今日,腾讯旗下引人注目的混元文生图大模型(混元DiT)宣布全面开源,这一重要举措标志着人工智能领域的又一里程碑。该模'...

站长之家(ChinaZ.com) 5月14日 消息:今日,腾讯旗下引人注目的混元文生图大模型(混元DiT)宣布全面开源,这一重要举措标志着人工智能领域的又一里程碑。该模型已在Hugging Face和Github平台上发布,包含完整的模型权重、推理代码和算法,面向全球的企业与个人开发者免费开放商用。V5B品论天涯网

腾讯混元文生图大模型的负责人卢清林表示,混元DiT的开源具有双重价值。首先,作为业内首个中文原生DiT架构,它填补了开源社区的空白,为中文领域的多模态视觉生成提供了强有力的支持。其次,混元DiT的开源是全面开放的,与现网版本完全一致,保证了开发者和用户能够获取到最先进、最实用的技术。V5B品论天涯网

V5B品论天涯网

此次开源的混元DiT采用了与Sora同样的关键技术DiT架构,不仅支持256字中文理解,还能够作为视频等多模态视觉生成的基础。为了实现这一功能,腾讯团队精心设计了Transformer结构、文本编码器和位置编码,并构建了完整的数据管道,用于持续更新和评估数据,为模型的优化迭代提供了有力支持。V5B品论天涯网

值得一提的是,混元DiT还通过训练多模态大语言模型来优化图像的文本描述,实现了细粒度的文本理解。这使得用户能够与之进行多轮对话,根据上下文生成并完善图像,为创意设计和内容创作提供了无限可能。V5B品论天涯网

腾讯混元文生图大模型的全面开源,无疑将为全球的开发者和用户带来更为广阔的创新空间和应用前景。我们期待这一技术的进一步发展和应用,为人工智能领域带来更多的惊喜和突破。V5B品论天涯网

项目地址:https://github.com/Tencent/HunyuanDiTV5B品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]