新京报贝壳财经讯(记者罗亦丹)3月4日,智谱发布了“2025开源年”的第一个模型:首个支持生成汉字的开源文生图模型——CogView4,其在DPG-Bench基准测试中的综合评分排名第一,该模型也是首个遵循Apache 2.0协议的图像生成模型。
CogView4支持中英双语提示词输入,擅长理解和遵循中文提示词,是一款能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求。在技术实现上,CogView4将文本编码器从纯英文的T5 encoder换为具备双语能力的GLM-4 encoder,并通过中英双语图文进行训练,使CogView4模型具备双语提示词输入能力。

CogView4生成的图片
校对 穆祥桐
相关文章:
不必过于焦虑被AI替代03-04
北京经开区开启“干部能力提升年”行动03-04
智谱发布“开源年”首个模型CogView4 可生成带汉字图片03-04
加油!梁王组合开启欧洲赛季03-04
格尔软件:公司DeepSeek一体机仍处于市场培育阶段03-04
教育创新始于对变革的理性拥抱03-04