Date: Mar 1, 2025 - Mar 31, 2025Author: 政明zhenglin | 本文原载于【动画AI技术研究】系列博客
本次测试特别感谢
UNKNOWNTIMER提供的测试帮助
测试文档链接:
Google Drive*
如图片不清晰,可移步至知乎查看GPT-4o辅助动画制作测试前言最近、GPT-4o实装了图像生成的功能。在网上的热度很高,各种用GPT-4o做的吉普力风格短片以及教程层出不穷:
-
国外大神吉卜力版《星际穿越》加长预告片,GPT4o吉卜力风图像爆火!-
GPT-4o暴打Stable Diffusion?AI绘图格局一夜巨变!详解GPT-4o图像生成技术细节-
GPT-4o最新玩法,手把手教你做动画电影用户可以直接在GPT上通过语言描述和参考图进行图片生成。和MJ、SD等此类产品较大的不同在于、这种VLM相对更加自由、能够处理更多样的用户需求、同时集成度也更高。同时,GPT现在能提供“一站式服务”,不需要在各个产品中来回切换,直接在GPT中就能完成文字创意和图片的生成。
本月的日志更新针对GPT-4o的图像生成功能更新进行了一次测试,看看GPT-4o能够是否能够在动画制作的各个环节中起到有效的辅助作用。测试涵盖50种以上不同的用户需求案例,比如生成背景美术差分、生成人物表情集、生成物品设定和修改人物动作等等。
受制于测试规模等因素、本次测试仅做参考,不代表用户最终使用的效果。测试中所使用图片来源于互联网,如有侵权请联系作者删除。
测试结果















结论GPT-4o擅长的点:创意类工作。如:
- 物品设定
- 色指定
- 概念美术
- 场景美术变体
- 风格融合
比较适合在创作初期提供“灵感”,在没有明确想要的答案的时候给创作者一个提示。
GPT-4o不擅长的点:需要很强一致性的工作。比如
- 人设
- 服装
- 表情集
等图的生成、GPT-4o保持不了很高的一致性。
此外,GPT-4o还有三个特点:
- 生成图片的风格过于单一,有种廉价的“AI感”。
- 生成的背景偏向于概念美术,不适合直接当作成片背景
- 专业的效果、比如透视、形变和黑白特效这些、部分能够做到。
总结:在本次动画任务测试中、GPT-4o的图片生成效果并未显著优于SD、MJ等现有模型。
擅长创意类而弱于一致性的特点也和其他的图片生成模型产品差不多,并没有改变整个生态。可能主要的好处还是和GPT的结合,增加的产品生态的闭环,对于用户来说也更方便使用。