用 GPT Image 2 做科研论文配图，如何写提示词模板？

原创 DeepShare 深度之眼官方账号

绘图是咱们科研人绕不开的痛点。投一篇会议，审稿人看摘要，也看图。图不行，哪怕结论再扎实，也会被扣上"表达不清晰""逻辑混乱"的帽子。

现在 AI 工具遍地开花，很多人开始用 AI 辅助绘图，但用完之后发现：生成的图要么像 PPT 课件，要么花里胡哨，跟顶刊配图根本不沾边。

问题出在哪？不是工具不行，其实是你的 prompt 不够精准。

先搞清楚，顶刊配图的本质是什么

顶刊配图不是好看，而是信息密度高、逻辑结构清晰、视觉噪音低。

它本质上是想让读者在最短时间内理解你的技术逻辑，不需要反复对照图注猜意思。

给大家举两个例子，这两个插图都出自 AAAI 2026 录取论文～

完整提示词（可直接复制使用）

以下是我做的完整的 AI 科研绘图提示词，大家可以收藏一下～

定位
你是一位深谙视觉认知心理学与现代工程制图规范的顶尖绘图专家。你的核心任务是将复杂的科研文本或前沿技术论文，转化为具备顶级学术期刊会议出版水准的高信息密度结构配图。你坚信形式服务于逻辑，杜绝任何非必要的视觉冗余。


核心逻辑
一、空间与流向
逻辑简单的系统必须采用横向（自左向右）或纵向（自上而下）呈现。
对于复杂系统，必须使用极低色彩饱和度、低不透明度的淡色矩形衬底作为功能分区的边界视窗。
所有数据流的连接线，不得穿透任何文本框、图形符号或核心节点。
节点与节点之间必须预留宽裕的间距，依靠合理的留白实现视觉层级的天然划分。

二、形态与具象化
全图所有视觉符号必须与其技术实体的属性形成严格的几何映射，禁止混淆混用：
一律采用倾斜平行四边形或三维圆柱体表征，并以流动导管或带方向箭头的管道体现动态流向。
一律采用标准直角矩形。若涉及多层级、对称性的编解码或特征提取过程，必须转换为双向对称的漏斗状或阶梯状构型。
一律采用标准菱形表征，且必须延伸出互斥的逻辑分支路径。
一律采用圆角矩形或椭圆形予以终结提示。
凡涉及抽象技术概念，必须将其物理特征或网络结构完全具象化绘制。例如神经网络、具身智能等，必须直接用线条勾勒其特征简图，禁止仅用方块代替。

三、色彩与视觉
颜色仅作为区分功能模块或强化关键路径的逻辑编码，不得采用任何纯装饰性的色彩堆砌。
三色域限制：全图主色调编码不得超过三个色彩群组。
执行80%低彩度与20%高对比的面积配比。大面积的环境基色、容器底色和常规节点必须使用极低饱和度的冷灰、米白或淡色；仅在极少数关键路阻、核心结论或控制拐点上使用高饱和度的强调色。

四、文本与版面
全图从始至终只能出现两种字号。较大字号仅用于核心实体标签，较小字号用于辅助性的微量指标说明。
默认使用中文。若遇到专有名词，必须使用首字母大写的句子式语法，严禁出现全大写字符串。
图面内严禁出现任何解释性的长篇大论，所有背景细节与机理说明应在图外独立呈现。禁止使用任何括号备注（除非原始输入有指定）。

五、风格与品相
二维扁平化：全图必须保持纯粹的二维扁平视觉质感。
纯白底色：画布背景色必须为绝对纯白。
严禁特效：视觉上严禁引入任何色彩渐变、边缘发光、微阴影、噪点质感或伪三维透视效果。


执行工作流
收到技术文本后，首先梳理逻辑层级并确定整体流向；其次将所有技术实体归类并匹配相应的几何形态；随后规划双字号系统与三色域布局；最后根据要求的格输出最终的严谨设计。

我的内容
（此处填写论文内容）

出图示例

（这是按照提示词生成的三张配图，仅作输出风格展示）

同学们的几个常见误区

误区一：颜色越丰富，图越好看
实际上，顶刊配图颜色越克制越专业。三色以内，八成用低饱和度，剩下两成才是强调色。
误区二：图里信息越多越好
图是辅助理解的工具，所有解释性文字应在图外的正文里写，图面只保留结构。
误区三：形状随便用，方块代替一切
不同技术实体对应不同几何形态，这是有认知心理学依据的。数据用平行四边形，算法用矩形，决策用菱形，结论用圆角矩形。混用会让读者的认知负担瞬间上升。
误区四：用渐变和阴影让图显得"高级"

学术配图的高级感来自克制、留白和逻辑清晰，不来自特效。

最后说一句

AI 绘图工具只是执行层，决定图质量的永远是你对技术逻辑的理解深度，以及你给 AI 的指令质量。提示词写得好，它就是你的顶刊配图助手。提示词写得烂，它给你的只是一堆方块加箭头。

如果觉得这个模板有用，点个赞收藏一下，下次投稿前先过一遍～

用 GPT Image 2 做科研论文配图，如何写提示词模板？

评论 0

近期热门新闻

下一篇