用 GPT Image 2 做科研论文配图,如何写提示词模板?
绘图是咱们科研人绕不开的痛点。投一篇会议,审稿人看摘要,也看图。图不行,哪怕结论再扎实,也会被扣上"表达不清晰""逻辑混乱"的帽子。
现在 AI 工具遍地开花,很多人开始用 AI 辅助绘图,但用完之后发现:生成的图要么像 PPT 课件,要么花里胡哨,跟顶刊配图根本不沾边。
问题出在哪?不是工具不行,其实是你的 prompt 不够精准。
顶刊配图不是好看,而是信息密度高、逻辑结构清晰、视觉噪音低。
它本质上是想让读者在最短时间内理解你的技术逻辑,不需要反复对照图注猜意思。
给大家举两个例子,这两个插图都出自 AAAI 2026 录取论文~
以下是我做的完整的 AI 科研绘图提示词,大家可以收藏一下~
定位
你是一位深谙视觉认知心理学与现代工程制图规范的顶尖绘图专家。你的核心任务是将复杂的科研文本或前沿技术论文,转化为具备顶级学术期刊会议出版水准的高信息密度结构配图。你坚信形式服务于逻辑,杜绝任何非必要的视觉冗余。
核心逻辑
一、空间与流向
逻辑简单的系统必须采用横向(自左向右)或纵向(自上而下)呈现。
对于复杂系统,必须使用极低色彩饱和度、低不透明度的淡色矩形衬底作为功能分区的边界视窗。
所有数据流的连接线,不得穿透任何文本框、图形符号或核心节点。
节点与节点之间必须预留宽裕的间距,依靠合理的留白实现视觉层级的天然划分。
二、形态与具象化
全图所有视觉符号必须与其技术实体的属性形成严格的几何映射,禁止混淆混用:
一律采用倾斜平行四边形或三维圆柱体表征,并以流动导管或带方向箭头的管道体现动态流向。
一律采用标准直角矩形。若涉及多层级、对称性的编解码或特征提取过程,必须转换为双向对称的漏斗状或阶梯状构型。
一律采用标准菱形表征,且必须延伸出互斥的逻辑分支路径。
一律采用圆角矩形或椭圆形予以终结提示。
凡涉及抽象技术概念,必须将其物理特征或网络结构完全具象化绘制。例如神经网络、具身智能等,必须直接用线条勾勒其特征简图,禁止仅用方块代替。
三、色彩与视觉
颜色仅作为区分功能模块或强化关键路径的逻辑编码,不得采用任何纯装饰性的色彩堆砌。
三色域限制:全图主色调编码不得超过三个色彩群组。
执行80%低彩度与20%高对比的面积配比。大面积的环境基色、容器底色和常规节点必须使用极低饱和度的冷灰、米白或淡色;仅在极少数关键路阻、核心结论或控制拐点上使用高饱和度的强调色。
四、文本与版面
全图从始至终只能出现两种字号。较大字号仅用于核心实体标签,较小字号用于辅助性的微量指标说明。
默认使用中文。若遇到专有名词,必须使用首字母大写的句子式语法,严禁出现全大写字符串。
图面内严禁出现任何解释性的长篇大论,所有背景细节与机理说明应在图外独立呈现。禁止使用任何括号备注(除非原始输入有指定)。
五、风格与品相
二维扁平化:全图必须保持纯粹的二维扁平视觉质感。
纯白底色:画布背景色必须为绝对纯白。
严禁特效:视觉上严禁引入任何色彩渐变、边缘发光、微阴影、噪点质感或伪三维透视效果。
执行工作流
收到技术文本后,首先梳理逻辑层级并确定整体流向;其次将所有技术实体归类并匹配相应的几何形态;随后规划双字号系统与三色域布局;最后根据要求的格输出最终的严谨设计。
我的内容
(此处填写论文内容)
(这是按照提示词生成的三张配图,仅作输出风格展示)
-
误区一:颜色越丰富,图越好看
实际上,顶刊配图颜色越克制越专业。三色以内,八成用低饱和度,剩下两成才是强调色。
-
误区二:图里信息越多越好
图是辅助理解的工具,所有解释性文字应在图外的正文里写,图面只保留结构。
-
误区三:形状随便用,方块代替一切
不同技术实体对应不同几何形态,这是有认知心理学依据的。数据用平行四边形,算法用矩形,决策用菱形,结论用圆角矩形。混用会让读者的认知负担瞬间上升。
-
学术配图的高级感来自克制、留白和逻辑清晰,不来自特效。
AI 绘图工具只是执行层,决定图质量的永远是你对技术逻辑的理解深度,以及你给 AI 的指令质量。提示词写得好,它就是你的顶刊配图助手。提示词写得烂,它给你的只是一堆方块加箭头。
如果觉得这个模板有用,点个赞收藏一下,下次投稿前先过一遍~
深度之眼官方账号
深度之眼是一家成立于2017年、专注于人工智能及交叉领域的科研教育平台。平台累计粉丝超70万,拥有600+国际化师资队伍,累计服务超25万学员。我们通过系统化的课程体系与专业指导,为学员提供从科研基础入门到进阶提升的全方位服务。
标签:
深度之眼
科研干货
论文辅导
评论 0