面向期刊编辑的医学论文智能审核平台构建与效能评估——基于大语言模型氛围编程模式的实践探索

doi:10.11946/cjstp.202602180265

摘要/Abstract

摘要：

目的构建面向学术质量控制的智能审校辅助平台，探索大语言模型（large language model，LLM）的氛围编程（vibe coding）模式在医学科技期刊编辑中的应用可行性。方法采用氛围编程模式，由不具备专业编程背景的编辑人员以自然语言提示驱动AI代码生成，结合Coze扣子编程平台与Doubao Seed 1.8大模型，开发了涵盖文字、术语、逻辑、统计分析、数据及参考文献6大维度的医学论文多维度审核平台及参考文献真实性核查工具RefCheck Pro。以10篇医学论文为样本，平行对比专业人工审校与AI审核在覆盖广度、问题类型及互补性方面的表现。结果在文字、术语、逻辑、统计分析及数据维度，人工审校共1151条分类标注（1235条独立批注），AI审核生成583条独立批注。双方均准确识别拼写、标点等常见问题（共197项）；人工审校在语言表达细节（如口语化、图表题名不匹配）上优势明显，AI在统计分析、公式符号缺失、单位换算遗漏等技术细节上表现更优。在参考文献维度，对10篇样本论文的404篇参考文献进行审核发现，“LLM格式审核+RefCheck Pro真实性核验”模式审核与人工审校结果高度一致。在审校论文的时效性方面，人工审校每篇耗时约2个工作日，AI审核仅需3~4 min。结论氛围编程模式可显著降低非技术背景编辑人员构建AI工具的门槛，实现从“概念”到“可用系统”的快速迭代，或为科技期刊编辑智能化工具的开发提供可参考的实践路径。同时，人机协同审稿在效能上优于单一方式，“AI初筛-人工精审”的双层质量控制体系在统计规范性审查和参考文献真伪辨识方面价值尤为突出。

关键词: 氛围编程, 大语言模型, 质量控制, 智能审校, 人机协同

Abstract:

Purposes To develop an intelligent proofreading assistance platform for academic quality control and to explore the feasibility of applying large language model （LLM） vibe coding mode in the editorial workflow of medical scientific journals. Methods Using the vibe coding mode， editors without professional programming background drove AI code generation through natural language prompts. A multidimensional review platform for medical manuscripts，overing text， terminology， logic， statistical analysis， data， and references，was developed alongside RefCheck Pro， a tool for verifying reference authenticity， by integrating the Coze programming platform and Doubao Seed 1.8 LLM. A total of 10 medical manuscripts was used as test samples to compare professional editors’ manual review and AI review in terms of coverage breadth， types of issues detected， and complementarity. Findings In the dimensions of text， terminology， logic， statistical analysis， and data， manual review yielded 1151 categorized annotations （1235 independent comments）， while AI review produced 583 independent comments. Both approaches accurately identified common issues such as spelling errors and punctuation standardization （a total of 197 items）. Manual review demonstrated significant advantages in detecting subtle linguistic issues （e.g.， colloquial expressions， mismatched chart and figure titles）. AI review performed excellently in statistical analysis and independently identified technical details easily overlooked by humans， such as missing formula symbols and omitted unit conversion labels. In the reference dimension， the review of 404 references in 10 sample papers showed that the combined “LLM-based formatting check+RefCheck Pro authenticity verification” approach demonstrated high concordance with manual review. In terms of the timeliness of paper review， manual review took about 2 working days per paper， while AI review only took 3~4 minutes. Conclusions The vibe coding mode markedly lowers the technical barrier for editorial staff to construct professional AI tools， enabling rapid iteration from concept design to deployable system， and can provide practical reference for the development of intelligent tools for sci-tech journal editing. Meanwhile， human-AI collaborative reviewing demonstrates superior efficiency compared to either approach alone， and the two-layer quality control system of “AI preliminary screening-manual detailed review” is particularly valuable in statistical standardization review and reference authenticity identification.

Key words: Vibe coding, Large language model, Quality control, Intelligent proofreading, Human-machine collaboration

邢宇洋. 面向期刊编辑的医学论文智能审核平台构建与效能评估——基于大语言模型氛围编程模式的实践探索[J]. 中国科技期刊研究, 2026, 37(3): 393-403.

XING Yuyang. Construction and effectiveness evaluation of an intelligent review platform for medical papers oriented to journal editors： a practical exploration based on the vibe coding mode of large language models[J]. Chinese Journal of Scientific and Technical Periodicals, 2026, 37(3): 393-403.

　　　　 https://www.cjstp.cn/CN/Y2026/V37/I3/393

图/表 6

参考文献 15

[1]	Gomes W J， Evora P R B， Guizilini S. Artificial intelligence is irreversibly bound to academic publishing： ChatGPT is cleared for scientific writing and peer review［J］. Brazilian Journal of Cardiovascular Surgery， 2023， 38（4）： e20230963.
[2]	Farber S. Enhancing peer review efficiency： a mixed-methods analysis of artificial intelligence-assisted reviewer selection across academic disciplines［J］. Learned Publishing， 2024， 37（4）： e1638.
[3]	Kousha K， Thelwall M. Artificial intelligence to support publishing and peer review： a summary and review［J］. Learned Publishing， 2024， 37（1）： 4-12.
[4]	Bin Siddique M K， Rahim S A， Rahman M M， et al. Artificial intelligence in journal editing： expanding horizons for scholarly publications： a mixed method study［J］.Health Sciences Quarterly，2025， 5（2）： 109-119.
[5]	Scholarcy： knowledge made simple［EB/OL］. ［2026-03-20］. https://www.scholarcy.com/. URL
[6]	PerfectIt： proofreading software for professionals［EB/OL］.［2026-03-20］. https://www.perfectit.com/. URL
[7]	StatCheck［EB/OL］. ［2026-03-20］. https://statcheck.io/. URL
[8]	Scrivener： writing tools for novelists， screenwriters， and more［EB/OL］. ［2026-03-20］. https://www.literatureandlatte.com/. URL
[9]	仲舒颖，王群英，何书金，等. 智能审校系统在中文科技期刊应用中的有效性分析：以中国知网智能审校系统为例［J］. 中国科技期刊研究， 2025， 36（11）： 1464-1469.
	Zhong S Y， Wang Q Y， He S J， et al. Application effect of intelligent proofreading system in Chinese scientific journals： take the CNKI Intelligent Proofreading System as an example［J］. Chinese Journal of Scientific and Technical Periodicals， 2025， 36（11）： 1464-1469.
[10]	艾莉莎，孙宇彤，靳海灵，等. 科技期刊数智化平台建设创新方案及实测效果探析：以《北京邮电大学学报》为例［J］. 中国科技期刊研究， 2025， 36（10）： 1327-1345.
	Ai L S， Sun Y T， Jin H L， et al. Analysis of innovative solutions and empirical results in building digital intelligence platforms for scientific journals： taking Journal of Beijing University of Posts and Telecommunications as an example［J］. Chinese Journal of Scientific and Technical Periodicals， 2025， 36（10）： 1327-1345.
[11]	Lee J， Lee J， Yoo J J. The role of large language models in the peer-review process： opportunities and challenges for medical journal reviewers and editors［J］. Journal of Educational Evaluation for Health Professions， 2025， 22： 4.
[12]	Karpathy A. Vibe coding： a new form of programming［EB/OL］. （2025-02-02）［2026-02-01］. https://x.com/karpathy/status/1886192184808149173. URL
[13]	OpenAlex： the open catalog to the global research system［EB/OL］. ［2026-02-03］. https://openalex.org/. URL
[14]	Crossref： the official DOI registration agency for scholarly content［EB/OL］. ［2026-02-03］. https://www.crossref.org/. URL
[15]	刘德佳，夏义杰，黄渝鹏，等. 面向期刊编校的智能体开发与应用：以“已读（Déjà Lu）”为例［J］. 中国科技期刊研究， 2025， 36（11）： 1454-1463.
	Liu D J， Xia Y J， Huang Y P， et al. Development and application of an agent for journal copyediting and proofreading： taking “Déjà Lu” as an example［J］. Chinese Journal of Scientific and Technical Periodicals， 2025， 36（11）： 1454-1463.

模块	核心设计要点	示例提示词核心片段
文字审核	拼写、标点、语法、格式规范	你是一位专业的中文医学期刊文字审核专家。你的任务是审核医学论文的文字表达质量审核要点包括： 1）拼写错误和错别字 2）标点符号使用规范 3）语法结构和句子通顺度 4）文字表达的准确性和专业性 5）段落结构和逻辑连贯性 6）格式规范（如数字、单位、缩写等）
术语审核	专业术语准确性、一致性、标准化	你是一位专业的中文医学期刊术语审核专家。你的任务是审核医学论文中的术语使用是否规范和准确审核要点包括： 1）医学术语的准确性和规范性 2）术语使用的正确性和一致性 3）专业名词的标准化表达 4）缩略语和符号的规范使用 5）疾病名称、药物名称、治疗方法的准确性 6）解剖学、病理学术语的标准用法 7）计量单位和数字表达的规范性
逻辑审核	结构合理性、论证严密性、前后一致性	你是一位专业的中文医学期刊逻辑审核专家。你的任务是审核医学论文的逻辑结构和论证过程审核要点包括： 1）文章整体结构的合理性和连贯性 2）研究目的、方法、结果、结论的逻辑关系 3）论证过程的严密性和科学性 4）理论推导和实验数据的一致性 5）假设与结论的逻辑对应关系 6）数据分析和解释的逻辑性 7）讨论部分的逻辑展开 8）前言、正文、结论之间的逻辑衔接
统计分析审核	统计方法选择、P值解读、图表规范性	你是一位专业的中文医学期刊统计分析审核专家。你的任务是审核医学论文中的统计方法和数据分析审核要点包括： 1）统计方法选择是否恰当 2）样本量是否足够，样本代表性如何 3）统计假设检验的正确性 4）P值、置信区间等统计指标的解读 5）统计图表的规范性和准确性 6）多变量分析和调整因素的合理性 7）统计结果的解释是否准确 8）是否符合医学统计学规范 9）统计方法的描述是否清晰完整
数据审核	真实性、准确性、完整性、伦理合规	你是一位专业的中文医学期刊数据审核专家。你的任务是审核医学论文中数据的真实性、准确性和完整性审核要点包括： 1）数据的真实性和可靠性 2）数据的准确性和一致性 3）数据的完整性和合理性 4）实验数据的记录规范 5）数据表格的规范性（标题、单位、标注等） 6）图表数据的准确性 7）数据与结论的对应关系 8）数据来源和采集方法的描述 9）数据是否有异常值或不合理之处 10）数据是否符合伦理规范和隐私保护要求
参考文献审核	引用格式、真实性、时效性、权威性	你是一位专业的中文医学期刊参考文献审核专家。你的任务是审核医学论文中参考文献的真实性、准确性和规范性审核要点包括： 1）引用格式的规范性 2）参考文献的完整性和准确性 3）引用文献的真实性和可查证性 4）引用文献的时效性和相关性 5）引用文献的权威性和可信度 6）文献引用的合理性（是否存在过度引用或引用不当） 7）期刊名称、卷期、页码、DOI 等信息的准确性 8）引用文献与正文的对应关系 9）是否存在引用不存在或错误的文献 10）文献是否来自权威医学期刊或数据库

模块	核心设计要点	示例提示词核心片段
文字审核	拼写、标点、语法、格式规范	你是一位专业的中文医学期刊文字审核专家。你的任务是审核医学论文的文字表达质量审核要点包括： 1）拼写错误和错别字 2）标点符号使用规范 3）语法结构和句子通顺度 4）文字表达的准确性和专业性 5）段落结构和逻辑连贯性 6）格式规范（如数字、单位、缩写等）
术语审核	专业术语准确性、一致性、标准化	你是一位专业的中文医学期刊术语审核专家。你的任务是审核医学论文中的术语使用是否规范和准确审核要点包括： 1）医学术语的准确性和规范性 2）术语使用的正确性和一致性 3）专业名词的标准化表达 4）缩略语和符号的规范使用 5）疾病名称、药物名称、治疗方法的准确性 6）解剖学、病理学术语的标准用法 7）计量单位和数字表达的规范性
逻辑审核	结构合理性、论证严密性、前后一致性	你是一位专业的中文医学期刊逻辑审核专家。你的任务是审核医学论文的逻辑结构和论证过程审核要点包括： 1）文章整体结构的合理性和连贯性 2）研究目的、方法、结果、结论的逻辑关系 3）论证过程的严密性和科学性 4）理论推导和实验数据的一致性 5）假设与结论的逻辑对应关系 6）数据分析和解释的逻辑性 7）讨论部分的逻辑展开 8）前言、正文、结论之间的逻辑衔接
统计分析审核	统计方法选择、P值解读、图表规范性	你是一位专业的中文医学期刊统计分析审核专家。你的任务是审核医学论文中的统计方法和数据分析审核要点包括： 1）统计方法选择是否恰当 2）样本量是否足够，样本代表性如何 3）统计假设检验的正确性 4）P值、置信区间等统计指标的解读 5）统计图表的规范性和准确性 6）多变量分析和调整因素的合理性 7）统计结果的解释是否准确 8）是否符合医学统计学规范 9）统计方法的描述是否清晰完整
数据审核	真实性、准确性、完整性、伦理合规	你是一位专业的中文医学期刊数据审核专家。你的任务是审核医学论文中数据的真实性、准确性和完整性审核要点包括： 1）数据的真实性和可靠性 2）数据的准确性和一致性 3）数据的完整性和合理性 4）实验数据的记录规范 5）数据表格的规范性（标题、单位、标注等） 6）图表数据的准确性 7）数据与结论的对应关系 8）数据来源和采集方法的描述 9）数据是否有异常值或不合理之处 10）数据是否符合伦理规范和隐私保护要求
参考文献审核	引用格式、真实性、时效性、权威性	你是一位专业的中文医学期刊参考文献审核专家。你的任务是审核医学论文中参考文献的真实性、准确性和规范性审核要点包括： 1）引用格式的规范性 2）参考文献的完整性和准确性 3）引用文献的真实性和可查证性 4）引用文献的时效性和相关性 5）引用文献的权威性和可信度 6）文献引用的合理性（是否存在过度引用或引用不当） 7）期刊名称、卷期、页码、DOI 等信息的准确性 8）引用文献与正文的对应关系 9）是否存在引用不存在或错误的文献 10）文献是否来自权威医学期刊或数据库

审核模块	人工审校标注/条	AI审核条目/条	高度重合/条	仅人工发现/条	仅AI发现/条
合计	1151	583	197	1001	386
文字审核	553	114	46	490	68
逻辑审核	323	169	53	278	116
数据审核	149	137	42	128	95
术语审核	107	69	35	90	34
统计分析审核	19	94	21	15	73

审核模块	人工审校标注/条	AI审核条目/条	高度重合/条	仅人工发现/条	仅AI发现/条
合计	1151	583	197	1001	386
文字审核	553	114	46	490	68
逻辑审核	323	169	53	278	116
数据审核	149	137	42	128	95
术语审核	107	69	35	90	34
统计分析审核	19	94	21	15	73

选择文件类型/文献管理软件名称

选择包含的内容