Are Two LLMs Better Than One? A Student-Teacher Dual-Head LLMs Architecture for Pharmaceutical Content Optimization<br>双LLM是否优于单一模型？一种用于医药内容优化的师生双头LLM架构<br>[摘要](abstracts/2602.11957.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

大型语言模型（LLMs）在医药等受监管领域的内容创作中应用日益广泛，其输出必须确保科学准确且符合法规要求。人工质量控制（QC）过程缓慢、易出错，可能成为内容发布的瓶颈。本文提出LRBTC，一种模块化的LLM与视觉语言模型（VLM）驱动的QC架构，涵盖语言、法规、品牌、技术和内容结构五大检查维度。LRBTC结合了师生双模型架构、人机协同（HITL）工作流以及瀑布式规则过滤，实现了可扩展、可验证的内容审核与优化。在AIReg-Bench基准测试中，该方法取得了83.0%的F1分数和97.5%的召回率，相比Gemini 2.5 Pro将违规漏检率降低了5倍；在CSpelling测试中，平均准确率提升了26.7%。错误分析进一步表明，当前模型虽能有效检测拼写错误（召回率92.5%），但在识别复杂医学语法错误（召回率25.0%）和标点错误（召回率41.7%）方面表现不足，这指明了未来研究的关键方向。本研究为高风险、强合规行业的内容质量控制提供了一种即插即用、可靠透明的实用解决方案。我们同时依据MIT许可证开放了演示系统访问权限。

← Back