Abstract not available.
大型语言模型(LLMs)在医药等受监管领域的内容创作中应用日益广泛,其输出必须确保科学准确且符合法规要求。人工质量控制(QC)过程缓慢、易出错,可能成为内容发布的瓶颈。本文提出LRBTC,一种模块化的LLM与视觉语言模型(VLM)驱动的QC架构,涵盖语言、法规、品牌、技术和内容结构五大检查维度。LRBTC结合了师生双模型架构、人机协同(HITL)工作流以及瀑布式规则过滤,实现了可扩展、可验证的内容审核与优化。在AIReg-Bench基准测试中,该方法取得了83.0%的F1分数和97.5%的召回率,相比Gemini 2.5 Pro将违规漏检率降低了5倍;在CSpelling测试中,平均准确率提升了26.7%。错误分析进一步表明,当前模型虽能有效检测拼写错误(召回率92.5%),但在识别复杂医学语法错误(召回率25.0%)和标点错误(召回率41.7%)方面表现不足,这指明了未来研究的关键方向。本研究为高风险、强合规行业的内容质量控制提供了一种即插即用、可靠透明的实用解决方案。我们同时依据MIT许可证开放了演示系统访问权限。