智能制造技术是中药产业数字化转型升级所必需的关键技术。中药企业已在实时数据库建设、信息系统开发、工业数据分析与建模等方面取得较大进展。针对人、机、料、法、环等制造要素的结构化数据,进行了有效的采集、分析与管控,成功应用于药材质量追溯、生产工艺优化、过程质量控制、生产管理、仓储物流管理等各业务活动。
对中药工业数据利用现状进行分析,在全产业链各环节、全生命周期各阶段、制造全过程之中,仍存在着大量非结构化的数据和信息,依赖于人工进行收集、记录、分析与决策。例如,在产业链的 药材鉴别环节,通过目视、嗅闻等方法对药材品质进行判断;在生命周期的药品研发阶段,通过查询 典籍、文献进行制药工艺的开发;在制造过程中,采用目视的方法对流化床制粒工序的流化状态进行 观察评估。以上实例均说明,非结构化数据是中药工业重要的数据资源,具有巨大的挖掘空间和利用价值。
随着人工智能技术与算力的提升,生成式人工智能(artificial intelligence ,AI)模型的体量与处 理能力均有了质的飞跃。模型结构的优化使参数规模不断扩增,模型所能处理的数据类型也逐渐由单模态的文本数据转向文本、语言、图像等多模态/跨模态数据。如,OpenAI发布的 GPT-4与 DALL- E;Stability AI 发布的 Stable Diffusion;百度发布的文心一言;商汤科技发布的日日新;科大讯飞发布的星火大模型等。依据OpenAI公开的应用案例可知,GPT-4 已在商业知识管理、智能对话机器 人、个性营销等方面进行了诸多探索。生成式 AI 对于非结构化数据的知识萃取、语义检索、 内容 生成能力,有望为中药工业非结构化数据资源的利用提供一套可行的工具。
本研究首先分析了中药工业的智能制造现状及生成式 AI 在工业领域的发展潜力;接着,聚焦于 中药制造和供应链环节, 明确了生成式 AI 的 4 个潜在应用场景,阐述了场景的数据采集与处理、业 务流程设计、应用潜力与价值;最后,本研究尝试提出基于生成式 AI 与中药工业模型融合的中药智 慧工业大脑框架, 旨在为未来 AI 大模型在中药智能制造领域的应用提供参考。
1 中药工业智能制造现状分析
在当前时代背景下,消费者对于中药产品的需求正趋于个性化、透明化、精准化。为应对市场变化, 中药企业亟需进行全产业链的智能化转型升级, 以利用数字化技术提高自身精准研发、高质生产、高效供应、个性服务的能力。《健康中国 2030》、《“十四五”中医药发展规划》等医药产业 发展战略均指出,要加快中药制造业数字化、智能化建设,提升中药产业发展水平。
笔者所在研究团队长期在中药企业从事智能制造关键技术研究与产业应用工作,基于多年来在 多个中药智能工厂建设中积累的经验, 以及对中药行业智能制造发展现状的深入了解, 中药企业现已 在实时数据库、信息系统、过程建模等方面取得较大进展。企业针对人、机、料、法、环等制造要素 的结构化数据进行了采集、分析与监控,成功应用于药材质量追溯、生产工艺优化、过程质量控制、 生产管理、仓储物流管理等各业务活动。
1.1 信息系统应用于中药工业数据采集与企业管理
中药工业采用批次型流程式生产、单元式操作的生产模式, 自动化、信息化基础建设较为薄弱, 长期以来面临数据孤岛问题,导致数据资源难以有效利用。因此, 中药企业近年来聚焦于“人机料法 环测 ”等关键要素 ,加强建设实 时/ 关系数据库, 开发 以数据采集与监视控制系统( Supervisory Control And Data Acquisition ,SCADA)、制造执行系统(Manufacturing Execution System ,MES)、 企业资源计划系统(Enterprise Resource Planning ,ERP)为代表的信息系统, 以提高数据资源的利用效率。
底层信息系统如分散控制系统(Distributed Control System ,DCS)、 实时数据库、SCADA系 统等,用于工业数据的实时采集、存储和批处理。上层信息系统如药材质量追溯系统、MES系 统、实验室信息管理系统(Laboratory Information Management System ,LIMS)、仓储管理系统(Warehouse Management System ,WMS)、ERP系统等,覆盖中药全产业链范围,支持药材资源管 理、生产过程监控、仓储物流管理、供应商管理。借助信息系统, 中药企业能够打通产业链各环节间 的数据断点,减少人工作业,加强业务协同能力,提升业务效率。
1.2 工业数据模型应用于中药生产过程质量控制
中药药效作用是由多种成分协同产生的,质量控制目标包括主要药效成分、同类药效成分、分析 标记物等多类指标。中药制造过程是典型的多输入、多输出、多目标协同优化控制的过程,会受到物料、工艺、设备等多种因素的影响,需要研究关键参数以及参数间交互作用对产品质量的影响。
为攻克过程控制复杂性问题,企业将生产过程积累的经验知识与机制建模技术、数据驱动建模技 术相结合, 围绕着物料属性、工艺参数、设备参数等关键参数,进行了数据建模研究。所建工业模 型主要应用于生产过程质量控制的4个方面: 物料属性控制、过程实时监控、终点控 制、前馈控制。中药企业通常会在实际生产中利用不断积累的工业数据,对模型进行持续优 化与更新,推动生产质量管理的持续改进。
1.3 中药工业非结构化数据利用情况
以信息系统为主体的数据资源管理模式,使现有工业模型以单模态模型为主, 围绕着可被采集到 结构化数据进行模型开发,对于非结构化数据尤其是多模态、跨模态数据的处理能力较为有限。中药 制造过程与供应链仍有大量非结构化数据, 目前尚缺乏有效手段将其纳入生产管控中。中药制造过程 与供应链各环节中存在的非结构化数据见表 1 、2。这些非结构化数据以图像、文本、视频、音频等 多种形式存在,经由各类专业职能人员分析并总结,分散于工艺验证报告、偏差调查报告、质量回顾 报告等各职能部门的资料中,也通过口头传授的方式在师徒关系中传承。
对非结构化数据的处理技术,当前业内已有一些探索性研究,但还未得到广泛使用。例如,针对 制造过程物料要素,杜瑞超等使用电子舌检测器,获取中药水煎液滋味信息来模拟味觉;针对供应 链药材质量管理环节,曹煌等使用电子鼻检测器,获取辛味药材饮片气味信息来模拟嗅觉;针对制 造过程人员和工艺要素,缪培琪等提出可使用工业相机捕捉图像/视频数据,结合图像识别算法来识 别生产过程状态与人员操作行为;针对制造过程工艺要素,薛启隆等使用层次分析法构建中药制药 工艺知识库量化人工经验。从上述文献可以看出,目前对非结构化数据的处理方法通常是,先通过 分割、标注、转换等处理,将非结构化数据转化成结构化数据,用于建立单模态数据模型,或利用数 据融合算法对多模态数据进行分析与建模。这种处理方法的局限性在于,数据加工和融合过程不仅需 要大量的人工投入,且在一定程度上会受到数据处理人员主观判断的影响。
表1 中药制造过程非结构化数据概述
表2 中药供应链非结构化数据概述
2 生成式 AI 在工业领域的应用能力分析
2022 年 11 月,作为生成式 AI 代表的 ChatGPT 一经发布,因其强大的内容生成能力,在全球领 域受到广泛的关注与追捧。我国于 2023 年 7 月 13 日颁布《生成式人工智能服务管理暂行办法》中, 将生成式 AI 技术定义为具有文本、图片、音频、视频等内容生成能力的模型及相关技术。生成式 AI 通常基于深度神经网络算法,通过学习训练样本中的概率分布与逻辑规律用于建模,并利用模型 生成新内容 。Transformer 架构作为大部分生成式 AI 模型中的核心架构,早期用于自然语言处理领 域,以解决模型处理长文本时的信息丢失问题。由于该架构出色的多数据并行处理优势,大幅提升 了模型的计算效率,故其逐渐在语言、图像、音频等数据分析领域得到推广应用。
依据 OpenAI 、百度等全球知名 AI 公司已发布的生成式 AI 产品介绍可知,生成式 AI 的多模态、 跨模态数据处理能力正在快速提升, 已在多个制造行业发挥重要作用。OpenAI 公司的 GPT 可在报告 撰写、垂直领域文档搜索、法规条款及文献信息提取、会议纪要总结、智能终端及有温度机器人、代 码转换与 SQL 代码生成等方面发挥作用。百度公司的文心一言已为多个制造行业如航天、汽车、 燃气化工、电子制造等提供大模型服务,深入参与到专业文献检索、制造信息提取、安全巡检与预 警、领域知识库搭建等多项工作中。科大讯飞公司借助星火大模型核心技术开发面向工业领域的羚 羊大模型,其具有文本生成、知识问答、工业理解计算、工业代码生成、工业多模态数据处理 5 大核 心能力,并已为钢铁、机床、电子制造等行业提供聚焦业务场景的解决方案。
综上可知,针对工业领域普遍存在的非结构化数据,生成式 AI 能够充当多学科交叉专家、生产 高级管理人员、供应链高级管理人员等角色,参与到制造及供应链管理活动中。
3 基于生成式 AI 的中药智慧制药场景设计
工信部发布《智能制造发展规划(2016—2020 年)》,将智能制造的核心特征总结为五个
“自”: 自感知、自学习、自决策、自执行、自适应。对于非结构化数据收集和处理依赖于人工的中 药生产现状,显然与五个“自”的目标存在着差距。
通过上文分析,聚焦于中药制造各要素、供应链各环节产生的非结构化数据分析需求,借助生成 式 AI 的多模态/跨模态数据处理与生成能力,生成式 AI 有望在制药知识库、生产质控、供应链管理 等核心业务中,逐步减少或替代人工活动,加速实现智能制造最终目标。
下文详细阐述生成式 AI 典 型应用场景的业务流程设计、应用潜力与价值。
3.1 生成式 AI 应用场景一: 中药智慧制药知识库/知识图谱
知识库是针对某一特定领域/问题, 将互相关联的知识片集合以某种知识表达方式在计算机中进 行存储、管理与调用的一种计算机系统。知识片包括领域相关的理论知识、结构化数据、由专家经 验得来的启发式知识以及行业内公认的常识性知识等。
对当前已发布的中医药知识库及大模型进行调研, 中医药大模型主要类型有基于中医药典籍文献与中医专家医案的临床诊疗大模型如岐黄问道 · 大模型、仲景中医大语言模型,基于中药方 剂、成分、靶点信息的知识问答大模型如数智岐黄、华佗 GPT,暂未查询到针对制药过程的知 识库及大模型;查询西门子、霍尼韦尔等知名工业数据库公司官网信息,针对流程行业的解决方案 中,未发现面向中药工业生产的知识库,如中药物性数据知识库、中药工艺机制模型知识库等。因 此,在中药工业领域有必要综合化学成分、物料属性、工艺机制、设备性能、环境监测等制药过程数 据,建立针对中药制药的知识库。
基于生成式 AI 的中药智慧制药知识库与知识图谱场景示例见图 1。搭建中药制药知识库首先需 要解决知识收集的问题。中药制药知识来源较为分散,既有来自企业私域的专家经验与结构化数据, 如生产要素知识、过程管控知识等,也有来自公域的理论知识与研究资料,如法规知识、多学科交叉 知识、文献资料等。知识的存在形式亦复杂多样,在每个制造要素、每个供应商环节之中均存在多种 类型的数据,见表 1。
生成式 AI 可以提供数据管理与知识萃取工具,对内部私域数据进行汇总、整理与挖掘,对外部公域数据进行收集、提取与分析,将中药制药知识进行统一解构、编码、存储、管理,形成制药知识库。
在知识库的基础上,进一步可实现知识片间的交互关系映射与定量化赋值,形成中药智慧制药知 识图谱,见图 1。面向研发、质量、设备、技术、生产等各职能岗位,该知识图谱可帮助设计并生成 实验方案、质量回顾报告、工艺验证报告、偏差调查报告等多项内容。
图1 基于生成式AI的中药智慧制药知识库与知识图谱场景示例
3.2 生成式 AI 应用场景二: 中药智慧上岗培训
人员作为制药过程中的关键生产要素,人员素质与行为规范程度将直接影响生产操作与控制水平。GMP 明确规定,需对从事药品生产的各级人员进行培训与考核[35]。因此,上岗培训也是生产质 量管理的重要内容。企业的生产管理体系文件由具备资质的员工进行起草与更新,并用于生成员工的 上岗培训资料。以生产部门为例,培训需包括人员管理类文件、设备操作类文件、物料管理类文件、 工艺方法类文件以及环境管理类文件,体系结构庞大,文件更新频次高。此外,培训通常采用讲课口 述与纸质考核相结合的方式进行,课件设计及讲授、考核设计、学员考评完全依赖于培训师人工完 成,导致管理者与培训人员工作任务繁重,人力成本极高。
基于生成式 AI 的中药智慧上岗培训场景示例见图 2,这种培训模式有望替代培训讲师的大部分 工作。在文件体系建设方面,可利用历史文件对生成式 AI 进行训练学习,并对各监管机构法规/指南/ 公告、国内/国际药典、其他制药企业收到的警告信等关键信息进行监控与检索, 以支持现有体系文 件的实时更新、国际法规的快速翻译、文件信息的问答式查询等。在人员培训方面,生成式 AI 模型 可生成智慧虚拟培训师,针对学员专业背景与特点,对培训文件中的关键知识点进行精准提炼,或与增强现实(augmented reality ,AR)技术相结合,在具有 3D 实感的培训场景中生成视频、语音、文 字等多类型课件。 同时,充分利用生成式 AI 的语言交互能力,与学员进行实时答疑解惑,并在培训 结束后对受训者进行线上考核评估,完成人员考核管理任务。
图2 基于生成式AI的中药智慧上岗培训场景示例
3.3 生成式 AI 应用场景三: 中药智慧生产质控
生产过程质量控制是保障药品质量稳定均一的重要手段。传统生产质控以事后控制为主,通常是 在异常情况发生之后,通过中间体检验结果、生产操作人员现场观察或 QA 经验方能发现异常,再结 合历史操作经验制定纠偏策略,纠偏措施存在滞后性,可能造成当批产品的不合格。这种质控模式无 法实现异常情况的事前预测,不同人员对于异常的响应速度存在差异,基于主观经验所制定的纠偏策 略亦存在差异, 纠偏效果无法有效反馈评价。 在引入信息系统、 建立数据监控模型后,MES、 SCADA 或DCS系统能够基于过程监控方法如单变量控制图、多变量统计过程控制( multivariate statistical process control ,MSPC)技术等实现生产异常的预警与报警,但对于纠偏策略的制定与实施 依旧依赖人工经验。
面对传统质控方式的不足,可将生成式 AI 、信息系统、操作人员三者优势相结合, 由信息系统 承担数据实时监控与分析任务,生成式 AI 承担信息收集、信息检索、人机交互任务,操作人员则负 责纠偏实施与效果反馈,形成三者协同的智慧生产质控模式,见图 3。
图3 基于生成式AI的中药智慧生产质控场景示例
首先,利用历史纠偏案例对生成 AI 进行预训练,生成纠偏知识。接下来, 由信息系统对生产过程进行参数监控与质量预测。当异 常即将发生时,系统提前预测发出预警并传递至 AI 模型中,模型基于历史纠偏案例提前制定最佳纠 偏策略,并交由操作人员进行纠偏操作。人员对纠偏效果进行语言描述反馈,信息系统对纠偏效果进 行数据反馈,形成新的纠偏案例用于 AI 模型的持续优化。智慧生产质控模式不仅可实现生产异常的 事前预测,还加强了质控流程的连续性,降低了生产专家主观判断对纠偏结果的影响。生成式 AI 还 能发挥“智慧教练 ”的作用,在操作人员经验不足的条件下,为其提供可靠有效的纠偏策略。
3.4 生成式 AI 应用场景四: 中药智慧供应链
供应商管理是药品质量保证体系的重要组成部分,采购物料、设备及仪器的质量、成本直接影响 药品质量、药品价格以及企业经济效益。为平衡企业效益与产品质量,企业在进行供应商筛选、调研 与管理时,需耗费大量的精力进行信息检索,检索内容不仅有资质、注册规模、业务能力等供应商信 息,还包括物料市场价格、可供应数量等市场信息, 以及物流距离、物流时间等物流信息。复杂的信 息检索与信息处理工作,使中药供应链管理效率较低,存在极大的优化空间。
生成式 AI 所具有强大的信息检索和知识萃取能力可帮助企业高效完成供应商的资质调研与评价 工作,见图 4。针对药材资源储备,可通过收集各地气候、土壤数据结合文献检索药材的生态主导因 子,实现药材适宜性的快速评价;结合药材市场价格与供应能力制定动态采购计划,保障药材原料的 稳定供应。针对辅料的供应管理,可通过收集不同厂家的产品质量信息进行辅料品质评估,再结合销 售价格、物流成本等数据完成供应商确认与动态管理。针对设备供应管理,结合制造需求对设备性 能、自动化水平、预测维护性功能进行设备适宜性评价,综合销售价格,选择最佳性价比的设备供应 商开展合作。
图4 基于生成式AI的中药智慧供应链场景示例
4 基于生成式 AI 与中药工业数据模型相融合的中药智慧工业大脑构想
当前成功应用于中药智能制造的工业数据模型,具备高维数时序数据实时处理能力和高精度数学 计算能力,能够实时处理多要素数据,模型准确性、鲁棒性等性能满足高精度质量控制要求, 以实现 生产状态的实时监控与反馈。本研究特此强调,生成式 AI 的应用不是要替代中药工业数据模型,而 是与中药工业数据模型各司其职、交互运行。
在生成式 AI 在上述 4 个场景以及更多场景的成功应用基础上,笔者尝试提出基于生成式 AI 与中 药工业数据模型相融合的中药智慧工业大脑构想,见图 5。在中药智慧工业大脑中,工业数据模型负 责生产数据的计算与交互,并与设备控制器相连,完成生产操作的反馈执行;生成式 AI 学习专家历 史经验, 拥有人脑高级智慧, 可胜任数字虚拟操作员、数字虚拟工程师、数字虚拟质量保证 员 (quality assurance ,QA)、数字虚拟质量控制员(quality control ,QC)等角色,能够自主调用并优化工业数据模型,参与生产操作、分析与决策,并可随着生产批次的积累实现制药智慧的自我迭代与持 续优化。
图5 中药智慧工业大脑初步设想
5 结语
当前智能制造技术在中药制造领域的应用,主要围绕着质量、效率、成本 3 个目标,针对单模态 的结构化数据开展信息系统建设与数学模型开发。生成式 AI 因其强大的多模态、跨模态数据处理与 生成能力,可在中药制造及供应链环节的内容生成、信息检索、知识萃取、人机交互等方面发挥重要 作用。本研究基于对中药智能制造及供应链的现状分析,归纳出 4 个生成式 AI 的典型可应用场景, 并阐述了应用思路和潜在应用价值。最后,本研究尝试提出生成式 AI 与中药工业模型融合的中药智 慧工业大脑框架。
生成式 AI 在中药工业的深入应用,依赖于中药制造领域与智能算法领域的共同努力,笔者认为 以下 2 个方面需要取得共识、加速推进。
①生成式 AI 的多模态数据实时处理与交互能力: 中药制药 过程需要同时监控物料、设备、工艺等多种参数,数据采集位点数量较多,且采集频率要求达到分钟 级甚至秒级,进一步引入视频、音频、图像、文字等多模态数据,数据规模剧增。若想将多模态数据 信息用于中药生产过程质控,则生成式 AI 需要提升大规模实时数据处理与交互能力。
②中药制造动 力学、热力学、化学反应等机制知识与模型基础研究:AI 大模型训练需要大量的专业领域知识与数 据集,当前中药行业内制药研究数据分散,可检索到的物料属性数据、工艺机制模型十分有限,需加 强中药制造机制研究与标准数据集构建。