GPT准备替中医把脉了|亮马桥小纪严选
小纪有话说:
坐在你面前的,是“赛博中医”:它的眼睛是摄像头,像老中医一样,要“扫描”你的舌苔、面色;它也能号脉,感应器构成的号脉终端不到2分钟,便能“摸个门清”。很快,这位赛博中医对你“了然于胸”了,它迫不及待地给你手机发了一份专属健康报告:阳虚or阴虚、寒湿or湿热,怎么应对,怎么开方,报告上一目了然。
“看”到你挺感兴趣,这位赛博中医举起机械臂,想帮你立刻来一场赛博艾灸、赛博推拿。这是很多医院、体检中心悄然上线的AI中医机器人,被戏称为“赛博中医”。
“赛博中医”太受欢迎了,几乎任何场合都是“人气王”。即便明知道娱乐属性更强,长期亚健康的职场人也还是会乐此不疲,忍不住要在赛博中医的摊位前排长龙。这波“中医+科技”热潮,已经不满足于赛博中医了。热度,渗透到了中医药大模型领域,只不过这次排队的,换成了产业界“玩家”。
进入5月份以来,大洋彼岸的OpenAI的GPT-4o、谷歌的Gemini、Deepmind的AlphaFold 3等,都引起国内吃瓜群众一波又一波的狂欢,余韵之中,字节跳动、华为云、阿里云等也动作频繁。在光环之下,中医药大模型也没闲着。
5月初,华为云和天士力共同开发的“数智本草”大模型发布。在此前,在GPT推动的AI热潮中,早有扁鹊、华佗、神农、孙思邈、“数智岐黄”“岐黄问道”“本草智库”“天河·灵枢”……虎嗅根据公开信息统计,2023年以来至少已有三四十个中医药相关大模型相继亮相。
这些大模型都肩负着给产业发展摸脉、问诊、开药方的使命。在其背后,除了华为云、百度云、阿里云等科技公司,清华大学、中国中医科学院、天津大学等高校、科研院所,最重要的推动力量还要数云南白药、华润江中、太极集团、天士力医药等一众知名中药企业。
但一直以来,中医药都非常神秘,堪比“黑盒”,特别是中药,有“丸散膏丹,神仙难辨”之说,数据和理论研究都还远远不够。
AI能让中医“质变”吗?在中医药产业内部,越来越多专家学者已经达成共识,认为AI给中医药发展创造了一个“千载难逢的机遇期”。
“中医药与人工智能结合是必然发展趋势,不以人的意志为转移。”中国工程院院士、国医大师张伯礼在“数智赋能大健康产业新质生产力暨第四届中医药国际发展大会”上就曾这样直言。
中医药大模型到底能给“江湖水深”的中医,带来哪些关键变化?AI能让中医产业发生关键转向吗?
作者 | 陈广晶
来源 | 虎嗅APP
“重注”中医药大模型
中医药大模型有什么用?
按照现代中药创制全国重点实验室常务副主任、天士力医药集团董事长闫凯境博士所说,他们此次发布的“数智本草”大模型,关键内容是“说理”和“寻药”,从而打造“数智中药”研发新范式,赋能天然药物的发现和新方剂的生成,并带动中药全产业链的跨越性转型升级。
简单来说:把古往今来名家名医的医学理论、传统中医药知识,加上天士力累积的中医药研发、生产、市场等数据充分“投喂”给大模型,从而打造出一个足够智能的能够实现“从方到病、从病到方”目标的AI。
这里面的复杂性在于:既要从已有的方剂、产品中拆解出由药效组分、作用靶点、适应症等组成的复杂网络信息,用科学的语言解读中药产品,为异病同治打下基础;也要从中医药理论、企业数据等出发为新药研发提供助力。从而促使企业“不断进行创新性自我重塑和持续沉淀”。
其实,这个过程就像是在打磨一把打开中医药神秘大门的“钥匙”,并用这把“钥匙”解开更多关于健康、疾病的秘密,开发出更多新药好药。
长期以来,外界对中国传统药企,特别是中药企业的印象,往往是重营销而轻研发的,很多知名中药企业每年的研发投入都只有一两亿元,甚至更少,在总营收中的占比非常小。现在情况,发生了180度转变。
从2023年年报看,多家企业研发费用激增。比如:太极集团的研发投入同比增长了113.52%;华润江中研发投入增长了33.37%;天士力的研发投入在同类企业中排在榜首。年报显示,天士力已有9款创新中药进入临床三期,三期品种数量居全行业前列。除了新增管线,针对大模型的投入也是重头戏。
研发中医大模型并非易事,训练过程中涉及的“样本量”需求比较大。
以天士力为例。该公司本次与华为云推出的“数智本草”大模型,是由天士力2017年开始打造的“星斗云”系统迭代升级而来。它们也是天士力做“数智中药”创新的基础。
此次发布的“数智本草”仅中药古籍就吸纳了上千本,方剂超过9万份,中成药配方4万多份,此外还有4000万以上的文献摘要、300多万天然产物、2万多个靶点通路信息,以及10万多临床方案和超16万的中药专利、药典政策指南等,整体参数量380亿。
企业又为其提供了350万特有天然产物分子数据,在华为分子大模型基础上训练中药计算大模型,进而实现了智能问答、交互计算、报告生成三大应用模式,以及上述提供的整个数智化闭环模式。
现代中药智能制造生产线一角
来自:天士力官网
尽管从参数到训练数据的规模还都无法与GPT等知名大模型,甚至是生物制药领域的大模型相比,但是背后的转型之痛,对于传统的中医药企业来说,已经堪比脱胎换骨了。
要喂养大模型,就需要高质量的数据,这在传统的作坊、车间、产业链里很难实现。因此,做中医药大模型最关键的一步就是对生产车间、产线、种植基地做数智化升级。
根据扬州大学马康宁、张斌对中医药企业供应链管理数字化转型模式的研究结果,天士力从2013年的中药材全程质量追溯体系建设开始,已经做了10多年的数字化转型,对装备和产线都实行了智能升级,将中药研发、种植、提取、生产、销售全产业链都做了标准化。
在此基础上,一条生产线,如果想一年采集2.1亿数据,就需要设置2100多个数据采集点。
另有某知名上市公司的公开信息显示,他们仅建设一个年产能1万多吨的智能化、数字化中药提取车间,就花费了3亿元,相当于该公司此前一年的研发投入的90%以上。
让药企们对中医大模型“舍得投入”的根本原因是,中医药市场正呈现爆发的趋势。根据中研普华产业院研究报告,预计到2026年中国中药市场的整体规模将达到1.5万亿元以上,整体平均增速12%左右,超过同期医药产业整体增速。
不过,要承接这样的利好也没那么容易。
急需“救命药”的药企
一个关键的机会窗口来自医药消费趋势的变化:中国医疗体系正从“治疗疾病”向“健康管理”转变,对以“治未病”为特点的中医药来说,也是前所未有的机遇期。
而中医药本身在市场上“形象”的变化,进一步强化了这个风口。过去三年,越来越多研究在一定程度上证实了中医药的价值。比如:张伯礼院士透露,在心脑血管等疾病治疗中,中医药将西医药治疗效果的“天花板”又提高了近30%。可以说,中医药拓展了疾病治疗的能力边界。
但面对这个难得的机会窗口,中医产业并没有100%完成热身。现实是,中药还有很多问题待解决,比如:因原料(主要是中药材)质量波动大而出现的不同批次产品质量不均一,中药方剂本身物质组成复杂,毒副作用认识不足,作用机制不清等,使很多中药产品难以获得市场认可,也无法走得更远。
以及,周遭因素影响下,一些中成药领域曾经的明星单品,已经风光不再。比如丹参川芎嗪注射液,曾是年销数十亿的药品,受重点监控、退出医保目录等影响,市场逐渐萎缩,后来干脆退市了。
“单品”压力陡增,导致药企压力也越来越大。
从2023年年报看,中国中药、华润三九、大理药业、龙津药业等多家中药上市公司的业绩大幅下滑。
来自:视觉中国
积极推动数智化的天士力也面临转型压力。
从公司财报数据看,天士力的主营业务收入增长率在2017年达到巅峰后,到2019年已经降到了5.61%,2020年还出现了负增长,到了2023年其同比增幅不到0.5%,主要聚焦的医药工业板块,增幅只有3.22%了。该公司的核心产品复方丹参滴丸,还在部分地区受到了重点监控、集采降价等影响。
据沈阳化工大学徐宏鑫在撰文中指出,主营业务收入增长率在5%以下的企业产品处于衰退期,主营业务利润有出现滑坡的风险。天士力的产品经过成长期与稳定期,开始进入衰退期。“应及时研发新产品,以避免丢失原有的市场份额”。
然而,现在按照传统手段要想推出新的“爆款”药,已经非常难了。要知道,药品研发本来就很复杂,即便是单分子药物,其可选空间就已经达到10的60次方以上了,有药效的物质不好找,能够安全用到人体的更少,全球新药研发成功率只有2%左右了。
中药作为大自然的产物,成分更复杂,究竟是哪些成分在起效还没有研究清楚,方剂又有不同药材的配伍,更是叠加了不同药材间、同一药材不同成分间的相互作用等,复杂程度难以想象。
公开资料显示,2018年到2023年,中国一共批了45个中药新药,相对提交的注册申请可谓是九牛一毛。2023年就有1163件中药注册申请,获批的中药新药却只有9个。
如果没有一项颠覆性的技术,彻底改变中医药的发展范式,确实很难后来居上、弯道超车。AI大模型显然就被寄予了这种力挽狂澜的期望,俨然成了产业界提振信心的“药神”。
不宜“神”化大模型
某种程度上说,以大模型为基础的数智化,确实在改变中医药。而且这种改变不只局限在讲清道理、发现新药。
按照天士力勾勒的“数智中药”蓝图,数智化将通过3条路径来赋能中药全产业链。
包括:在研发中,可以多维度多模态数智中药研发技术深刻解析药物与疾病特征;在生产中,可以智能制造技术保障中药产品质量精准控制、高效、绿色、可持续发展;在使用环节,可以智慧中医大脑高效赋能数智中药个体化精准服务。目标是要“引领现代中药达到用药精准、生产精智、疗效精确的新高度”。
另有科技领域投资人曾告诉虎嗅,大模型会用一种更高效的、人类无法理解的方式理解世界,然后再用人类能够理解的方式转述出来。从这个角度看,它与中医药也有某种共同之处,确实有潜力揭开传统中医药的神秘面纱,打开长期困扰行业发展的桎梏。
而且AI在中医药领域的突破,还可能进一步解决现在医学的困境。
在《数智中药:现代中药数智化升级与创新发展》一文中,天士力的研究人员还指出,将现在生命科学和人工智能技术结合的研发体系,将分子信号通路作为分子本草技术的靶点,有机会“突破单一靶点药物开发难、周期长、停滞不前的困境”。
滴丸凝结过程模拟
来自:天士力官网
只不过,要实现这一点也还是说起来容易,做起来还有一些待解决的问题。
比如:在数据方面,中药领域的数据复杂多样、质量参差不齐、缺乏标准;还缺乏完善的隐私保护措施。在算法方面,也需要更多符合中医药特点的算法工具等。
此外,还有交叉人才的培养问题。中医药大模型的开发,需要融合中医、中药、计算机、统计学等多方面的知识,如果开发者缺少中医思维,很可能会出现误解或疏忽。且中医语言的一大特色就是隐喻,要正确理解和处理这类语言,对非专业人士和AI也是挑战。
上述问题的解决,绝大部分都不能单靠科技公司或制药企业,还需要政府、产业界、学术界共同努力。正因为此,天士力相关负责人也告诉虎嗅:“我们所做的这些也不是要在短期内颠覆行业。”更多还是在为中医药现代化发展的新范式打基础,是中医药领域的“数智化基建”。
尽管客观来说,中医药大模型并不是包治百病的“神药”,但是,有越来越多中药大厂积极布局这一新技术,对推动传统产业发展、破解生命奥秘来说,仍是值得期待的好事。
温馨提示:虽然我们每天都有推送,但最近有读者表示因平台推送规则调整,有时候看不到我们的文章~
微信扫码关注该文公众号作者