Top
首页 > 正文

王士泉:大模型在智慧医疗领域的应用场景与挑战

发布时间:2023-09-08 15:16        来源:赛迪网        作者:

作者:王士泉

以人工智能、混合现实、脑机接口、大语言模型(Large Language Model,LLM)等为代表的新兴技术领域,正在加速从“网联”向“物联”、“数联”、“智联”不断跃迁。这些涌现出来的新技术正逐渐渗透到智慧医疗领域的各个环节,成为提高医疗质量与效率的关键驱动力。

本文旨在为读者提供一些典型而深入的视角,以了解大模型在智慧医疗领域可能出现的发展方向。希望通过相关讨论,能够促进学术界、政府部门、医疗机构以及产业界的思考与讨论,共同推动智慧医疗领域的可持续发展,为全球健康事业的进步贡献力量。

1.大模型技术简介

大模型使用了许多技术,主要包括以下几个方面:

深度神经网络(DeepNeuralNetworks,DNNs):大模型通常采用深度神经网络,拥有多个隐藏层,以捕捉输入数据中的高阶特征和抽象概念。

卷积神经网络(ConvolutionalNeuralNetworks,CNNs):在计算机视觉任务中,大模型通常采用卷积神经网络。通过局部感受野、权值共享和池化操作等设计,CNN可以有效处理图像数据,提取多尺度的视觉特征。

循环神经网络(RecurrentNeuralNetworks,RNNs)和长短时记忆网络(LongShort-TermMemory,LSTM):在序列数据处理任务(如自然语言处理和语音识别)中,大模型可能采用循环神经网络或其变体(如长短时记忆网络)来捕捉时序关系。

Transformer架构:2017 年,谷歌提出了 Transformer 架构,随后 BERT 、GPT 等预训练模型相继提出,2019 年基于预训练模型的算法在阅读理解方面超过了人类的水平。Transformer是一种自注意力机制(Self-AttentionMechanism)的神经网络架构,广泛应用于自然语言处理领域的大模型中。Transformer可以并行处理输入序列中的所有元素,大幅提高了模型的训练效率。

预训练与微调(PretrainingandFine-tuning):为了充分利用大量参数,大模型通常先在大规模数据集上进行预训练,学到通用的特征表示。然后,在特定任务的数据集上进行微调,以适应特定应用场景。

分布式训练(DistributedTraining)和混合精度训练(MixedPrecisionTraining):为了处理大模型的计算和存储需求,研究者采用了一些高效训练策略,如分布式训练(将模型和数据分布在多个设备或节点上进行并行计算)和混合精度训练(利用不同精度的数值表示以减少计算和内存资源需求)。

这些技术和策略共同支持了大模型的开发和应用,使其在各种复杂任务中取得了出色的性能。

2.大模型在智慧医疗场景中的应用

(1)精准医学临床决策支持系统

建立在分子诊断、基因检测为基础上的,面向重大疾病及罕见病的风险预测、早期筛查、分子分型、靶向治疗以及个性化治疗策略的精准医学临床决策支持系统是精准医学技术取得实际应用的重要标志,也是未来医学进步速度的重要体现。目前,美国已有eMERGE等临床表型信息与生命组学信息深度融合的协作网络技术平台,并产生了重要的科研成果。精准医学临床决策支持系统其数据来源不仅包括院内临床信息,同时包括来自于基因组、转录组、代谢物组、糖组等生命组学数据及生物样本信息,涉及中文自然语言处理、语义映射转化、临床与组学数据规范化、临床与组学关联分析、机器学习等众多关键技术。根据“精准医学研究重点专项”要求,我国将于2025年前构建完成国家级多中心精准医学大数据平台及可持续更新的临床样本生命组学信息库、中国人群组学参比库等,可为精准医学临床决策支持提供数据及技术基础。大模型在多模态数据融合分析训练上具有明显优势,有助于提升精准医学大数据有效挖掘能力,对完善国家级精准医学知识库,构建适用于临床的精准医学决策支持系统方面可提供强大支持。

(2)基于人工智能技术的医学顾问系统

基于人工智能的多重卷积神经网络技术可模拟医生的认知、思考、推理与学习过程,推广具有一定智能辅助诊断能力的医学顾问系统,可有效弥补医疗人力资源不足、降低成本并提高准确率。近年来《Nature》、《Science》论文表明,在脑瘤病理切片诊断,儿童认知障碍诊断上,AI准确率上已经超过医生水平。当前我国医疗人工智能只形成了单点突破的形势,尚未形成广泛推广局面。人工智能医学顾问系统涉及到计算智能、感知智能、认知智能多个阶段,融合深度学习、分析模型构建、虚拟现实、增强现实、语音识别等众多技术。利用大模型对海量数据的深度挖掘、分析能力,可以在医学顾问系统、技术与应用方面的提高国内相关产品的竞争能力。

(3)基于机器深度学习的医学影像智能阅片应用系统

影像数据量占医院总数据量的90%以上,普通医院影像数据以每年几十G的速度增长,普及影像智能读片技术,并建立标准化、规模化和第三方的影像分析算法平台,可大大提高肿瘤识别率,提升阅片速度,让不发达地区获得名医阅片能力。美国、日本等国家在未来5-10年将继续大力发展疾病筛查、病灶分类/勾画、脏器三维成像、病理分析等技术,加速影像三维后处理软硬件一体化设备的研发。从目前来看,飞利浦、通用电气、西门子、富士等公司在高端影像三维后处理技术及设备上形成了技术壁垒。研发基于机器深度学习的医学影像智能阅片设备,需建立卷积自编码、迁移学习、对抗学习等众多模型,以及研发多结节自动分割、高通量特征提取、三维超高分辨率动态显微成像、多参数专科超声成像、多模态分子成像、基于内容影像检索等多种设备及技术。利用大模型技术,可助力我国在基于分子影像、多模态融合成像与分析技术上取得专项突破,对研发出基于深度学习的多尺度生物标志物发现系统,实时高空间分辨率和多模态的图像融合设备等有重要意义,有助于实现重大疾病的临床诊疗方案技术创新。

(4)医疗语音识别录入技术及应用

医疗语音识别技术不仅在临床问诊、候诊、预约等交互环节使用,在超声、病理、口腔、内窥镜等科室特殊工作场景下拥有更大的价值,结合临床决策支持系统还可有效实现语音辅助疾病诊断功能,是医疗信息化发展水平的重要标志。根据HIMSS EUROPE调查,大部分欧美诊所已采用语音作为病历收集主要方式。全美72%以上的医疗机构正在使用语音系统,94%的欧美医疗机构正在使用或考虑使用临床语音识别技术提高医生工作效率。国内语音识别录入技术仅在部分全国知名医院有实际应用,近50%的医生每天的医疗文档录入时间超过4小时,看电脑多过看病人。医疗语音识别录入技术,需要利用声学模型自适应和大数据语音建模技术,医疗文本语义分析技术,医学专业术语、特殊单位、特殊符号转换识别技术,并解决在高噪声环境、中文方言场景下的识别准确率等问题。利用大模型研发AI生成式回答系统,能够显著提升语音问答的用户体验,能够在辅助电子病历录入层面发挥重要价值。

(5)医疗术语与本体标准建设领域

医学术语标准和医学本体是智慧医疗基础,在医疗数据分析挖掘和临床决策支持方面起着非常重要支撑作用。目前,国际上存在大量术语集和本体资源(如 ICD-9、ICD-10、LOINC、SNOMED-CT及HPO等),但很多资源在格式、配套工具以及编程接口方面互不兼容,难以充分发挥这些资源的作用。全球范围内本体术语服务最为先进的研究机构主要是斯坦福大学和美国癌症中心。美国癌症中心与梅奥医学中心合作,开发了企业级术语服务引擎,用于支撑医疗应用系统研发。而面向中国人群与临床环境的术语集服务和本体服务方面目前尚处于研究阶段,同时面临着不够开放、缺少推广、缺少资金等问题。医疗术语与本体标准支撑技术需重点解决SNOMED,LOINC、CHPO、MeSH、RxNorm、ICD-9/10等数据集整合,术语服务引擎研发、本体模型构建(如癌症本体、罕见病本体)等关键技术。利用大模型提供的自然语言处理能力(P-tuning),可探索制订属于中国的医疗术语与本体标准规范体系,为各类临床标准术语及数据中心建立奠定理论基础,并向各区域健康医疗大数据中心(产业园)、及科研机构提供标准化服务支持。

(6)区域级肿瘤、癌症及慢病大数据中心

国际癌症研究署预测,我国癌症发病数和死亡数到2025年将上升至400万人和300万人,2030年将上升至500万人和350万人。每年诊疗费用约为600亿元,间接疾病负担估算超过7800亿,患者家庭经济负担难以承载。中国人口之众,建成区域级别肿瘤、癌症及慢病的大数据中心与协作网络对于全球癌症防控意义重大。在当前,我国医院影像数据量占医院总数据量的90%以上,普通医院影像数据以每年几十G的速度增长,而人单个样本30层外显子原始数据就达22G,以我国400万肿瘤患者估算,影像数据量将达到252PB。由于目前国内医院并不具备规模数据储存条件,数据分散难以共享,加上数据安全敏感等问题,导致其在影像、基因大数据的利用领域遭遇瓶颈,依托于大模型技术与可解释AI,建设区域级肿瘤、癌症及慢病大数据中心,能够为国内各级医疗机构肿瘤、慢病诊治提供大数据服务与应用支撑,推动影像、基因大数据中心在各地落地生根。

3.大模型在智慧医疗场景中的面临的挑战

(1)数据安全与隐私保护

随着医疗信息化建设的不断发展,大量的健康医疗数据被收集和分析。然而,这些数据的安全与隐私保护成为了一个日益突出的问题。患者的健康数据包括个人识别信息、病史、检查结果等敏感信息,如何在确保这些信息安全的前提下进行分析和利用,对于大模型在智慧医疗领域的应用至关重要。

在实际应用中,数据加密技术成为保护患者隐私的重要手段。例如,使用可逆加密和非可逆加密方法对患者数据进行加密处理,确保数据在传输过程中的安全性。此外,区块链技术也为健康数据安全提供了新的解决方案。通过区块链技术的分布式存储和加密算法,可以保证数据的完整性和安全性,同时实现数据共享和隐私保护之间的平衡。如MediChain等区块链健康项目,通过构建一个去中心化的医疗数据平台,确保患者数据的安全和隐私得到有效保护。

然而,数据安全和隐私保护不仅仅是技术问题,还涉及到伦理和法律层面的挑战。在智慧医疗大模型应用的开发和使用过程中,应尊重患者的隐私权和知情同意权,确保患者数据的使用符合道德和法律要求。此外,政府、企业和社会组织应共同努力,加强对数据安全和隐私保护的宣传教育,提高公众的信息安全意识和自我保护能力。

(2)标准化的问题

在医疗垂直领域大模型应用,尚缺乏统一的技术标准和规范,有可能导致数据共享的障碍、安全隐患和系统的不稳定性。为解决这一问题,政府、企业和研究机构应共同制定垂直领域大模型的相关标准和规范,以提高产品和服务的质量,促进技术的互操作性和可扩展性。总之,在大模型领域,技术创新与标准化是相辅相成的。在推动技术创新的同时,应关注标准化的建设和实施,以保障大模型技术健康有序的发展。

(3)医患关系和信任问题

随着AIGC、大模型等技术的在医疗领域的应用,医患关系和信任问题愈发突出。虽然这些新技术为患者提供了便捷的诊疗服务,但也可能导致医患关系的疏离。因此,在智慧医疗领域的发展过程中,如何处理好医患关系和信任问题至关重要。医疗机构和医生应注重患者隐私保护,确保新技术不会带来数据的安全上的挑战。同时,应对患者进行透明的沟通,解释人工智能技术的优势和限制,使患者对这些技术有更加全面的了解。此外,医疗机构还应加强患者教育,提高患者的数字健康素养,帮助他们更好地利用数字健康资源。

4.总结与展望

智慧医疗领域大模型是一个快速发展的领域,未来将会面临更多的机遇和挑战,需要不断地推进技术创新和制度创新,促进该领域的健康发展。大模型在赋能医院的智能导诊、自动预约、智能客服等服务,助力患者全生命周期管理,赋能临床科研等领域拥有广泛前景,未来发展将会更加多样化、智能化和人性化,大模型的不断创新和应用将推动医疗服务的进一步发展和改善。同时,大模型在医疗的发展也将需要政府、医疗机构、医生和患者等多方的支持和协作,以实现良性互动。此外,大模型的发展也将带来一些挑战和风险,例如数据隐私、技术标准不统一、医生和患者对人工智能生成内容的接受度等问题。因此,智慧医疗的大模型发展也需要不断地完善法律法规、技术标准和服务规范等制度建设,以确保医疗健康服务的安全、可靠和可持续发展。

作者简介:注:王士泉(WANG Shiquan),高级工程师,IT技术管理精英,中国HIT(Hospital information technology)技术创新探索者,深耕医疗健康领域信息化二十余年。

每日必读

专题访谈

合作站点