文章主题:深度学习, 医学图像, 交叉学科, 挑战

666AI工具大全,助力做AI时代先行者!

摘要

在过去几年中,深度学习和医学领域的交叉合作取得了显著的成果,尤其是在医学图像解析领域。本文主要探讨了三个核心方向,为医学图像解析的深度学习技术的进步提供了挑战与机遇。首先,针对专家级医学图像解析算法的研发,重点关注迁移学习和自监督学习算法,目标是在低标注医学数据环境下运行。其次,着重于高质量数据集的设计与管理,以及在推动算法研发过程中的重要作用,特别是采用有限手动注释的高质量标签。最后,对医学图像算法的实际应用进行了研究,分析了在系统分析临床相关分布变化背景下,其性能的变化规律。总的来说,本文概括了各个方向的关键贡献、观点以及跨医学领域的应用价值。

图:CheXpert 任务是预测来自多视图胸片的不同观察结果的概率。

图:对比学习最大化同一胸部 X 射线图像的不同增强所生成嵌入的一致性。

1 引言

在接下来的几年中,人工智能(AI)有望对医学领域产生深远影响。其应用范围广泛,包括但不限于疾病的早期筛查、预后优化以及个性化的治疗方案制定等方面,从而提高医疗效率,降低治疗成本。不久的将来,阅读胸部X光片和组织病理学切片等医学图像的算法将会成为医生管理工作的常规工具,使得没有接受过亚专业培训的临床医生也能获得决策支持,进一步推动人工智能驱动的远程医疗服务发展。此外,人工智能技术还将助力实现对数百万患者健康状况的实时监控,以前所未有的方式优化患者的就诊和跟进流程。

近年来,深度学习作为人工智能的一种表现形式,其神经网络能够直接从原始数据中学习模式,因此在图像分类领域取得了显著的成果[128]。正因为如此,医学AI研究在我国严重依赖图像理解的专业领域,如放射学、病理学和眼科[137],得以迅速发展。这种发展趋势源于算法的不断优化和数据集的日益丰富,特别是在卷积神经网络架构以及训练程序的改进方面,使得医学成像应用有了明显的进步[145]。同时,这些算法的成功也得益于对用于医学成像的大型标签数据集的有效管理。目前,一些AI工具已经从测试阶段转向了部署阶段,消除了监管障碍,并得到了政府的行政支持[20]。例如,某些医疗保险和医疗补助服务中心已经批准将部分用于医学图像诊断的人工智能工具纳入报销范畴,这无疑为人工智能在临床环境中的应用提供了推动力[69]。然而,尽管在回顾性数据集上,深度学习算法在理解医学图像方面的表现相当出色,但成功转化为临床实践的数量与实际需求仍存在较大的差距[116]。因此,未来我国将继续致力于深度学习技术在医学领域的应用,以期更好地满足临床需求。

这篇论文指出,广泛应用于医学图像处理的深度学习方法面临三大技术难题。首先,现有算法主要针对需要大量干净数据的问题进行优化,然而在医学领域,常见问题往往是噪声或标签数据有限的场景。其次,当前用于训练和验证模型的数据集通常是小型、嘈杂且同质化的,而非大型、优质且异构的,这限制了算法的泛化能力。最后,现有研究在训练数据集分布的背景下对算法进行验证,然而在临床部署环境中,需要考虑临床相关分布的变化来评估算法的实际性能。

2 论文结构

本论文涵盖了算法、数据集和研究方向的进步、挑战和机遇。

算法

在过去几年中,深度学习算法在医学领域取得了显著的成果,其某些初步成果已达到医学专家的水平,能够进行临床重要的诊断,涵盖了放射学、心脏病学、皮肤病学、眼科和病理学等多个领域[139]。在第2章中,我介绍了一种用于检测胸部X射线疾病的算法开发,研究结果表明,该算法的性能可与专业放射科医生相媲美。在第3章中,我描述了一种基于专业心脏病专家水平的算法开发,通过心电图检测异常心律,结果显示该算法具有较高的准确性和实用性。此外,我还介绍了推动这两项任务实现的大型数据集,为训练端到端的深度学习算法提供了基础。这些章节共同见证了胸部X射线判读和心律失常检测任务在专家级表现方面的突破。

作为一篇专业文章,本文将探讨算法开发领域的一个关键问题:数据注释的重要性。尤其是在处理生物医学等需要大量专业注释的场景下,监督深度学习算法所需的大量数据标注是一项极具挑战性的任务。以医学成像领域为例,利用预训练的ImageNet模型进行迁移学习,在有限的标记数据环境下开发算法已成为一种常见策略。此外,本文还将详细介绍我在第4章中关于ImageNet架构的性能和效率的研究成果,以及我在第5章和第6章中关于自我监督对比学习如何实现医学训练模型范式转变的深入分析。这些内容旨在展示迁移学习和自我监督学习如何有效地应对医疗环境中 limited标记数据的算法挑战。

数据集

大型、高质量的数据集在推动深度学习算法的应用和进步方面发挥着关键作用。在医学领域,数据集管理需要与医院管理员建立合作伙伴关系,建立安全处理和去识别数据的框架,以及数据组织和注释的策略。在第 7 章中,我描述了胸部 X 射线照片数据集的管理和合成转换,旨在评估 X 射线照片的算法性能,以在真实临床环境中进行基准稳健性测试。在第 8 章中,我描述了包含组织微阵列载玻片的数据集的管理和注释,以及来自癌症病例的临床和细胞遗传学数据,以发现预后生物标志物。

对于医学影像数据集,标注通常需要人工标注,成本高且难以获得,而通过自动化方法获取的标签可能会产生噪音。在监督计算机视觉模型解读医学图像的背景下,从自由文本放射学报告中高质量地自动提取医学状况至关重要。在第 9 章和第 10 章中,我描述了构建高质量放射学报告标记器的过程,这些标记器可以解决噪音和专家注释的有限可用性。

研究

虽然医学图像解读中的大多数基础工作已经在训练它们的相同数据集分布上评估算法,但这些算法的部署需要了解它们在临床相关分布变化下的性能。在第 11 章中,我以胸部 X 光解读为例,描述了在存在未标记或训练期间存在的疾病的情况下,对深度学习模型性能的系统评估。在第 12 章中,我描述了对不同胸部 X 光模型的系统研究,该模型应用于未经任何微调的智能手机胸部 X 光照片和外部数据集。

总体而言,本论文展示了深度学习医学图像解读的进展,结合了以下方面的进步:(1)在大小标记数据集背景下的算法,(2)通过临床知情管理和标记的数据集,(3)和研究系统地评估算法在临床相关分布变化下的性能。

图:实验装置概述

图:测试了 8 种不同的胸部 X 光模型,应用于 (1) 胸部 X 光的智能手机照片和 (2) 没有任何微调的外部数据集时的诊断性能。所有模型都由不同的团队开发并提交给 CheXpert 挑战赛,并在没有进一步调整的情况下重新应用于测试数据集。

https://mp.weixin.qq.com/s/ZDM1zbVKyn1VhAf4Z_CJdA

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *