用机器学习算法分析胸片图像,说起来容易做起来难。
这是因为一般情况下,训练这些算法所需的临床标签是通过基于规则的自然语言处理或人工标注获得的,这两种方式都容易造成不一致和错误。此外,仅通过给出图像来集合代表各种情况的数据集并建立临床上有意义且一致的标签是非常困难的。
为了促进X射线图像分类的目标,谷歌研究人员设计了AI模型,以在人体胸部X射线上找到以下四种发现:气胸(塌陷的肺)、结节和肿块、骨折和空洞混浊(用物质填充肺树)。在发表于《自然》期刊的论文中,研究小组声称,该模型家族是在人类专家进行的独立审查中,通过使用数据集中带有高质量标签的数千幅图像进行评估的,证明了其在辐射水平上的性能。