You are on page 1of 34

根据 AAPM TG-263 报告,对基础 LLM 重新标注结构名称的能力

进行基准测试

Jason Holmes 博士∗1、Lian Zhang 博士1、Yuzhen Ding 博士1、Hongying Feng 博士1、


arXiv:2310.03874v1 [physics.med-ph] 5 Oct 2023

Zhengliang Liu 硕士2、Tianming Liu 博士2、William W. Wong 医学博士1、Sujay A. Vora 医学博士


1、
Jonathan B. Ashman 医学博士1 和 Wei Liu 博士1

1亚利桑那州凤凰城梅奥诊所放射肿瘤科,85054
2 佐治亚大学计算机学院,佐治亚州雅典,30602

摘要

目的:介绍根据美国医学物理学家协会(AAPM)工作组(TG)-263 标准使用大型语言模
型(LLM)重新标注结构名称的概念,并为未来研究建立一个参考基准。
方法和材料:生成式预训练变换器(GPT)-4 应用程序编程接口(API)是作为医学数
字成像和通信(DICOM)存储服务器实现的,在接收到结构集 DICOM 文件后,GPT-
4 会根据 AAPM TG-263 重新标注目标体积和正常组织的结构名称。评估选择了前列腺
、头颈部和胸部三个疾病部位。在每个疾病部位类别中,随机抽取 150 名患者手动调
整指示提示(每批 50 人),并随机抽取 50 名患者进行评估。所考虑的结构名称是那
些最有可能与对许多患者使用结构轮廓进行研究相关的名称。
结果对前列腺、头颈部和胸部病例的目标体积和正常组织进行重新标记的总体准确率分别
为 96.0%、98.5% 和 96.9%。除前列腺外,目标体积的重新标记平均准确率较低,分别为
100%、93.1% 和 91.1%。结论鉴于 GPT-4 在重新标注靶体积和正常组织结构名称方面的准
确性,LLM 将成为放射肿瘤学中标准化结构名称的首选方法,尤其是考虑到 LLM 功能可
能会继续快速发展。

1 导言

放射肿瘤学的一个长期问题是靶体积和正常组织的结构名称标记不一致[1, 2, 3, 4, 5, 6, 7, 8, 9,

10, 11, 12, 13, 14]。结构轮廓是治疗规划、剂量评估和患者预后研究的基础。随着循证医学日

益受到重视,机器学习[15, 16, 17, 18, 19, 20, 21, 22]、人工智能(AI)[23, 24, 25, 26, 27, 28]等
1
新技术不断涌现、

以及最近的人工生成智能(AGI)[29, 30, 31, 32, 33, 34],准确一致的结构名称标注变得越来

越重要[35]。结构名称标注不一致的问题并非偶发挑战,而是该领域的从业人员、研究人员

和技术人员经常面临的一个长期障碍。

∗通讯作者:holmes.jason@mayo.edu

2
用 GPT-4 进行结构重标记

为解决这一问题,美国医学物理学家协会(AAPM)于 2018 年创建了一份名为 AAPM 工作

组(TG)-263[36] 的文件,定义了包括靶体积和正常组织在内的结构命名标准。然而,尽管

有了明确的标准,AAPM TG-263 报告的复杂性使其在临床实践中的实施面临挑战,导致许

多诊所仍未采用该标准。即使是采用了 AAPM TG-263 标准的诊所,采用该标准之前的数据

也可能保持不变,这为大规模数据挖掘研究造成了障碍。为 此 ,研究人员对重新标注结构名

称的方法进 行 了前瞻性和回顾性研究。

以往的重标记方法通常采用查找表[2]、模板[13]或机器学习[1, 3, 4, 5, 6]。机器学习方法的输

入通常包括结构名称和转换为二进制掩码的结构。输入信息还可能包括 CT 信息、剂量信息

或结构体积大小。除结构名称外,加入其他信息也能改善结果。不过,这些研究始终强调了

一个重要发现:结构名称本身是影响这些模型正确重新标注结构名称准确性的最重要因素。

尽管之前的方法在区分和整理结构名方面相对成功,但通常只适用于一小部分结构,没有一

种方法是全自动和通用的(能够重新标注任何结构名)。此外,这些方法并不能直接解释

AAPM TG-263 指南。由于 AAPM TG-263 是一份文本报告,因此大语言模型(LLM)是解释

和遵循 AAPM TG-263 指南的自然选择,因为它们可以作为直接输入提供给 LLM。考虑到结

构名文本在之前研究中的重要性,我们引入了使用基础 LLMs 来规范结构名的概念,将

AAPM TG-263 指南作为结构名的直接输入。由于生成式预训练转换器(GPT)-4(OpenAI,

加利福尼亚州旧金山)[37] 在放射肿瘤学方面知识渊博[38, 39, 30, 40, 41],我们对 GPT-4 在

根据 AAPM TG-263 对结构名进行正确重新标注方面的性能进行了基准测试。

2 方法与材料

为了评估 GPT-4 的准确性(即重新标注后结构名称正确率),考虑了三个疾病部位:前列腺

、头颈部和胸部。针对每个疾病部位,选择了 150 名患者(每批 50 名)进行手动调整指令提

示,并选择了 50 名患者进行评估,共计 600 名患者。本研究使用的所有患者数据都是从亚利

桑那州梅奥诊所放射肿瘤部的 Aria(瓦里安医疗系统公司,加利福尼亚州帕洛阿尔托)患者

数据库中随机选取的,时间跨度为 2014 年至 2023 年。GPT-4 只提供了结构名称(因此没有

患者信息)。

这项研究的一个难点是决定在确定 GPT-4 的重新标记准确性时应考虑哪些结构名称。大

多数研究只考虑了特定疾病部位最重要的 5-10 个结构。考虑到 LLM 的概括能力,我们

3
用 GPT-4 进行结构重标记

希望考虑尽可能多的结构名称,同时还能对不同研究的重新标记准确性进行合理比较。

考虑到这一点,我们没有考虑不代表目标体积或正常组织的结构,例如 "牙科"、"靶标 "

等,或者以某种独特或非标准方式指定的结构,例如 "物理"、"术前 "等 。此外,我们没

有考虑任何结构

4
用 GPT-4 进行结构重标记

图 1:实施情况。

含有数字的结构名,通常是剂量测定师在 制 定 治疗计划时作为补充结构生成的,或者是

治疗师根据我们的机构协议在射束传输过程中为患者对齐时使用的。虽然这类结构名称在很

多情况下都能符合 AAPM TG-263 标准,但在评估准确性时并不考虑这些结构名称,因为它

们很可能不会用于以数据为中心的放射肿瘤学研究。尽管如此,GPT-4 仍被要求重新标注所

有结构名,以数字、"x"、"z "开头或含有 "剂量 "的结构名除外。为了从整体上说明 GPT-4 对

结构名称重新标注的有效性,我们还为每个疾病部位提供了一个输出示例(见附录)。

2.1 实施情况

AAPM TG-263 重新标注软件是作为一个带有网络监控系统的医学数字成像和通信(DICOM

)服务器来实现的,它在接收到结构集 DICOM 文件后,会提示 GPT-4,收到 GPT-4 的响应

后,会用 AAPM TG-263 标准名称重新标注原始结构名称。为了限制提示的长度,每个疾病

部位都有各自的重新标注应用程序。我们使用内部患者搜索引擎按疾病部位选择患者。选定

后,患者搜索网站会 将 每位患者的结构集 DICOM 文件发送到重新标记应用程序。实施示意

图见图 1。网络监控系统允许下载重新标记过程中生成的日志,这些日志可用于临床研究评

估。

2.2 提示

本研究采用了两种成熟的提示技术:零镜头学习[42] 和思维链提示[43, 39]。零镜头学习是指

尝试向模型传授执行任务所需的知识,而模型从未接受过这方面的训练。思维链是一种策略

,即在给出答案之前,提示 LLM 解释其推理,试图给 LLM 提供一个 "从零开始 "的工作平台

5
用 GPT-4 进行结构重标记

提供给 GPT-4 的提示包含六个部分:

1. AAPM TG-263 非目标命名指导原则。

2. AAPM TG-263 目标命名指导原则。

3. 术语工作表"(AAPM TG-263 工作的一部分)中提供的与疾病部位相对应的所有标

准结构名称。

6
用 GPT-4 进行结构重标记

图 2:用于手动调整提示的机构特定部分的工作流程。

4. 与发病地点相对应的特定机构说明。

5. 指示 GPT-4 按照 AAPM TG-263 重新标注结构名,并在回答每个结构名之前解释其

理由。

6. 重新标注结构名称。

机构可能会有一些非常常见的特定结构名,最好在机构特定说明中明确定义结构名。例如,

"BODY 应为 Body "或 "大脑 CTV 应为 CTV_Brain"。此外,AAPM TG-263 报告中可能没有定

义特定机构的结构名称,如 "STV"、"栓剂头盔"、" 沙发 "等,这些名称应在特定机构说明中

定义。一般来说,机构专用说明应精心制作,以提高准确性,同时满足机构的临床需求。本

研究中使用的机构特定提示的调整工作流程见图 2。

在对特定机构的提示进行调整后,每个疾病部位随机抽取 50 名患者进行评估。在分析每个疾

病部位的重新标注准确性时,结构按子疾病部位分组。例如,包含 "咽"、"环咽"、"环_p "或 "

缢缩 "的结构名称被归类为 "咽 "子疾病部位的一部分。

3 成果

每个疾病部位考虑的结构名称数量(每个疾病部位 50 名患者)反映了其整体复杂性。前列腺

有 207 个独特的结构名称,其中 86 个被用于确定准确性。头颈部的数量最多,有 621 个独特

的结构名称,其中 236 个被用于确定准确性。胸部疾病部位有 337 个独特的名称,其中 183

个被考虑在内。

各疾病部位的主要结果见表 1。图 3、图 4 和图 5 分别给出了按前列腺、头颈部和胸部的亚疾

病部位分列的股道名称重新标记准确性结果。优化靶体积(OTV)仅用于本机构的质子治疗

,由于 GPT-4 对 OTV 的性能差异很大,且 OTV 并非标准靶体积,因此将其与其他靶体积分

7
用 GPT-4 进行结构重标记

开处理。所有疾病部位的总体准确率都在 96% 以上,但头颈部病例和胸部病例的目标体积却

下降到了 90% 以下。

大多数错误通常是微不足道的,例如 "fem_head_l "被标为 "Fem_Head_L",而它本应是

"Femur_Head_L"。在某些情况下,子串的排序不正确,如 "Lumpectomy_PTV "而不是

"PTV_Lumpectomy"。在某些情况下,本应大写的字母没有大写。

8
用 GPT-4 进行结构重标记

图 3:GPT-4 根据 TG-263 报告重新标注前列腺结构名称的 准确性。

在提供给 GPT-4 进行重新标注的总共 3,302 个结构名称中,只有 14 个结构名称分类错误

,7 个结构名称是唯一的。前列腺"OTVProstate" 3 次 被标为 "zProstate"。头颈部:2 次将

减影容积 "brain-ptv "标注为脑部 PTV,4 次将目标容积错误归类为减影容积,例如将

"OtvBrain "标注为 "Brain-OTV"。胸部:4 次将 "bronch_tree_prox "标注为 "AirWay_Prox"

,而本应标注为 "Bronchus_Prox"。

表 1:每个疾病部位的总体准确率。

类别 总体精度 目标卷(非 OTV)


前列腺 96.0% 100%
头颈部 98.5% 93.1%
胸部 96.9% 91.1%

4 讨论

这项工作使用 LLM(GPT-4)根据 AAPM TG-263 对靶体积和正常组织的结构名称进行了重

新标注,是 LLM 在放射肿瘤学实际临床环境中的首次临床应用之一。总体而言,GPT-4 在

处理各疾病部位高度异构的结构名称集方面表现出色,证明了其在真实世界临床环境中工作

的能力。事实上,我们的诊所正在将这一应用用于结构对比研究以及数据预处理,以训练需

要结构轮廓的人工智能模型。

9
用 GPT-4 进行结构重标记

与其他人工智能模型相比,基础 LLM 在根据 AAPM TG-263 重新标注结构名称方面有几

个明显的优势。LLM 具备所有

10
用 GPT-4 进行结构重标记

图 4:GPT-4 根据 TG-263 报告重新标注头颈部结构名称的 准确性。

11
用 GPT-4 进行结构重标记

图 5:GPT-4 根据 TG-263 报告重新标注胸部结构名称的 准确性。

12
用 GPT-4 进行结构重标记

由于 AAPM TG-263 是文本文件,因此 LLM 可以接受 AAPM TG-263 中的文本信息作为直接

输入。由于 AAPM TG-263 是一份文本文档,因此 LLM 可以接受 AAPM TG-263 中的文本信

息作为直接输入。在这项工作中,由于 GPT-4 目前仅限于 8,000 个词库,我们只提供了非目

标和目标命名的指导原则,以及 "命名工作表 "中按疾病给出的标准结构名称。不过,在不久

的将来,GPT-4 将有一个 32,000 token 版本,如果需要的话,它可以包含更多 AAPM TG-263

报告的内容。随着 LLM 的不断改进,也许有一天可以将整个 AAPM TG-263 报告作为输入,

从而将其推广到所有疾病部位。最后,随着基础 LLM 的更新,例如 GPT-5 发布时,只需将

模型从 GPT-4 更改为 GPT-5,即可更新代码。

虽然我们没有直接跟踪成本(使用 GPT-4 API 不可能),但我们尝试将使用情况分离出

来,以便估算成本。每个前列腺病例的成本约为 0.15 美元,每个胸部病例约为 0.20 美元

,每个头颈部病例约为 0.25 美元。虽然每个病例的成本可能会随着时间的推移而降低,

但成本与提供给 LLM 的信息量和需要重新标注的结构名称数量成正比,如果包括整个

AAPM TG-263 报告,成本可能会随着时间的推移而增加。

OTV 性能不佳可能是 AAPM TG-263 报告中可能存在的歧义造成的,其中非目标指南指出,

优化体积应在名称前加上 "z",并给出了 "zPTVopt "的例子。这个例子很奇怪,因为它将目标

体积与 "opt "结合在一起,而且是在非目标指南中给出的。zPTVopt "应该被视为目标量还是

优化量?就 OTV 而言,似乎应该使用 "z",但没有 "opt "的前缀或后缀,因此有些模糊,可能

导致 OTV 性能不佳。

GPT-4 的一些轶事观察结果如下:在不考虑准确性的结构名称中,错误分类似乎最常发生在

高度独特或模糊的结构名称上。一些患者的结构名称会导致 GPT-4 偏离规则,例如,如果目

标写成 "CtvProstate "和 "PtvProstate",那么整个患者的 每个目标体积有时都会受到影响。尽

管这种情况很少见,但还是导致了错误的群发。不过,即使 GPT-4 出错,通常也是以一致的

方式出错,这就有可能对算法进行修正。最后,幻觉在本应用中基本不存在,这可能是由于

GPT-4 的反应缺乏自由度。虽然错误分类可被视为幻觉,但没有比人类可能犯下的错误更严

重的错误。

本研究或方法存在以下局限性。根据使用情况,错误可能难以解决,但可以通过检查应用日

志文件来缓解。由于标签的标准化精确度很高,假定研究中存在一组特定的相关结构名称,

那么被误标 的结构应该相对容易识别,因为绝大多数结构名称都是正确的。有些结构名称不

13
用 GPT-4 进行结构重标记

容易与特定的器官(例如 "CTV_5000" )进行识别。在这种情况下,所需的输出可能是

"CTV_Prostate_5000"。这个问题可以通过考虑比结构名更多的信息来解决。如前所述,在确

定准确性时很难确定应该考虑哪些结构,尤其是本研究是首次考虑 LLM 进行重新标注,不过

我们的目的主要是考虑在以数据为中心的放射肿瘤学研究中会感兴趣的结构名称(详见第 2

节)。

14
用 GPT-4 进行结构重标记

与这一概念相关的未来工作可能包括利用原始标签和地面实况标签对较小的基础模型进

行微调。这 样 ,较小的 LLM(也许在本地运行)就能与较大的 LLM 相媲美。一般来说

,除了结构名称之外,还可以通过提供额外的信息来提高性能,例如 CT 信息、结构体积

大小或剂量信息等文本信息。例如,除了每个结构的结构名称外,还可以在提示中使用结

构的体积大小、最小剂量和最大剂量。最后,随着基础模型获得多模态功能,AAPM TG-

263 报告可能会与结构集、CT、剂量等的可视化表示一起包含进来。

5 结论

我们的研究结果表明,基础 LLMs(特别是 GPT-4)是在放射肿瘤学的实际临床场景中重新

标注结构名称的一个引人注目的新工具,尽管它并不完美。随着 LLM 的不断进步,这项工

作中提出的基准结果有望被超越。我们认为,LLM 将是放射治疗临床应用 AAPM TG-263 标

准的理想方法。

A 前列腺病例
## gpt -4 response
理由 :
Otv 前列腺 :这是前列腺的优化目标体积。
根据指南,优化卷的前缀应为 "z"。因此,应更名为 z OTV_Prostate。
膀胱:这是一个标准结构名称,格式已经正确。
fem_head_r : 表示右股骨头。根据指南,应将其更名为 Femur_Head_R。
fem_head_l : 表示左侧股骨头。根据指南,应将其更名为 Femur_Head_L。
rectum(直肠):这是一个标准结构名,格式已经正确。
penile_bulb:这是一个标准结构名,格式已经正确。
bowel_large:这是一个标准结构名,格式已经正确。
Ctv 前列腺 :这是前列腺的临床目标体积。根据指南,应将其更名为 CTV_Prostate。
svprox:代表近端精囊。根据指南,它应更名为 Seminal Ves_Prox。
BODY:代表身体。根据指导原则,应将其更名为 Body。
Body - OTV:表示减去优化目标体积后的身体。根据指南,应更名为身体 - OTV。
sv:表示精囊。根据指南,它应更名为精囊。
bowel_small:这是一个标准结构名,格式已经正确。

15
用 GPT-4 进行结构重标记

直肠尖端:表示直肠的尖端。根据指南,应将其更名为 Rectal_Tip。
stv:表示扫描目标体积。根据指南,应将其更名为 STV。
前列:这是一个标准结构名称,格式已经正确。
FD_Artifact : 这表示一个定位工件。根据指南,应将其更名为 FD_Artifact。
FD_Air : 这表示一个靶标空气。根据指南,应将其更名为 FD_Air。
LET : 这不是一个标准的结构名称,应保持原样。

重新标注结构名称 :
{'Otv前列腺':'z OTV_前列腺','膀胱':'膀胱','fem_head_r':'Femur_Head_R',
'fem_head_l':'Femur_Head_L','直肠':'直肠','penile_bulb':'阴茎球',
'bowel_large':BODY ': ' Body ', ' body - otv ':' Body - OTV ', ' sv ': '
Seminal Ves ', ' bowel_small ': ' Bowel_Small ','BODY ': ' Body ', ' body - otv
': ' Body - OTV ', ' sv ': ' Seminal Ves ','bowel_small ': ' Bowel_Small ', '
BODY ':' Body
直肠尖端":"Rectal_Tip","stv":"STV"," 前列腺":"Prostate","FD_Artifact":
"FD_Artifact","FD_Air":"FD_Air","LET":"LET '}

## re - labeling
Otv 前列腺 - - - - - - - - > z OTV_ 前列腺膀胱 ------
-- > 膀胱
fem_head_r -------- > Femur_Head_R fem_head_l
-------- > Femur_Head_L rectum -------- >
直肠
阴茎球茎 -------- > Penile Bulb bowel_large
-------- >Bowel_Large 0 _Fiducials not
considered by GPT - 4... unchanged Ctv Prostate --
------ >CTV_Prostate svprox --------
>Seminal Ves_Prox
正文 -------- > 身体
身体 - OTV -------- >身体 - OTV
sv -------- >精囊 Ves bowel_small ----
---- >Bowel_Small 直肠尖端 --------
>Rectal_Tip stv -------- >STV
前列腺 -------- >前列腺 FD_Artifact
-------- >FD_Artifact FD_Air ----
---- >FD_Air
LET -------- > LET

B 头颈部案例
## gpt -4 response
理由 :

1. 身体:这是病人的身体。根据 TG-263 标准,应将其标记为 "身体"。


2. 脑干 :这是脑干。根据 TG -263 标准,应将其标记为脑干。

16
用 GPT-4 进行结构重标记

3. brain_stem_prv : 这是脑干的规划器官风险容积 ( PRV )。根据 TG-263 标准,应标注为


Brainstem_PRV。
4. cochlea_l:这是左侧耳蜗。根据 TG-263 标准,应将其标记为 Cochlea_L。
5. cochlea_r : 这是右侧耳蜗。根据 TG-263 标准,应将其标记为 Cochlea_R。
6. 缢缩肌 PRV:这是缢缩肌的 PRV。根据 TG-263 标准,应将其标记为
Musc_Constrict_PRV。
7. 收缩肌_p :这是收缩肌。根据 TG-263 标准,应将其标记为 Musc_Constrict_P。
8. 脊髓 :这是脊髓。根据 TG-263 标准,应将其标记为脊髓。
9. cord_prv:这是脊髓的 PRV。根据 TG -263 标准,应将其标记为 Spinal Cord_PRV。
10. crico_p_inlet : 这是环咽。根据 TG-263 标准,应将其标记为环咽。
11. 食道:这是食道。根据 TG-263 标准,应标记为食道。
12. 食管:这是食管的颈部。根据 TG-263 标准,应将其标记为食管颈部。
13. ext_aud_canal_l:这是左外耳道。根据 TG-263 标准,应标注为 Ext Aud Canal_L。
14. ext_aud_canal_r:这是右外耳道。根据 TG-263 标准,应将其标记为 Ext Aud Canal_R

15. 添加 63:这不是一个标准的结构名称,也不符合 TG 标准。
-263 准则 .目前还不清楚这种结构代表什么 .
16. 热 63:这不是一个标准结构名称,也不符合 TG 标准。
-263 准则 .目前还不清楚这种结构代表什么 .
17. 喉部:这是喉部。根据 TG -263 标准,应标注为喉。
18. 喉 - CTV:表示减去 CTV 后的喉部。根据 TG-263 标准,应标注为喉 - CTV。
19. 喉 -PTV :这表示减去 PTV 后的喉部。根据 TG-263 标准,应标记为喉 - PTV。
20. 嘴唇 :这是嘴唇。根据 TG-263 标准,应标记为嘴唇。
21. 下颌骨:这是下颌骨。根据 TG -263 标准,应将其标记为 Bone_Mandible 。
22. 乳突_l:这是左乳突。根据 TG-263 标准,应标记为 Bone_Mastoid_L。
23. 乳突_r:这是右乳突。根据 TG-263 标准,应将其标记为 Bone_Mastoid_R。
24. oral_cavity : 这是口腔。根据 TG-263 标准,应将其标记为 Cavity_Oral(口腔)。
25. oral_cavity - ptv:表示减去 PTV 后的口腔。根据 TG-263 标准,应标记为
Cavity_Oral - PTV。
26. 腮腺_L:这是左侧腮腺。根据 TG-263 标准,应标记为腮腺_L。
27. 腮腺 PRV:这是左侧腮腺的 PRV。根据 TG-263 标准,应将其标记为 Parotid_PRV_L。
28. PTV_7000:这是剂量为 7000 cGy 的 PTV。根据 TG
-263 , 应标记为 PTV_ 7000。

17
用 GPT-4 进行结构重标记

29. PTV_6300:这是剂量为 6300 cGy 的 PTV。根据 TG


-263 ,应标注为 PTV_ 6300。
30. PTV_5600:这是剂量为 5600 cGy 的 PTV。根据 TG
-263 ,应标注为 PTV_ 5600。
31. semi_cir_canal_l : 这是左半规管。根据 TG
-263 ,应标注为 Semicir Canal_L。
32. semi_cir_canal_r : 这是右半规管。根据 TG-263 标准,应将其标记为 Semicir
Canal_R。
33. sub_mandib_l : 这是左侧下颌下腺。根据 TG
-263 , 应该标为 Glnd_Submand_L 。
34. 甲状腺:这是甲状腺。根据 TG -263 标准,应将其标记为 Glnd_Thyroid。
35. ctv_ 5600:这是剂量为 5600 cGy 的 CTV。根据 TG
-263 ,应标注为 CTV_ 5600。
36. ctv_ 6300:这是剂量为 6300 cGy 的 CTV。根据 TG
-263 ,应标注为 CTV_ 6300。
37. ctv_ 7000:这是剂量为 7000 cGy 的 CTV。根据 TG
-263 ,应标注为 CTV_ 7000。
38. gtv_ 7000:这是剂量为 7000 cGy 的 GTV。根据 TG
-263 ,应标注为 GTV_ 7000。
39. oral_cavity - ctv:表示减去 CTV 后的口腔。根据 TG-263 标准,应标记为
Cavity_Oral - CTV。
40. 大脑:这是大脑。根据 TG-263 标准,应将其标记为大脑。
41. brain avoid:这是大脑的优化结构。根据 TG-263 标准,应将其标记为 z 大脑

42. nasal_cavity : 这是鼻腔。根据 TG-263 标准,应将其标记为 Cavity_Nasal。
43. brachial_plex_r : 这是右臂丛神经。根据 TG
-263 , 应标记为 Brachial Plex_R。
44. brachial_plex_l : 这是左侧臂丛神经。根据 TG
-263 , 应标记为 Brachial Plex_L。
45. 身体 - PTV:表示减去 PTV 后的身体。根据 TG-263 标准,应标注为身体 - PTV。
46. PTV_ 70 opti :这是剂量为 70 Gy 的 PTV 的优化结构。根据 TG-263 标准,应将其标记
为 z PTV_ 70。
47. EAM Bolus:这不是一个标准结构名称,也不符合 TG - 263 准则。不清楚该结构代表什
么。
48. ANT NECK Bolus:这不是一个标准结构名称,也不符合 TG - 263 准则。不清楚该结构代表
什么。
49. MID NECK Bolus:这不是一个标准的结构名称,也不符合 TG - 263 准则。不清楚该结构代
表什么。
50. POST NECK Bolus:这不是一个标准的结构名称,也不符合 TG - 263 准则。不清楚该结构
代表什么。

重新标注结构名称 :
{'BODY':'Body','brain_stem':' Brainstem','brain_stem_prv':'Brainstem_PRV',
'cochlea_l':'Cochlea_L','cochlea_r':'耳蜗_R': '耳蜗_R', 'constrictor prv':
'Musc_Constrict_PRV' , 'constrictors_p' : ' Musc_Constrict_P', 'cord'
: 'Spinal Cord','cord_prv':脊髓_PRV":"脊髓_PRV","环_p_入口":"环咽","食道":
18
用 GPT-4 进行结构重标记

"食道","食道_颈":"食道_颈","ext_aud_canal_l":"Ext Aud Canal_L",


"ext_aud_canal_r":"Ext Aud Canal_R","add 63":"add 63","hot 63":"hot"。

19
用 GPT-4 进行结构重标记

63","喉":"喉","喉 - CTV":" 喉 - CTV","喉 - PTV":"喉 - PTV","唇":"唇","下颌骨"


:"Bone_Mandible","乳突_l":乳突_L":"Bone_Mastoid_L","乳突_R":
"Bone_Mastoid_R","口腔":"Cavity_Oral","口腔-ptv":"Cavity_Oral - PTV","腮腺
_L":"腮腺_L","腮腺_L_prv":'腮腺_PRV_L':'PTV_7000':'PTV_7000','PTV_6300':
'PTV_6300','PTV_5600':' P T V _ 5600','semi_cir_canal_l':'Semicir Canal_L',
'semi_cir_canal_r':'Semicir Canal_R':Semicir Canal_R","sub_mandib_l":
"Glnd_Submand_L","thyroid":"Glnd_Thyroid","ctv_5600":"CTV_5600","ctv_6300":
"CTV_6300","ctv_7000":"CTV_7000","gtv_7000":"GTV_7000"、
' oral_cavity - ctv ': ' Cavity_Oral - CTV ', ' brain ': ' Brain ', ' brain
avoid ': ' zBrain ','nasal_cavity ': ' Cavity_Nasal ', ' brachial_plex_r ':
' Brachial Plex_R ', ' brachial_plex_l ':'Brachial Plex_L ', ' body - ptv ':
' Body
- PTV","PTV_ 70 opti":"zPTV_70","EAM Bolus":"EAM Bolus","ANT NECK Bolus":
"ANT NECK Bolus","MID NECK Bolus":"MID NECK Bolus","POST NECK Bolus":"POST
NECK Bolus"}。

## re - labeling
正文 -------- > 身体
脑干 -------- > 脑干 brain_stem_prv -----
--- >Brainstem_PRV cochlea_l -------- >Cochlea_L
cochlea_r -------- >Cochlea_R
constrictor prv -------- >Musc_Constrict_PRV
constrictors_p -------- >Musc_Constrict_P 脊髓
-------- >脊髓
脊髓_PRV -------- > 脊髓_PRV 环_p_入
口 -------- >环咽 食管 -------- >食道
esophagus_cerv -------- >Esophagus_Cerv
ext_aud_canal_l -------- >Ext Aud Canal_L
ext_aud_canal_r -------- >Ext Aud Canal_R add 63--
------ >ad 63
热 63 -------- > 热 63
喉 -------- > 喉
喉 - ctv -------- > 喉 - CTV
喉 - ptv -------- > 喉 - PTV
嘴唇 -------- > 嘴唇
下颌骨 -------- >骨_下颌骨乳突_l --
------ >骨_乳突_ L 乳突_R -------- >骨_乳突
_R 口腔腔 --------
>Cavity_Oral oral_cavity - ptv --------
>Cavity_Oral - PTV parotid_l --------
>Parotid_L parotid_l_prv --------
>Parotid_PRV_L PTV_ 7000 -------- >PTV_
7000
PTV_ 6300 -------- > PTV_ 6300
PTV_ 5600 -------- > PTV_ 5600
semi_cir_canal_l -------- > Semicir Canal_L
semi_cir_canal_r -------- > Semicir Canal_R sub_mandib_l
- - -- - - - - > Glnd_Submand_L
20
用 GPT-4 进行结构重标记

甲状腺 -------- > Glnd_Thyroid


ctv_ 5600 - -------------> CTV_ 5600
ctv_ 6300 - -------------> CTV_ 6300
ctv_ 7000 - -------------> CTV_ 7000

21
用 GPT-4 进行结构重标记

gtv_ - -------------> GTV_ 7000


z_ptv_
7000 63 opti 未被考虑。 GPT - 4... 不 变 GPT
z_ptv_ 56 opti 未被口腔考虑 - ctv - 4... 不 变 口 腔 -
---------------------------------------------> CTV
大脑 -------- > 大脑
大脑避免 --------------------------------> z 大脑
鼻腔 --------------------------------------> 腔隙_鼻腔 臂丛
肱二头肌 -------------------------------->
肱二头肌 --------------------------------> _R 臂丛_L 身体
机构 - ptv -----------------------------> - PTV z PTV_ 70
PTV_ 70 opti-------------------------> 通过 GPT - 4... 不变 通
0 _PTV_ 7000 未考虑 0 _PTV_ 过 GPT - 4... 不变 通过
6300 未考虑 0 _PTV_ 5600 未 GPT - 4... 不变 EAM
考虑 EAM Bolus ---------------------> Bolus
ANT NECK Bolus --------------------> ANT NECK Bolus
中颈部 -----------------------------------> MID NECK Bolus
颈部注射后 -----------------------------> POST NECK Bolus

C 胸腔

理由 :

1. 身体:这是病人的整个身体。根据 TG -263 标准,应标注为 "身体"。


2. SCF_r LN PTV:这是右锁骨上淋巴结(LN)的计划目标体积(PTV)。应标记为
PTV_LN_Sclav_R
.
3. lung_l : 这是左肺。应标记为 Lung_L。
4. lung_r : 这是右肺。应标记为 Lung_R。
5. 疤痕线:这是放置在疤痕部位的靶标。应标记为 FD_Scar。
6. med 线:这是一个放置在内侧位置的靶标。应标记为 FD_Med。
7. Lat 线:这是一个放置在侧位的靶标。应标记为 FD_Lat。
8. 脊髓 :这是脊髓。应标注为脊髓。
9. 食道:这是食道。应标记为食道。
10. 心脏:这是心脏。应标注为 "心脏"。
11. lung_total : 这是两个肺。应标注为 Lungs。
12. 甲状腺:这是甲状腺,应标记为 Glnd_Thyroid。
13. Body - PTV:这是减去规划目标容积的身体。应标注为身体 - PTV。
14. CW_r PTV:这是右胸壁的规划目标容积。应标记为 PTV_Chestwall_R。
15. CW_r PTV_EVAL:这是右胸壁的评估规划目标容积。应标记为 PTV_Chestwall_R_Eval

16. 气管:这是气管。应标注为气管。
17. hum_head_r : 这是右肱骨头。应标记为 Humeral Head_R 。
18. Bolus_ 0 .3 厘米:这是一个 0.3 厘米的注射器。应标注为 Bolus_ 03 .

22
用 GPT-4 进行结构重标记

19. IDL 50 perc CW:这是胸壁 50%等剂量线。应标注为 IDL 50 _Chestwall 。


20. 手术夹 :这些是手术夹。应标记为 Clips_Surgical 。
21. CW_r CTV:这是右胸壁的临床目标容积。应标记为 CTV_Chestwall_R。
22. 气管心膜:这是气管的心膜。应标注为气管心膜。
23. 肝脏:这是肝脏,应标注为 "肝脏"。
24. chestwall_liver : 这是胸壁和肝脏,应标注为 Chestwall_Liver。
25. IDL 50 p CW_flash:这是胸壁 50%等剂量线,带闪光。应标注为 IDL 50
_Chestwall_Flash 。
26. SCF_r LN CTV:这是右锁骨上淋巴结的临床目标体积。应标记为 CTV_LN_Sclav_R。
27. IDL 50 perc SC:这是用于脊髓的等剂量线,剂量为 50%。应标注为 IDL 50 _Spinal
Cord。
28. 沙发表面:这是沙发的表面。应标注为 "沙发表面"。
29. 沙发内部:这是沙发的内部。应标注为 "沙发内部"。

重新标注结构名称 :
{' BODY ': ' Body ', ' SCF_r LN PTV ': ' PTV_LN_Sclav_R ', ' lung_l ': ' Lung_L ',
' lung_r ': ' Lung_R ', ' Scar wire ':' FD_Scar ', ' med wire ': ' FD_Med ','lat
wire ': ' FD_Lat ', ' cord ': ' Spinal Cord ', ' esophagus ': ' Esophagus ',
' heart ': ' Heart ':心脏":"心脏","lung_total":"肺","thyroid":
"Glnd_Thyroid","body - ptv": " Body - PTV","CW_r PTV":"PTV_Chestwall_R","CW_r
PTV_EVAL":"PTV_Chestwall_R_Eval","trachea":"Trachea","hum_head_r":"Humeral
Head_R","Bolus_ 0 .3 cm ': ' Bolus_03 ', ' IDL 50 perc CW ': ' IDL 50
_Chestwall ', ' surgical clips ': ' Clips_Surgical ', ' CW_r CTV ': '
CTV_Chestwall_R ', ' carina ': ' carina ', ' liver ': ' Liver ', '
chestwall_liver ': 肝脏":"Chestwall_Liver","IDL 50 p CW_flash":"IDL 50
_Chestwall_Flash ","SCF_r LN CTV":"CTV_LN_Sclav_R","IDL 50 perc SC":"IDL 50
_Spinal Cord","Couch Surface":"Couch Surface","Couch Interior":"Couch
Interior"}。

## re - labeling
正文 -------- > 身体
SCF_r LN PTV -------- > PTV_LN_Sclav_R
lung_l -------- > 肺_L
lung_r -------- > 肺_R
疤痕线 -------- > FD_Scar
药线 -------- > FD_Med
纬线 -------- > FD_Lat
脊髓 -------- >脊髓 食管 --------
>食道 心脏 -------- >心脏
肺_总计 -------- > 肺部 甲状
腺 -------- >Glnd_Thyroid body - ptv-------
- >身体 - PTV
CW_r PTV -------- > PTV_Chestwall_R
CW_r PTV_EVAL -------- >PTV_Chestwall_R_Eval 气管 -

23
用 GPT-4 进行结构重标记

------- >气管

24
用 GPT-4 进行结构重标记

hum_head_r -------- > 肱骨头_R


注射器_ 0 .3 厘米 -------- > Bolus_ 03
IDL 50 perc CW -------- > IDL 50 _胸壁手术
夹 -------- > Clips_Surgical CW_r CTV
-------- > CTV_Chestwall_R
carina -------- >Carina
x body_con 0 .3 GPT 未考虑 - 4... 不变 x Scar exp 2 cm
GPT 未考虑 - 4... 不变 肝脏 -------- >肝
胸墙_肝 -------- > 胸墙_肝脏
x body_exp 0 .5 GPT 未考虑 - 4... 不变
x GPT 未考虑的身体外疤痕 - 4... 不变 x GPT 未考虑的皮肤外疤痕
- 4... 不变
x GPT 未考虑的工件 - 4... 不变
IDL 50 p CW_flash -------- > IDL 50 _胸墙闪光灯
SCF_r LN CTV - -------------> CTV_LN_Sclav_R
IDL 50 perc SC - -------------> IDL 50 _脊髓
沙发表面 - -------------> 沙发表面
沙发内饰 - -------------> 沙发内饰

参考资料

[1] Ali Haidar、Matthew Field、Vikneswary Batumalai、Kirrily Cloak、Daniel Al Mouiee、

Phillip Chlap、Xiaoshui Huang、Vicky Chin、Farhannah Aly、Martin Carolan、Jonathan Sykes

、Shalini K. Vinod、Geoffrey P. Delaney 和 Lois Holloway。Vinod、Geoffrey P. Delaney 和

Lois Holloway。乳腺放射治疗结构标准化 命名惯例:机器学习方法。Cancers, 15(3),


2023.

[2] Thilo Schuler、John Kipritidis、Thomas Eade、George Hruby、Andrew Kneebone、Mario

Perez、Kylie Grimberg、Kylie Richardson、Sally Evill、Brooke Evans 和 Blanca Gallego。

放射肿瘤学的大数据准备:在真实世界数据集中用 tg-263 标准名称重新标记放射治疗结

构的有效方法。放射肿瘤学进展》, 4(1):191-200,2019。

[3] William C. Sleeman IV, Joseph Nalluri, Khajamoinuddin Syed, Preetam Ghosh, Bartosz
Krawczyk, Michael Hagan, Jatinder Palta, and Rishabh Kapoor.用机器学习方法将任意

Dicom结构集重新标记为Tg-263定义的标签。生物医学 信息学杂志》,109:103527,

2020 年。

[4] David Livermore、Thomas Trappenberg 和 Alasdair Syme。Tg-263不兼容数据库中轮廓分

类的机器学习。应用临床医学物理学杂志》, 23(9):e13662,2022。

25
用 GPT-4 进行结构重标记

[5] Khajamoinuddin Syed、William Sleeman IV、Kevin Ivey、Michael Hagan、Jatinder Palta、

Rishabh Kapoor 和 Preetam Ghosh。整合自然语言处理和机器学习 模型,实现放疗结构名

称标准化。医疗保健》,8(2),2020 年。

[6] Priyankar Bose、Pratip Rana、William C. Sleeman、Sriram Srinivasan、Rishabh Kapoor、

Jatinder Palta 和 Preetam Ghosh。图像和文本数据的多模态深度学习方法预测放疗结构名

称。BioMedInformatics, 3(3):493-513, 2023.

26
用 GPT-4 进行结构重标记

[7] Tanya Kairn 和 Scott B Crowe.乳腺放射治疗计划的回顾性分析:策划'非策划'》。医学影

像与放射肿瘤学杂志》,63(4):517-529, 2019。

[8] 亚历克西斯-安德鲁-米勒放射肿瘤规划中轮廓和体积标准化命名的合理信息化方法。放射

肿瘤信息学杂志》(Journal of Radiation Oncology Informatics), 6(1):53-97,2017年


10月。

[9] Amanda Caissie、Michelle Mierzwa、Clifton David Fuller、Murali Rajaraman、Alex Lin、

Andrew MacDonald、Richard Popple、Ying Xiao、Lisanne VanDijk、Peter Balter、Helen

Fong 、 Heping Xu 、 Matthew Kovoor 、 Joonsang Lee 、 Arvind Rao 、 Mary Martel 、 Reid

Thompson、Brandon Merz、John Yao 和 Charles Mayo。头颈部放射治疗实践变异模式被

确定为现实世界大数据的挑战:多中心大数据聚合(Lambda)联盟分析学习的结果。放

射肿瘤学进展》(Advances in Radiation Oncology),8(1):100925,2023。

[10] Tufve Nyholm, Caroline Olsson, Måns Agrup, Peter Björk, Thomas Björk-Eriksson, Giovanna
Gagliardi, Hanne Grinaker, Adalsteinn Gunnlaugsson, Anders Gustafsson, Magnus Gustafsson,
Bengt Johansson、Stefan Johnsson、Magnus Karlsson、Ingrid Kristensen、Per Nilsson、Leif

Nyström、Eva Onjukka、Johan Reizenstein、Johan Skönevik、Karin Söderström、Alexander

Valdman、Björn Zackrisson 和 Anders Montelius。瑞典自动收集标准化和基于人口的放射

治疗数据的全国性方法。放射治疗和 肿瘤学》,119(2):344-350,2016 年。

[11] Tanya Kairn、SB Crowe、CM Langton 和 JV Trapp。乳腺癌放射治疗计划的批量评估和比

较。 医学中的澳大利亚物理与工程科学》,39:633-644,2016。

[12] Sang Ho Lee, Huaizhi Geng, and Ying Xiao.国家癌症研究所临床试验网络中的放疗标准

化和人工智能。临床肿瘤学》, 34(2):128-134,2022。

[13] Rex A.Cardan, Elizabeth L. Covington, and Richard A. Popple.技术说明:改善 tg-263 合规性

的 开 源 解 决 方 案 。 应 用 临 床 医 学 物 理 学 杂 志 》 ( Journal of Applied Clinical Medical

Physics), 20(9):163-165,2019。

[14] 郑万佳、麦秀英、游奕琪、黄思娟、陶雅兰、池峰、曹新平、林成光、黄晓燕、杨昕。

宫颈癌放疗术语标准化。中华放射肿瘤学杂志》,第180-185页,2021年。

[15] M.Feng、G. Valdes、N. Dixit 和 T. D. Solberg。放射肿瘤学中的机器学习:机遇、要求和需求

。Front Oncol, 8:110, 2018.2234-943x Feng, Mary Valdes, Gilmer Dixit, Nayha Solberg, Timothy

27
用 GPT-4 进行结构重标记

D Journal Article Switzerland 2018/05/03 Front Oncol.2018 Apr 17;8:110. doi:


10.3389/fonc.2018.00110. eCollection 2018.

[16] 杨 云 泽 、 Olivia M Muller 、 Satomi Shiraishi 、 Matthew Harper 、 Adam C Amundson 、

William W Wong、Lisa A McGee、Jean-Claude M Rwigema、Steven E Schild、Martin Bues

等。铅笔束扫描质子疗法(ppspt)治疗头颈部癌症患者下颌骨骨坏死(orn)的经验性相

对生物学效应(rbe):一项 的回顾性病例匹配队列研究。 肿瘤学前沿》 ,12:843175,

2022。

[17] Y Yang, Samir H Patel, J Bridhikitti, William W Wong, Michele Y Halyard, LA McGee,
JC Rwigema, Steven Eric Schild, SA Vora, T Liu, et al.

28
用 GPT-4 进行结构重标记

采用强度调制质子疗法(IPT)治疗的头颈部癌症患者不良反应区的线性能量转移(

LET)效应。International journal of radiation oncology, biology, physics, 111(3):e388, 2021.

[18] 杨云泽、Carlos E Vargas、Ronik S Bhangoo、William W Wong、Steven E Schild、Thomas B

Daniels、Sameer R Keole、Jean-Claude M Rwigema、Jennifer L Glass、沈家健等。剂量线性能

量转移(let)体积直方图(dlvh)用于强度调制质子治疗(impt)不良事件研究的探索性研究

。国际放射肿瘤学*生物学*物理学杂志》( Radiation Oncology* Biology* Physics),110(4

):1189-1199,2021年。

[19] Y Yu Nathan、Todd A DeWees、Molly M Voss、William G Breen、Jennifer S Chiang、Julia

X Ding、Thomas B Daniels、Dawn Owen、Kenneth R Olivier、Yolanda I Garces等。强度调

制质子疗法(impt)与强度调制放射 (imrt)治疗Ⅲ期非小细胞肺癌后的心肺毒性。临

床肺癌》,2022 年。

[20] Y Yu Nathan、Todd A DeWees、Chenbin Liu、Thomas B Daniels、Jonathan B Ashman、

Staci E Beamer、Dawn E Jaroszewski、Helen J Ross、Harshita R Paripati、Jean-Claude M

Rwigema 等.局部晚期非小细胞肺癌患者接受强度调制质子疗法与强度调制放疗的早期疗

效:Mayo 诊所经验.放射肿 瘤 学 进 展 , 5 ( 3 ) :450-420, 2020.放射肿瘤学进展》,5(3)

:450-458,2020 年。

[21] Ronik S Bhangoo、Todd A DeWees、Y Yu Nathan、Julia X Ding、Chenbin Liu、Michael A

Golafshar、William G Rule、Sujay A Vora、Helen J Ross、Daniel H Ahn等。强度调制质

子束放疗或强度调制光子放疗治疗食管癌后的急性毒性和短期患者预后:马约诊所 。放

射肿瘤学进展》,5(5):871-879,2020 年。

[22] Ronik S Bhangoo 、 Trey C Mullikin 、 Jonathan B Ashman 、 Tiffany W Cheng 、 Michael A

Golafshar、Todd A DeWees、Jedediah E Johnson、Satomi Shiraishi、Wei Liu、Yanle Hu, et

al.《肝细胞癌的强度调制质子疗法:初步临床经验》。 放射肿瘤学进展》 ,6(4):

100675,2021。

[23] Elizabeth Huynh, Ahmed Hosny, Christian Guthier, Danielle S. Bitterman, Steven F. Petit,
Daphne A. Haas-Kogan, Benjamin Kann, Hugo J. W. L. Aerts, and Raymond H. Mak.放射肿瘤

学中的人工 智能。自然-临床肿瘤学评论》,17(12):771-781,2020 年。

[24] Lian Zhang, Jason M Holmes, Zhengliang Liu, Sujay A Vora, Terence T Sio, Carlos E Vargas,

29
用 GPT-4 进行结构重标记

Nathan Y Yu, Sameer R Keole, Steven E Schild, Martin Bues, et al. Beam mask and sliding
window-facilitated deep learning-based accurate and efficient dose prediction for pencil beam
scanning proton therapy. arXiv preprint arXiv:2305.18572, 2023.

[25] Y Ding、Z Liu、H Feng、J Holmes、Y Yang、N Yu、T Sio、S Schild、B Li 和 W Liu

。基于深度神经网络的肺癌精确高效可变形图像配准方法。医学物理学》第 49 卷第

E148-E148 页。Wiley 111 River St, Hoboken 07030-5774, NJ USA, 2022.

[26] Anjali Balagopal、Howard Morgan、Michael Dohopolski、Ramsey Timmerman、Jie Shan、

Daniel F Heitjan、Wei Liu、Dan Nguyen、Raquibul Hannan、Aurelie Garant 等:Psa-net:

基于深度学习的医生风格感知分割网络,用于前列腺癌术后临床 目标体积。医学人工智

能》,121:102195,2021。

[27] Saed Rezayi、Haixing Dai、Zhengliang Liu、Zihao Wu、Akarsh Hebbar、Andrew H Burns

、Lin Zhao、Dajiang Zhu、Quanzheng Li、Wei Liu 等 Clinicalradiobert: Knowledge-infused


few.

30
用 GPT-4 进行结构重标记

临 床 笔 记 命 名 实 体 识 别 的 拍 摄 学 习 。 In Machine Learning in Medical Imaging: 13th


International Workshop, MLMI 2022, Held in Conjunction with MICCAI 2022, Singapore,
September 18, 2022, Proceedings, pages 269-278.Springer, 2022.

[28] 廖文雄、刘正良、戴海星、吴子豪、张逸阳、黄晓珂、陈裕忠、蒋曦、朱大江、刘天明

等:用于少量文本 分类的掩码引导伯特算法。arXiv 预印本 arXiv:2302.10447, 2023。

[29] Jason Holmes 、 Zhengliang Liu 、 Lian Zhang 、 Yuzhen Ding 、 Terence T. Sio 、 Lisa A.

McGee、Jonathan B. Ashman、Xiang Li、Tianming Liu、Jiajian Shen 和 Wei Liu。评估肿

瘤放射物理学这一高度专业化主题的大型语言模型。肿瘤学前沿》, 13, 2023.

[30] Zhengliang Liu, Peilong Wang, Yiwei Li, Jason Holmes, Peng Shu, Lian Zhang, Chenbin Liu,
Ninghao Liu, Dajiang Zhu, Xiang Li, et al. Radonc-gpt:用于放射 肿瘤学的大型语言模型。
arXiv preprint arXiv:2309.10160, 2023.
[31] Lian Zhang, Zhengliang Liu, Lu Zhang, Zihao Wu, Xiaowei Yu, Jason Holmes, Hongying Feng,
Haixing Dai, Xiang Li, Quanzheng Li, et al. Segment anything model (Sam) for radiation
oncology. arXiv preprint arXiv:2306.11730, 2023.

[32] Deid-gpt: gpt-4. arXiv preprint arXiv:2303.11032, 2023.

[33] Haixing Dai, Zhengliang Liu, Wenxiong Liao, Xiaoke Huang, Zihao Wu, Lin Zhao, Wei Liu,
Ninghao Liu, Sheng Li, Dajiang Zhu, et al. Chataug : Leveraging chatgpt for text data
augmentation. arXiv preprint arXiv:2302.13007, 2023.

[34] 吴子豪、张璐、曹超、于晓伟、戴海星、马冲、刘正良、赵林、李刚、刘伟等:探索权

衡:针对高度特异性放射学 NLI 任务的统一大语言模型与本地 微调模型。arXiv preprint


arXiv:2304.09138, 2023.
[35] Charles S. Mayo, Mary U. Feng, Kristy K. Brock, Randi Kudner, Peter Balter, Jeffrey C.
Buchsbaum, Amanda Caissie, Elizabeth Covington, Emily C. Daugherty, Andre L. Dekker,
Clifton D. Fuller, Anneka L. Hallstrom, David S.Hong, Julian C. Hong, Sophia C. Kamran, Eva
Katsoulakis, John Kildea, Andra V. Krauze, Jon J. Kruse, Tod McNutt, Michelle Mierzwa, Amy
Moreno, Jatinder R. Palta, Richard Popple, Thomas G. Purdie, Susan Richardson, Gregory C.
Sharp, Shiraishi Sat.Sharp, Shiraishi Satomi, Lawrence R. Tarbox, Aradhana M. Venkatesan,
Alon Witztum, Kelly E. Woods, Yuan Yao, Keyvan Farahani, Sanjay Aneja, Peter E. Gabriel,
Lubomire Hadjiiski, Dan Ruan, Jeffrey H. Siewerdsen, Steven H. Siewerdsen.Siewerdsen,
Steven Bratt, Michelle Casagni, Su Chen, John C. Christodouleas, Anthony DiDonato, James
Hayman, Rishhab Kapoor, Saul Kravitz, Sharon Sebastian, Martin Von Siebenthal, Walter
Bosch, Coen Hurkmans, Sue S. Yom, and Ying Xiao.肿瘤学操作本体论(o3):基于专业协

会、多方利益相关者、共识驱动的信息学标准,支持临床和研究使用来自接受 治疗的癌

症患者的真实世界数据。国际放射肿瘤学*生物学*物理学杂志》,117(3):533-550,

2023。

31
用 GPT-4 进行结构重标记

[36] Charles S. Mayo, Jean M. Moran, Walter Bosch, Ying Xiao, Todd McNutt, Richard Popple, Jeff
Michalski, Mary Feng, Lawrence B. Marks, Clifton D. Fuller, Ellen Yorke, Jatinder Palta, Peter
E. Gabriel, Andrea Molineu, Martha M. Matuszak, Elizabeth Covington, Kathryn Masi, Susan
L. Richardson, Timothy Ritter, Tomasz Morgas, Stella Flampouri, Lakshmi
Santanam.Matuszak, Elizabeth Covington, Kathryn Masi, Susan L. Richardson, Timothy Ritter,
Tomasz Morgas, Stella Flampouri, Lakshmi Santanam, Joseph A. Moore, Thomas G. Purdie,
Robert C. Miller, Coen Hurkmans, Judy Adams, Qing-

32
用 GPT-4 进行结构重标记

Rong Jackie Wu 、 Colleen J. Fox 、 Ramon Alfredo Siochi 、 Norman L. Brown 、 Wilko

Verbakel、Yves Archambault、Steven J. Chmura、Andre L. Dekker、Don G. Eagle、Thomas

J. Fitzgerald 、 Theodore Hong 、 Rishabh Kapoor 、 Beth Lansing 、 Shruti Jolly 、 Mary E.

Napolitano 、 James Percy 、 Mark S. Rose 、 Salim Siddiqui 、 Christof Schadt 、 William E.

Simon 、 William L. Straube 、 Sara T. St.Napolitano, James Percy, Mark S. Rose, Salim
Siddiqui, Christof Schadt, William E. Simon, William L. Straube, Sara T. St. James, Kenneth
Ulin, Sue S. Yom, and Torunn I. Yock.美国医学物理学家协会第 263 工作组:放射肿瘤学术

语标准化。International Journal of Radiation Oncology*Biology*Physics, 100(4):1057-1066,


2018.

[37] OpenAI.Gpt-4 技术报告,2023 年。

[38] Yixing Huang、Ahmed Gomaa、Sabine Semrau、Marlen Haderlein、Sebastian Lettmaier、

Thomas Weissmann、Johanna Grigo、Hassen Ben Tkhayat、Benjamin Frey、Udo Gaipl 等。

在放射肿瘤学在训考试和红色期刊灰色区域病例上标注 chatgpt-4:放射 肿瘤学人工智能

辅助医学教育和决策的潜力与挑战。肿瘤学前沿》,13:1265024,2023。

[39] Jason Holmes, Zhengliang Liu, Lian Zhang, Yuzhen Ding, Terence T Sio, Lisa A McGee,
Jonathan B Ashman, Xiang Li, Tianming Liu, Jiajian Shen, et al. Evaluating large language
mod- els on a highly-specialized topic, radiation oncology physics. ArXiv preprint
arXiv:2304.01938, 2023.
[40] Chenbin Liu, Zhengliang Liu, Jason Holmes, Lu Zhang, Lian Zhang, Yuzhen Ding, Peng Shu,
Zihao Wu, Haixing Dai, Yiwei Li, Dinggang Shen, Ninghao Liu, Quanzheng Li, Xiang Li,
Dajiang Zhu, Tianming Liu, and Wei Liu.放射肿瘤学人工通用智能, 2023。

[41] 迈克尔-R-沃特斯(Michael R Waters)、桑杰-阿内贾(Sanjay Aneja)和朱利安-C-洪(Julian

C Hong)。释放 chatgpt、人工智能和大型语言模型的力量:给放射肿瘤学家的实用建议》。

实用 放射肿瘤学》,2023 年。

[42] Takeshi Kojima, Shixiang (Shane) Gu, Machel Reid, Yutaka Matsuo, and Yusuke Iwasawa.大

语言模型是零射推理器。In S. Koyejo, S. Mohamed, A. Agarwal, D. Belgrave、


K.Cho, and A. Oh, editors, Advances in Neural Information Processing Systems, volume 35,
pages 22199-22213.Curran Associates, Inc.,2022 年。

[43] Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian ichter, Fei Xia, Ed Chi,
Quoc V Le, and Denny Zhou.大型语言模型中的思维链提示推理。S. Koyejo、S. Mohamed

、A. Agarwal、D. Belgrave、K. Cho 和 A. Oh 编辑的《神经信息处理系统进展》第 35 卷

33
用 GPT-4 进行结构重标记

第 24824-24837 页。Curran Associates, Inc., 2022.

34

You might also like