OMAHA开放医疗与健康联盟,欢迎您!

OMAHA专栏

深入剖析,医学术语在ICD编码中的应用

不久前 OMAHA 曾给大家分享 ICD 编码相关的文章,大家反响强烈,我们收到了很多的留言,大家希望能更深入了解 ICD 编码小程序详细的编码推荐过程,所以本篇将对术语库在 ICD 编码过程中如何应用进行深入的讲解。

之前我们已经介绍了,目前编码人员编码方法主要分为三步:

1)确定主导词

2)依据索引查找编码

3)核对编码

其中,主导词的确定是操作环节中最重要的一步,比如疾病诊断主导词的选择主要依据是疾病的发病机制、发病部位、病理改变和临床表现;手术操作主导词的选择主要是依据手术操作的术式、部位、入路、疾病性质。

在这个过程中,编码人员需要丰富的临床知识和编码思维,所以说主导词的确定也是最为困难的一步。确定主导词之后,同样需要编码员非常熟悉 ICD 各卷结构及编码规则,才能结合使用并得到正确的编码。

术语集应用于ICD编码的流程

从以上编码的流程可看出,编码不仅需要懂得 ICD 编码的分类规则,还需要丰富的临床医学和医技知识。基于这样的情况,OMAHA 深入探索了是否可以通过医学术语集的应用来更好的帮助编码人员进行编码。

我们得到的结论是,首先让计算机根据医生下的诊断去识别疾病,疾病的各种同义词,以及相应的属性关系,比如病因、发病部位、症状、形态学改变等;然后再让计算机结合 ICD 编码本身的分类规则进行编码推荐并进行优先级排序;最终由编码员去选择最合适编码。

这样的处理方法很好的提高了编码员的编码效率,可以改善目前普遍存在的 ICD 编码效率低、质量不佳的现状。详细流程如下: 

image.png

原型化处理及分词

对疾病诊断名称进行原型化处理,主要是将诊断名称英文、数字、符合等进行统一处理,比如大小写全部转换成小写,去掉无用符号(如空格、结尾句号等)。再根据已经构建好的原子词词典,对诊断名称进行分词处理。

术语及概念匹配

基于 OMAHA 中文医学术语集,通过分词算法将输入的诊断名称结果与术语集中词汇进行文本匹配,得到一个或多个对应的概念,并记录对应文本相似度。若在实际临床应用中,也可以通过获取病历中更多的信息,辅助进行更精确的概念对应。以输入的诊断名称“妊娠 胆汁淤积”为例,如下:

image.png

 基于 ICD 规则和术语关系网的推理

通过两边得到的输入得到的一个或多个概念,从 OMAHA 中文医学术语集中获取概念的语义关系(如上位概念、病因、发病部位、形态学改变等),再使用自然语言处理的方法,简单树匹配、计算最短路径的初步推理的备选结果,再结合 ICD 本身的编码分类规则,进一步对推荐结果进行筛选。

image.png

生成候选 ICD 和排序

最后根据术语匹配和编码推理推荐时的相关参数,并结合 ICD 编码实际应用场景对 ICD 编码推荐结果进行排序。若是进行国家标准扩展码转换时,则推荐到国标版六位码;若作为编码分类时,则可以推荐到四位码或六位码。下图是 OMAHA 开发的 ICD 编码小程序的一个搜索展示:

image.png

编码流程难点

在整个编码推荐流程中,主要存在以下四个难点: 

 疾病诊断名称或手术操作名称与术语集概念的匹配效果

OMAHA 正在构建医学领域特殊的原子词词典,并尝试通过不同的分词算法来改进和优化匹配结果。

 ICD 编码推荐的正确率

这取决于如何更好的将概念的语义关系网与 ICD 编码规则、ICD 标准词汇进行结合应用,这需要使用到自然语言处理技术,比如概率统计、因果推断、最短路径算法等方法,以提高推荐的准确度。

中文医学术语集的数量和质量

需要不断丰富中文医学术语集,包括增多临床诊断术语概念、扩充概念的同义词描述、以及丰富概念之间的语义关系网络。所以 OMAHA 正在组织并联合行业各参与方共同来构建和丰富中文医学术语集,并建立起持续的术语维护更新机制,为整个医疗行业提供稳定可靠的医学术语服务。

映射库的构建

OMAHA 也在构建术语集与 ICD 编码之间的映射库,因为术语集是基于本体模式构建的,所以将概念与 ICD 编码构建好映射,将一劳永逸,不管临床上术语的表达如何变化,只需进行术语集的完善,就可以实现编码推荐。

目前 OMAHA 术语与 ICD 编码的的映射主要收录了国外成熟术语体系与 ICD 编码的映射、国内大部分主流版本的 ICD 编码及合作医疗机构的 ICD 内码数据。同时 OMAHA 也在通过人工对机器推荐的编码进行审核,将正确的映射加入到映射库。未来我们将召集志愿者共同完成这部分映射的维护工作,共同搭建中文医学术语集与 ICD 编码之间的桥梁。

可以看出,不管 ICD 编码本身的规则多么复杂,核心还是在于理解疾病,不管临床医生如何表达一个疾病,只要让计算机能正确理解疾病本身,再结合 ICD 编码分类规则或映射库,就可以让计算机进行智能推荐,从而提高编码人员的工作效率和编码质量


文|查裕忠

联系邮箱:yuzhong.zha@omaha.org.cn


在医学术语集构建的路上探索了这么久,这些经验想和大家分享