吉首大学学报(自然科学版) ›› 2023, Vol. 44 ›› Issue (5): 28-34.DOI: 10.13438/j.cnki.jdzk.2023.05.004

• 计算机 • 上一篇    下一篇

基于BERT模型的糖尿病在线健康社区命名实体识别

梁宇进,符传山,陈劲松,陈铭,周跃,徐倩   

  1. (1.吉首大学计算机科学与工程学院,湖南 吉首 416000;2.吉首大学医学院,湖南 吉首 416000;3.医学信息研究湖南省普通高等学校重点实验室(中南大学),湖南 长沙 410013)
  • 出版日期:2023-09-25 发布日期:2023-11-21
  • 通讯作者: 徐倩(1980—)女,湖南常德人,吉首大学计算机科学与工程学院讲师,中南大学在读博士,主要从事医学大数据、自然语言处理研究.
  • 基金资助:
    2022年吉首大学大学生创新创业训练计划项目

Named Entity Recognition of Diabetes Online Health Community Based on BERT Model

LIANG Yujin,FU Chuanshan,CHEN Jinsong,CHEN Ming,ZHOU Yue,XU Qian   

  1. (1.School of Computer Science and Engineering,Jishou University,Jishou 416000,Hunan China;2.School of Medicine,Jishou University,Jishou 416000,Hunan China;3.Key Laboratory of Medical Information Research (Central South University),Changsha 410013,China)
  • Online:2023-09-25 Published:2023-11-21

摘要:为了解决糖尿病患者-患者在线健康社区文本实体识别中的内容异质、复杂度高、无法准确理解上下文语义等问题,构建了BERT嵌入BiLSTM-CRF模型,来识别糖尿病社区“甜蜜家园”文本中的疾病、临床表现、药物、检验、身体部位和情绪这6类实体.训练过程中,BERT-BiLSTM-CRF模型的精确率为90.83%,召回率为76.30%,综合评估指标F1达到82.93%,显示出良好的识别效果.

关键词: 糖尿病, 在线健康社区, 命名实体识别, BERT模型

Abstract: To address the issues of heterogeneous content,high complexity,and inability to recognize contextual semantics in diabetic patient-patient online health communities,the BERT-embedded BiLSTM-CRF model is used to recognize six types of entities from the text of the diabetic community "Sweet Home":disease,clinical manifestation,medicine,test,body parts,and emotion.The results demonstrate that the model achieved an accuracy rate of 90.8%,a recall rate of 76%,and a F1 value of 82.8%.The BERT-BiLSTM-CRF model has been shown to be useful for recognition and to serve as a benchmark for more personalized health information and services.

Key words: diabetes mellitus, online health community, named entity recognition, BERT model

公众号 电子书橱 超星期刊 手机浏览 在线QQ