1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/tbyouth-ner-trip

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

@Time : 2021/4/1 0001 13:56

@Author : tb_youth

@FileName : README.md

@Description : NER Project Description

@Blog : https://blog.csdn.net/tb_youth

README


@Daily English

You can overcome anything,if and only if you love something enough.

只要并只有你足够热爱一件事情,你可以克服任何困难。

About

How to use it?

  1. 原仓库:https://gitee.com/tbyouth/ner.git现迁移到:https://gitee.com/tbyouth/ner-trip.git
  2. 参考requirements.txt配置项目所需环境(注意tensorflow版本:linux下和windows下的不一样)
  3. data文件夹下创建一个你的数据集文件夹,你需要把你的数据集中每一个文本处理成一对txt,ann文件,txt存储文本,ann存储标注信息...
  4. NER\config\setting.py下修改配置
  5. NER\preprocess\data_prepare.py中按步骤执行相关操作
  6. ...

Target data set for NER

  • 瑞金医院竞赛数据集
  • 古今名家验案全析.csv
  • 中医脾胃病学核对稿20201110.csv

Information for data set

共计1776条记录

  1. 竞赛数据集语料为:中医药物说明书(1000条)
  2. 古今名家验案全析.csv数据内容大致分布(484条):

id 症状 症状 证候 病因 自诉 null null 症状...

  1. 中医脾胃病学核对稿20201110.csv数据内容大致分布(292条):

id 疾病(诊断,症状) 第一项的别名 证候 临床表现 理法概要 治法 药方

Target entity class for NER

可选类别:症状,脉类,脉象,疾病,病位,病名,病因,症状,治法,方剂,方药,检查, 舌体,舌苔,舌象,器官,身体部位...

本数据集确定的NER目标实体如下:


实体类别 类别标签 举例
方药 FY 桂枝
方剂 FJ 大承气汤
证候 ZH 中焦虚寒证
治法 ZF 清热止痢法
脉象 MX 浮紧浮缓
舌象 SX 唇舌淡红
症状 ZZ 嗳气不适

Other

features for entity

会存在实体嵌套现象

比如:桂枝人参汤,这是一个方剂实体,嵌套了两个方药实体:桂枝,人参;

解决方案

优先标注更长的,其他的可以构成扩充语料? 训练时可以作为扩充语料。 但是预测就会存在问题!!! 一个句子输入只能输出一个序列标注。 嵌套实体NER不是很好解决。 所以目前目标:识别出最长实体就好了,或者嵌套的实体识别出来了也不错。

中医实体较长

比如方剂实体:桂枝去芍加麻附细辛汤;证候实体:虫毒湿热结肤证,小儿痰热蒙闭心窍证;...

不连续,并列实体

治法宜益气健脾、升阳举陷为主,根据食积、痰饮、湿热、瘀血之不同,分别佐以消食、化饮、化湿、通络之法。 治法实体:益气健脾,升阳举陷,消食,化饮,化湿,通络 对其治法应“寓补于消,标本兼顾” 治法实体:寓补于消,标本兼顾

表述多样性,异形同义

有些侯证“xxx证”有时被表述为“xxx”或者“证属xxx” 如:气滞血瘀证 = 气滞血瘀,中气下陷证 = 证属元气虚衰,中气下陷。(并列实体:证属元气虚衰,证属中气下陷) 瘀阻之证:瘀阻证

系统展示

gInzJU.png gInxiT.png gInXd0.png gInOZq.png gInqLn.png

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Исходный репозиторий: https://gitee.com/tbyouth/ner.git перенести в этот репозиторий; Выпускная квалификационная работа: исследование модели распознавания сущностей электронных медицинских карт традиционной китайской медицины; Модель NER: BiLSTM-CRF; На основе архитектуры C/S реализована простая система распознавания сущностей традиционной китай... Развернуть Свернуть
GPL-3.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/tbyouth-ner-trip.git
git@api.gitlife.ru:oschina-mirror/tbyouth-ner-trip.git
oschina-mirror
tbyouth-ner-trip
tbyouth-ner-trip
master