面向多结构化数据的中医知识标注方法及系统

    公开(公告)号:CN116010624A

    公开(公告)日:2023-04-25

    申请号:CN202310088042.4

    申请日:2023-02-09

    Abstract: 本发明公开一种面向多结构化数据的中医知识标注方法及系统,所述方法包括:根据文本数据类型的不同分为结构化数据、非结构化数据和半结构化数据,当所述文本数据是非结构化数据或半结构化数据时,确定标注规范文本,所述标注规范文本可以通过参考选取抽象的有概括意义的正向或反向的标注例子降低错误率,基于所述标注规范文本,随机抽取n条文本数据由不同的用户进行标注,计算各个用户标注后的文本数据的一致性,当一致性的数值达到预设的阈值时,更新标注规范文本,当一致性的数值未达到预设的阈值,多用户进行讨论后,形成标注一致的文本数据,并更新标注规范文本,基于更新后的标注规范文本对所有的文本数据进行标注。本发明对文本数据的标注更加准确。

    中医知识图谱构建方法、装置、电子设备及存储介质

    公开(公告)号:CN116383396A

    公开(公告)日:2023-07-04

    申请号:CN202310088044.3

    申请日:2023-02-09

    Abstract: 本发明公开了一种中医知识图谱构建方法、装置、电子设备及存储介质。方法包括基于数据集的数据特征确定待抽取实体以及待抽取的实体间关系;基于待抽取实体和待抽取的实体间关系多次对数据集进行实体抽取和关系抽取,针对多次抽取得到的实体和实体关系,选取抽象的具有概括意义的正面或负面例子来构建中医知识图谱指南;参考中医知识图谱指南,为数据集迭代进行实体抽取和关系抽取提高了抽取的效率,并在多次迭代过程中更新中医知识图谱指南;在迭代抽取过程中,计算标注一致性值,若标注一致性值达到预设阈值,则停止迭代,开始正式抽取实体和实体间关系,从而构建中医知识图谱。该方法可以有效地解决中医知识实体和关系的认知统一问题,提高多人协同交互抽取实体和实体关系的一致性。

Patent Agency Ranking