-
公开(公告)号:CN111723587A
公开(公告)日:2020-09-29
申请号:CN202010578711.2
申请日:2020-06-23
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种面向跨语言知识图谱的汉泰实体对齐方法,其特征在于,包括如下步骤:1)双语数据集获取;2)机器翻译模型构建与训练;3)实体抽取;4)实体翻译与匹配。这种方法可以更加有效,更精确的实现双语实体对齐,解决目前跨语言知识图谱构建实体对齐程度较低的问题。
-
公开(公告)号:CN111339779A
公开(公告)日:2020-06-26
申请号:CN202010199125.7
申请日:2020-03-20
Applicant: 桂林电子科技大学
IPC: G06F40/295
Abstract: 本发明公开了一种用于越南语的命名实体识别方法,其特征在于,包括如下步骤:1)模型训练;2)数据字典构建,所述模型训练包括:1-1)数据输入;1-2)BERT层训练;1-3)GRU层训练;1-4)CRF层训练,所述数据字典构建包括:2-1)数据字典修正;2-2)结果验证。这种方法越南语命名实体识别准确率高。
-