一种面向知识库问答的模板自动生成方法

    公开(公告)号:CN110532358B

    公开(公告)日:2023-08-22

    申请号:CN201910604477.3

    申请日:2019-07-05

    Applicant: 东南大学

    Abstract: 本发明提供的一种面向知识库问答的模板自动生成方法,包括关系词典构建过程,以及根据问题答案对自动生成问题模板和查询模板的过程。其中,关系词典构建过程是在大量语料的基础上,构建将自然语言短语对应到知识库关系的关系词典。根据问题答案对自动生成问题模板和查询模板的过程首先根据问题答案对,从知识库中获得查询图,将自然语言问题与查询图对齐,在对齐的基础上,自动生成问题模板和查询模板。本发明不依赖人工构建模板,能够解决知识库问答的模板自动生成问题,模板生成过程自动、高效,解决了传统人工模板构建方法的模板生成成本高、模板数量有限的问题,便于一系列后继应用(如自然语言知识库问答)的开展。

    一种地理学科领域命名实体识别方法

    公开(公告)号:CN107133220A

    公开(公告)日:2017-09-05

    申请号:CN201710422919.3

    申请日:2017-06-07

    Applicant: 东南大学

    Inventor: 李慧颖 徐飞飞

    Abstract: 本发明公开了一种地理学科领域命名实体识别方法,识别出地理学科核心术语类和地理区域位置类实体,主要包括三个步骤:(1)地理学科领域词典构建,采用新词发现算法无监督地识别出地理学科领域新词。(2)基于条件随机场(CRF)模型和多通道卷积神经网络(MCCNN)模型进行训练与测试。(3)基于规则的方法,纠错和融合模型识别出的实体。本发明采用新词发现算法无监督识别领域新词作为词典,以提高分词效果。从大规模未标注数据中无监督地学习词的语义向量,并综合词的基础特征,作为MCCNN模型的输入特征,避免了手动选取和构建特征。自定义规则融合两种模型的预测结果,纠正识别过程中的错误标记问题。

    一种地理学科领域命名实体识别方法

    公开(公告)号:CN107133220B

    公开(公告)日:2020-11-24

    申请号:CN201710422919.3

    申请日:2017-06-07

    Applicant: 东南大学

    Inventor: 李慧颖 徐飞飞

    Abstract: 本发明公开了一种地理学科领域命名实体识别方法,识别出地理学科核心术语类和地理区域位置类实体,主要包括三个步骤:(1)地理学科领域词典构建,采用新词发现算法无监督地识别出地理学科领域新词。(2)基于条件随机场(CRF)模型和多通道卷积神经网络(MCCNN)模型进行训练与测试。(3)基于规则的方法,纠错和融合模型识别出的实体。本发明采用新词发现算法无监督识别领域新词作为词典,以提高分词效果。从大规模未标注数据中无监督地学习词的语义向量,并综合词的基础特征,作为MCCNN模型的输入特征,避免了手动选取和构建特征。自定义规则融合两种模型的预测结果,纠正识别过程中的错误标记问题。

    一种知识库问答中基于抽象语义表示的实体和关系链接方法

    公开(公告)号:CN116821292A

    公开(公告)日:2023-09-29

    申请号:CN202310729848.7

    申请日:2023-06-19

    Applicant: 东南大学

    Inventor: 戴鑫邦 李慧颖

    Abstract: 本发明公开了一种知识库问答中基于抽象语义表示的实体和关系链接方法,包含两个主要步骤:(1)基于抽象语义表示对自然语言问句中的提及进行实体链接。本发明引入维基百科中的实体及其描述作为外部知识,使用双编码器对知识库中的海量实体进行初步筛选,再使用交叉编码器对问题中的实体提及排序打分,从而确定对应的知识库实体。(2)基于实体链接结果和问句的抽象语义表示,对语义解析图中的关系表示子结构进行关系链接。本发明使用交叉编码器对语义解析图中的关系子结构和候选关系集进行匹配打分排序,随后结合本地字典,利用双编码器选择初步筛选后的知识库关系。通过对编码器的灵活使用,进一步提升了实体链接和关系链接的精准度。

    一种基于树模板的链接数据关键词查询方法

    公开(公告)号:CN109271560A

    公开(公告)日:2019-01-25

    申请号:CN201811033735.9

    申请日:2018-09-05

    Applicant: 东南大学

    Inventor: 李慧颖 司马强

    Abstract: 本发明公开了一种基于树模板的链接数据关键词查询方法,包括:将链接数据转换为D-step树模板并建立索引,在树模板基础上快速查找包括查询关键词的D-step树并生成查询结果。本发明将链接数据划分为若干D-step树,在此基础上创建并索引D-step树模板。D-step树模板对D-step树的内容和结构分开进行索引,内容字符串序列用于快速查找包括查询关键词的D-step树,结构字符串序列用于恢复D-step树结构并生成查询结果。由于本发明在树模板索引基础上实现,不需将查询关键词转换为结构化查询,而是在链接数据上直接构造查询结果并返回。实现了快速查询响应,提高了查询效率。

    城市道路机动车出行起讫点及路径识别方法

    公开(公告)号:CN102708686A

    公开(公告)日:2012-10-03

    申请号:CN201210173527.5

    申请日:2012-05-30

    Applicant: 东南大学

    Abstract: 本发明公开了一种城市道路机动车出行起讫点及路径识别方法。首先根据路网结构和电子警察的整体布局进行交通小区的划分。再在所需获取机动车出行起讫点以及出行路径信息的路段,抽样获取机动车的车牌信息。随后,将该信息输入电子警察后台数据库,通过SQL查询获得机动车在一个时段出行中经过的电子警察所在的交通小区标号以及经过电子警察的时间。最后根据以上信息识别机动车出行起讫点和路径。本发明的有益效果是识别方法简单易行,数据获取准确可靠,几乎不涉及到交通影响,便于大范围、大规模的获取信息和数据,在节省人力、物力成本的同时大大提高了城市交通规划、设计和管理等相关工作的效率。

    一种面向知识库问答的模板自动生成方法

    公开(公告)号:CN110532358A

    公开(公告)日:2019-12-03

    申请号:CN201910604477.3

    申请日:2019-07-05

    Applicant: 东南大学

    Abstract: 本发明提供的一种面向知识库问答的模板自动生成方法,包括关系词典构建过程,以及根据问题答案对自动生成问题模板和查询模板的过程。其中,关系词典构建过程是在大量语料的基础上,构建将自然语言短语对应到知识库关系的关系词典。根据问题答案对自动生成问题模板和查询模板的过程首先根据问题答案对,从知识库中获得查询图,将自然语言问题与查询图对齐,在对齐的基础上,自动生成问题模板和查询模板。本发明不依赖人工构建模板,能够解决知识库问答的模板自动生成问题,模板生成过程自动、高效,解决了传统人工模板构建方法的模板生成成本高、模板数量有限的问题,便于一系列后继应用(如自然语言知识库问答)的开展。

    一种基于多域实体索引的实体链接方法

    公开(公告)号:CN106934020B

    公开(公告)日:2019-04-30

    申请号:CN201710144495.9

    申请日:2017-03-10

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于多域实体索引的实体链接方法,包含两个主要步骤:(1)对知识库中实体建立多域索引。(2)基于多域索引筛选候选实体及利用上下文相似度得分及流行度得分对候选实体重新排序并将实体指称链接到得分最高实体上。本发明不需基于别名词典进行候选实体的查找,而是针对知识库实体的不同属性(关系)分域建立索引,通过对名字域搜索得到与实体指称匹配的候选实体;对于初步筛选出的候选实体,利用其他域索引的信息计算候选实体的上下文得分和流行度得分,对候选实体重新排序并将实体指称链接到得分最高的候选实体上。

    一种基于多域实体索引的实体链接方法

    公开(公告)号:CN106934020A

    公开(公告)日:2017-07-07

    申请号:CN201710144495.9

    申请日:2017-03-10

    Applicant: 东南大学

    CPC classification number: G06F17/30619 G06F17/30734

    Abstract: 本发明公开了一种基于多域实体索引的实体链接方法,包含两个主要步骤:(1)对知识库中实体建立多域索引。(2)基于多域索引筛选候选实体及利用上下文相似度得分及流行度得分对候选实体重新排序并将实体指称链接到得分最高实体上。本发明不需基于别名词典进行候选实体的查找,而是针对知识库实体的不同属性(关系)分域建立索引,通过对名字域搜索得到与实体指称匹配的候选实体;对于初步筛选出的候选实体,利用其他域索引的信息计算候选实体的上下文得分和流行度得分,对候选实体重新排序并将实体指称链接到得分最高的候选实体上。

Patent Agency Ranking