-
公开(公告)号:CN112860903B
公开(公告)日:2022-02-22
申请号:CN202110366544.X
申请日:2021-04-06
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/36 , G06F40/205 , G06F40/30
Abstract: 一种融入约束信息的远程监督关系抽取方法,涉及自然语言处理技术领域,为了解决基于远程监督的关系抽取中所出现的标签噪声问题和长尾关系问题,采用本申请提出的关系抽取方法,可以通过引入实体类型信息和关系约束信息来丰富关系抽取模型的背景知识,从而有效增强关系抽取模型在噪声环境下的鲁棒性和准确率;另外还可以利用GCN的邻居聚合机制,促进信息在数据丰富的头部关系和数据匮乏的长尾关系之间的传播,从而增强长尾关系的表示学习。本申请能够充分利用约束图中的信息,同时解决远程监督关系抽取中的标签噪声问题和长尾关系问题。
-
公开(公告)号:CN113139067A
公开(公告)日:2021-07-20
申请号:CN202110475715.2
申请日:2021-04-29
Applicant: 哈尔滨工业大学
Abstract: 一种基于Point Set Registration的医学本体对齐方法,本发明涉及医学本体对齐方法。本发明的目的是为了解决现有医学知识图谱融合的准确率低,数据匹配精度差,数据处理量大的问题。过程为:一、得到概念的向量表示;二、建立混合高斯模型;三、得到变换关系;四、将向量表示通过变换关系映射到同一向量空间中;五、在该向量空间中,对于一组医学本体中的某一个概念,在该概念对应的嵌入后向量的给定阈值半径内,若存在另一组医学本体中的概念的嵌入后向量,则这两组医学本体对象存在对齐关系;六、判断是否出现新的对齐,若是则利用新的对齐关系生成新的三元组正例,执行一;若否输出结果。本发明用于医学知识图谱领域。
-
公开(公告)号:CN110049052A
公开(公告)日:2019-07-23
申请号:CN201910327562.X
申请日:2019-04-23
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于DOM树的标签及属性相似性的恶意域名检测方法,其解决了现有恶意域名检测方法检测率低、准确性差的技术问题。该方法包括:采集恶意类型域名集,将恶意域名集转化成二进制串存入数据库;将未知类型的域名转化为二进制串;将未知类型域名对应的二进制串与数据库中恶意类型域名集的二进制串对比,通过二者相似度来判断该未知类型域名的恶意性。本发明可广泛应用于网络安全系统中。
-
公开(公告)号:CN112860904A
公开(公告)日:2021-05-28
申请号:CN202110367973.9
申请日:2021-04-06
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/36 , G06F40/205 , G06F40/30
Abstract: 一种融入外部知识的生物医疗关系抽取方法,涉及自然语言处理技术领域,针对远程监督技术的训练数据存在噪声干扰的问题,本申请提出的生物医疗实体关系抽取方法,更为充分的利用句子间和句子内部丰富的语义信息和结构信息以及生物医疗实体在外部知识库中的信息,降低数据集中存在的噪声干扰,使得模型更为稳定,能得到更为准确的关系预测。
-
公开(公告)号:CN109361575A
公开(公告)日:2019-02-19
申请号:CN201811563066.6
申请日:2018-12-20
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种获取分析DNS流量数据的方法及其系统,其解决了现有方法分析web网页性能和服务使用情况的准确度的技术问题,其包括以下步骤:A.获取网页首次加载过程中的DNS流量数据;B.将步骤A中获取的DNS流量数据进行清洗处理,分别进行域名数量统计、DNS解析时间统计和资源记录分类统计;C.根据步骤B中域名数量统计和DNS解析时间统计分析网页性能;D.根据步骤B中资源记录分类统计分析网页资源的服务器地理位置、IP运营商的分布情况和网页使用CDN服务情况。本发明同时提供了其系统。本发明可广泛应用于互联网数据获取与分析领域。
-
公开(公告)号:CN112860904B
公开(公告)日:2022-02-22
申请号:CN202110367973.9
申请日:2021-04-06
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/36 , G06F40/205 , G06F40/30
Abstract: 一种融入外部知识的生物医疗关系抽取方法,涉及自然语言处理技术领域,针对远程监督技术的训练数据存在噪声干扰的问题,本申请提出的生物医疗实体关系抽取方法,更为充分的利用句子间和句子内部丰富的语义信息和结构信息以及生物医疗实体在外部知识库中的信息,降低数据集中存在的噪声干扰,使得模型更为稳定,能得到更为准确的关系预测。
-
公开(公告)号:CN112860903A
公开(公告)日:2021-05-28
申请号:CN202110366544.X
申请日:2021-04-06
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/36 , G06F40/205 , G06F40/30
Abstract: 一种融入约束信息的远程监督关系抽取方法,涉及自然语言处理技术领域,为了解决基于远程监督的关系抽取中所出现的标签噪声问题和长尾关系问题,采用本申请提出的关系抽取方法,可以通过引入实体类型信息和关系约束信息来丰富关系抽取模型的背景知识,从而有效增强关系抽取模型在噪声环境下的鲁棒性和准确率;另外还可以利用GCN的邻居聚合机制,促进信息在数据丰富的头部关系和数据匮乏的长尾关系之间的传播,从而增强长尾关系的表示学习。本申请能够充分利用约束图中的信息,同时解决远程监督关系抽取中的标签噪声问题和长尾关系问题。
-
-
-
-
-
-