一种面向领域实体关系联合抽取的语料标注方法及系统

    公开(公告)号:CN112149423B

    公开(公告)日:2024-01-26

    申请号:CN202011108388.9

    申请日:2020-10-16

    Abstract: 本发明共公开一种面向领域实体关系联合抽取的语料标注方法及系统,方法包括:利用scrapy爬虫框架从网页爬取符合条件的初始数据;利用正则表达式对所述初始数据进行预处理,获得无噪声文本数据;根据领域语料特征定义实体间的关系集合;利用YEDDA文本标注工具,根据所述关系集合对所述无噪声文本数据进行标注,获得标注数据。采用本发明公开的方法能够简化实体和关系的标注流程,提升标注效率,实现实体关系的联合抽取以及重叠关系的抽取,同时还能有效避免采用流水线方法提取实体和关系过程中存在的错误传播、信息丢失和实体冗余等问题。(56)对比文件昝红英等.面向医学文本的实体关系抽取研究综述.郑州大学学报(理学版).2020,第52卷(第4期),第1页-15页.吴小龙等.基于等价压缩快速聚类的Web表格知识抽取.中文信息学报.2019,第33卷(第4期),第75页-84页.Jizhi Chen等.Jointly Extract Entitiesand Their Relations From BiomedicalText.IEEE.2019,第7卷第162818页-162827页.黄培馨;赵翔;方阳;朱慧明;肖卫东.融合对抗训练的端到端知识三元组联合抽取.计算机研究与发展.2019,第56卷(第12期),第2536页-2548页.

    奶牛跛行检测方法、装置、设备及存储介质

    公开(公告)号:CN116524591A

    公开(公告)日:2023-08-01

    申请号:CN202310369826.4

    申请日:2023-04-07

    Abstract: 本发明涉及养殖信息化技术领域,提供一种奶牛跛行检测方法、装置、设备及存储介质,所述方法包括:获取包含待检测奶牛完整身体轮廓的目标图像;基于目标图像确定待检测奶牛的身体关键点;所述身体关键点包括与跛行相关的多个身体部位对应的点;获取身体关键点在各目标图像中的位置坐标,并根据所述位置坐标提取待检测奶牛的跛行特征;所述跛行特征包括背部曲率、头颈部斜率、步态特征和头部摆动幅度;根据跛行特征检测待检测奶牛的跛行程度。通过关键点检测提取奶牛不同身体部位的跛行特征,全面获取奶牛的跛行参数进行跛行检测,可以减少误检漏检的情况,提高对奶牛轻度跛行的检测准确性,并且可以降低检测成本、提高检测效率和泛化能力。

    一种科技研究热点主题预测方法

    公开(公告)号:CN112650847B

    公开(公告)日:2023-05-09

    申请号:CN201910961978.7

    申请日:2019-10-11

    Abstract: 本发明公开一种科技研究热点主题预测方法,根据与待测主题相关的科技研究主题词表对学科文献进行预处理,得到对应年份的分词文档,并将分词文档转换为二进制向量矩阵;利用频繁项集挖掘算法对二进制向量矩阵进行处理,得到频繁主题集合;对频繁主题集合进行过滤,得到热点主题集合;将热点主题集合转换为时序序列数据,根据时序序列数据,训练多个预测模型,并利用加权处理方法得到主题预测模型;根据主题预测模型预测待测主题出现的频率。本发明文采用基于领域主题词表的词语过滤,较为完善的归纳了科技研究领域特性,采用频繁项集算法对科技研究领域的热点主题进行识别,能够准确地预测未来时间内的热点主题。

    一种科技研究热点主题预测方法

    公开(公告)号:CN112650847A

    公开(公告)日:2021-04-13

    申请号:CN201910961978.7

    申请日:2019-10-11

    Abstract: 本发明公开一种科技研究热点主题预测方法,根据与待测主题相关的科技研究主题词表对学科文献进行预处理,得到对应年份的分词文档,并将分词文档转换为二进制向量矩阵;利用频繁项集挖掘算法对二进制向量矩阵进行处理,得到频繁主题集合;对频繁主题集合进行过滤,得到热点主题集合;将热点主题集合转换为时序序列数据,根据时序序列数据,训练多个预测模型,并利用加权处理方法得到主题预测模型;根据主题预测模型预测待测主题出现的频率。本发明文采用基于领域主题词表的词语过滤,较为完善的归纳了科技研究领域特性,采用频繁项集算法对科技研究领域的热点主题进行识别,能够准确地预测未来时间内的热点主题。

Patent Agency Ranking