基于信息单元融合的新闻原子事件抽取方法

    公开(公告)号:CN103838870B

    公开(公告)日:2016-09-28

    申请号:CN201410108447.0

    申请日:2014-03-21

    Inventor: 刘茂福 张贺

    Abstract: 本发明涉及一种基于信息单元融合的新闻原子事件抽取方法。其技术方案是:先对新闻正文进行除杂处理,利用自然语言处理软件对新闻标题和除杂处理后的新闻正文进行中文分词、词性标注和命名实体识别处理;再过滤掉词性标注结果中的意向动词、致使动词、言说动词和趋向动词;利用初步融合规则库和信息单元融合规则库对动词过滤后的词性标注结果和命名实体识别结果进行融合;然后利用核心词表和事件抽取规则库对新闻正文的信息单元融合结果进行原子事件抽取。本发明利用信息单元融合的方法能快速地处理新闻语料,对文本长度没有严格限制,能够将新闻正文中的全部原子事件抽取出来,不受事件类型的约束,具有执行效率高和普遍适用性的特点。

    基于信息单元融合的新闻原子事件抽取方法

    公开(公告)号:CN103838870A

    公开(公告)日:2014-06-04

    申请号:CN201410108447.0

    申请日:2014-03-21

    Inventor: 刘茂福 张贺

    CPC classification number: G06F17/30616 G06F17/271

    Abstract: 本发明涉及一种基于信息单元融合的新闻原子事件抽取方法。其技术方案是:先对新闻正文进行除杂处理,利用自然语言处理软件对新闻标题和除杂处理后的新闻正文进行中文分词、词性标注和命名实体识别处理;再过滤掉词性标注结果中的意向动词、致使动词、言说动词和趋向动词;利用初步融合规则库和信息单元融合规则库对动词过滤后的词性标注结果和命名实体识别结果进行融合;然后利用核心词表和事件抽取规则库对新闻正文的信息单元融合结果进行原子事件抽取。本发明利用信息单元融合的方法能快速地处理新闻语料,对文本长度没有严格限制,能够将新闻正文中的全部原子事件抽取出来,不受事件类型的约束,具有执行效率高和普遍适用性的特点。

    基于多重语义增强的金融文档级事件抽取方法及系统

    公开(公告)号:CN119808793A

    公开(公告)日:2025-04-11

    申请号:CN202510286113.0

    申请日:2025-03-12

    Inventor: 王政 刘茂福 张甜

    Abstract: 本发明提供一种基于多重语义增强的金融文档级事件抽取方法及系统,属于自然语言处理领域,包括:构建金融文档事件模式,所述金融文档事件模式包括事件类型集合及事件类型的论元角色集合;获取待抽取金融文档数据,基于事件类型和论元角色对所述待抽取金融文档数据进行预处理和标注,得到标注好的金融文档数据;将标注好的金融文档数据输入训练后的金融文档级事件抽取模型,利用金融文档级事件抽取模型的语义匹配优化模块、多粒度语义增强模块和事件中心异质图结构模块对标注好的金融文档数据,得到包含事件类型、事件论元的抽取结果。本发明实现在处理金融文档时,从多层次、跨段落的文本中提取事件信息,提升事件抽取的准确性和效率。

    融合三维注意力的文本交互多项选择智能答题方法及系统

    公开(公告)号:CN116756288A

    公开(公告)日:2023-09-15

    申请号:CN202310783024.8

    申请日:2023-06-28

    Inventor: 王政 刘茂福 夏旭

    Abstract: 本发明提供一种融合三维注意力的文本交互多项选择智能答题方法及系统,进行数据集采集,包括收集互联网上问题数据,整理过滤后形成多项选择数据集;选项差异交互,包括在融合三维注意力的文本交互多项选择答题模型中模拟人类在解决阅读理解多项选择题时,通过比较所有选项来寻求帮助,建模出选项之间的差异信息;问题、选项、文章之间进行文本交互,包括在融合三维注意力的文本交互多项选择答题模型中模拟人类阅读理解过程中需要理解不同类型文段之间的联系进行阅读推理,并使用三维注意力补充问题与选项交互时缺失的上下文信息;模型微调,包括使用数据集,输入到融合三维注意力的文本交互多项选择答题模型进行预训练,实现智能答题。

    一种融合实体与窗口注意力的文档级金融关系抽取方法

    公开(公告)号:CN115906840A

    公开(公告)日:2023-04-04

    申请号:CN202210653640.7

    申请日:2022-06-09

    Abstract: 本发明设计一种融合实体与窗口注意力的文档级金融关系抽取方法,包括如下步骤:通过滑动窗口的方式对数据进行预处理,并输入到预训练模型;通过预训练模型的输出得到每个实体的表达,进一步结合头实体‑尾实体的表达与头实体‑尾实体距离,再用一层卷积神经网络实现全局实体信息的交互;对预训练模型输出的文档级注意力用固定窗口提取局部信息;将以上两种特征融合后输入到U形神经网络进行关系推理;最后通过双线性函数进行关系预测。该方法能够抽取文档级的金融关系,实现了较好的抽取效果。

    一种面向情感数据标注的交叉验证方法、设备和存储介质

    公开(公告)号:CN115495581A

    公开(公告)日:2022-12-20

    申请号:CN202211216473.6

    申请日:2022-09-30

    Abstract: 本发明提供了一种面向情感数据标注的交叉验证方法、设备和存储介质,方法包括,获得初始数据,将同一份初始数据复制生成多份相同数据,并对数据进行切分,将切分后的数据分发给标注员进行标注,将标注好的数据收集后重新进行整合,获得多份数据的标注结果;对标注结果进行交叉验证,将标注结果中单个标注数据一致的放入一个文件,不一致的则放入另外一个文件;将不一致的标注数据结果重新进行切分并分发给标注员重新进行标注,对重新标注的结果再进行交叉验证。本发明通过对标注员的标注结果进行多次重复的交叉验证,以此来提高数据标注的准确度和可用性;数据的标注和验证都可以内部进行,提高了数据处理的效率,降低了对数据标注验证的成本。

    基于权值模型的灰度图像二值化算法定量评估方法

    公开(公告)号:CN104063874B

    公开(公告)日:2017-01-25

    申请号:CN201410324856.4

    申请日:2014-07-09

    Abstract: 本发明涉及一种基于权值模型的灰度图像二值化算法定量评估方法。其技术方案为:先对灰度图像A使用n(n为7~20的自然数)种灰度图像二值化算法进行二值化处理,再对生成的二值图像集进行处理,得到灰度图像A的前景点权值矩阵和背景点权值矩阵;然后用待评估灰度图像二值化算法对灰度图像A进行处理,得到灰度图像A的转换矩阵Ⅰ和Ⅱ;然后根据待评估的灰度图像二值化算法的加权正确率P的数学模型,得到待评估的灰度图像二值化算法的加权正确率P,定量评估待评估灰度图像二值化算法。本发明不仅适用性强,独立于参照集,且能对灰度图像二值化算法进行有效的定量评估。

    基于少量样本的自适应模板重构方法及系统

    公开(公告)号:CN119807421A

    公开(公告)日:2025-04-11

    申请号:CN202510297339.0

    申请日:2025-03-13

    Abstract: 本发明提供一种基于少量样本的自适应模板重构方法及系统,属于自然语言处理领域,包括:S1、基于少量样本数据构建初始提示模板;S2、将所述初始提示模板输入大语言模型生成问题池;S3、利用大语言模型生成答案池;S4、通过多层次相似性比较模块对所述答案池中的答案进行筛选和聚类分析,并通过模型自反馈机制动态调整多层次相似性比较模块中相似性计算的权重参数,得到筛选后答案的总体得分;S5、计算各答案群组的综合相似性得分,并对各答案群组进行专家评分,基于综合相似性得分和专家评分对初始提示模板进行重构;S6、将所述重构后提示模板输入大语言模型进行迭代更新,直至获得最终答案。

    一种社区老年轻度认知障碍智能随访服务推荐方法

    公开(公告)号:CN114141321B

    公开(公告)日:2025-03-21

    申请号:CN202111376448.X

    申请日:2021-11-19

    Abstract: 本发明提供一种社区老年轻度认知障碍智能随访服务推荐方法,根据采集到的老年随访信息提出基于特征进化选择的预测模型,基于认知障碍预测结果设置基于相似度计算的养老服务推荐模型;采用量表方式,建立社区老年认知和慢病管理调查问卷;将量表调查问卷电子化;构建web系统,发布电子版调查问卷;支持量表查询,进行量表数据的获得,将数据储存在数据库中;采用基于特征进化选择的预测模型进行老年人患老年痴呆疾病程度预测;采用基于相似度计算的养老服务推荐模型生成医疗养老服务推荐结果。本发明相对于现有方法,能提供更全面的MCI随访量表、更准确的预测结果、更易用的随访系统以及更为个性化的老年服务推荐。

Patent Agency Ranking