一种基于提示学习的多模态讽刺检测方法

    公开(公告)号:CN118051606A

    公开(公告)日:2024-05-17

    申请号:CN202410185452.5

    申请日:2024-02-19

    Abstract: 本申请涉及计算机科学和人工智能领域,公开了一种基于提示学习的多模态讽刺检测方法,包括以下步骤:S1、接收多模态输入数据;S2、生成与所述多模态输入数据对应的多模态提示向量;S3、生成讽刺提示向量和非讽刺提示向量;S4、计算所述多模态提示向量与所述讽刺提示向量以及所述非讽刺提示向量的余弦相似度;S5、根据所述余弦相似度计算所述多模态输入数据的讽刺概率值。本发明提供了一种有效的多模态讽刺检测方法,该方法通过引入可学习的提示向量和协同多模态提示,显著提升了讽刺检测的性能,尤其是在准确度和泛化能力方面。

    一种基于语义匹配的在线法律自动问答方法及系统

    公开(公告)号:CN113918702B

    公开(公告)日:2022-07-01

    申请号:CN202111239970.3

    申请日:2021-10-25

    Abstract: 本发明公开了一种基于语义匹配的在线法律自动问答方法及系统,方法包括以下步骤:基于若干种互联网渠道,获取法律咨询数据;通过采集法律咨询数据的第一特征信息、第二特征信息,构建特征数据集,基于特征数据集,依据FastText文本分类算法和BertSum语义优化算法,构建用户意图识别模型,用户意图识别模型用于通过采集用户提出的法律咨询问题的第三特征信息,获取第三特征信息对应的法律咨询数据;系统由若干功能模块构成,通过模块之间的逻辑联系,实现在线法律自动问答的方法,本发明克服了法律门户网站的站内检索系统技术过于简单和不适配等问题,对推进法律自动问答垂直领域发展具有重大意义。

    一种利用指代依赖提升关系抽取性能的方法

    公开(公告)号:CN113886593A

    公开(公告)日:2022-01-04

    申请号:CN202110720743.6

    申请日:2021-06-28

    Abstract: 本发明公开了一种利用指代依赖提升关系抽取性能的方法,包括捕获文本上下文语义,识别文本中的命名实体,预测实体间的指代依赖关系,融合指代依赖关系预测关系三元组等4个部分;本发明综合利用了信息抽取、语义挖掘、深度学习等技术,利用指代依赖信息对实体关系信息进行有效补充,提高了实体关系预测的抽取性能,进而基于关系预测结果可进行其他应用的研究,对进一步研究知识图谱和挖掘实体潜在关系提供了关键基础。

    多信息融合的微博热点话题检测方法

    公开(公告)号:CN103294818B

    公开(公告)日:2016-05-18

    申请号:CN201310231487.X

    申请日:2013-06-12

    Inventor: 张小明 李舟军

    Abstract: 本发明公开了一种基于多信息融合的微博热点话题检测方法,首先根据微博发布者的社交关系来计算博主的影响力,进而基于博主的影响力信息和特征词频率信息来计算特征词在给定时间段内所有微博中的权值之和;然后根据特征词权值之和随时间变化的信息来检测突发特征词,通过引入Web新闻语料来扩充微博数据以计算突发特征间的关联关系值,进而构建突发特征词关联图;最后对突发特征词关联图进行划分,每个强连通子图表示一个话题,从而实现微博热点话题的检测。本发明综合利用了微博特征词信息、博主社会关系信息、相关Web新闻文档信息来检测微博热点话题,提高了微博热点话题检测的效率。

    一种文本攻击性检测和转换的方法

    公开(公告)号:CN116186211B

    公开(公告)日:2023-07-25

    申请号:CN202211631371.0

    申请日:2022-12-19

    Abstract: 本发明公开了一种文本攻击性检测和转换的方法,包括:获取待处理文本数据,将所述待处理文本输入预训练BERT模型,获取序列词向量;构建双塔攻击性检测模型,将所述序列词向量输入所述双塔攻击性检测模型进行攻击性检测,获取攻击性词汇的位置;基于所述攻击性词汇的位置,确定攻击性语句的位置;构建攻击性文本转换模型,基于所述攻击性文本转换模型对所述攻击性语句进行去攻击性处理,生成无攻击性文本。本发明综合利用了文本向量化表示、召回模型、文本转换等技术,可以检测攻击性文本并识别出攻击性词汇,进而去攻击性转化得到目标文本,对进一步研究文本攻击性检测和转化提供了关键基础。

    一种基于生成模型的文档级关系抽取方法

    公开(公告)号:CN119088980A

    公开(公告)日:2024-12-06

    申请号:CN202411162236.5

    申请日:2024-08-23

    Abstract: 本发明属于信息处理技术领域,具体涉及一种基于生成模型的文档级关系抽取方法,包括如下步骤:其一、训练阶段,采用生成模型对文档进行压缩和精炼,提取主体、客体在文档中的关系摘要,从而筛选出与目标紧密关联的信息;其二、测试阶段,引入轻量化的判别模块,把生成模型输出的关系摘要映射到预定义的关系类别上,还包括引导生成,生成模型具备自适应性学习能力,可以动态自主地学习人类精心挑选的示例,生成更贴近人类意图的输出,还包括引导生成。本发明精准捕捉并提炼出主体和客体在文档中的关系摘要,把关系摘要映射到预定义的关系类别上,实现了关系抽取的准确性与可控性的双重提升。

Patent Agency Ranking