一种基于指针网络的乱序文本纠错方法

    公开(公告)号:CN119623464A

    公开(公告)日:2025-03-14

    申请号:CN202411679874.4

    申请日:2024-11-22

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于指针网络的乱序文本纠错方法;包括:获取纠错文本数据并构造标签;提取纠错文本数据的词级特征向量;根据纠错文本的词级特征向量提取局部特征向量;拼接词级特征向量与局部特征向量以构造融合特征向量;根据融合特征向量,采用查询机制构建span指针得分表和next指针得分表;根据span指针得分表缩小next指针得分表;根据span得分表和next指针得分表对乱序文本进行重排序,得到最终纠正后的文本;计算模型总损失并根据总损失调整模型参数,得到训练好的乱序文本纠错模型;使用训练好的模型进行文本纠错;本发明提高了自动校对系统准确率,且模型推理速度更快。

    一种基于外部知识编码网络的文本纠错方法

    公开(公告)号:CN119761349A

    公开(公告)日:2025-04-04

    申请号:CN202411824578.9

    申请日:2024-12-12

    Abstract: 本发明公开了一种基于外部知识编码网络的文本纠错方法,包括:获取特定领域的待纠错文本数据,将其输入到文本纠错网络中的Bert层,得到待纠错文本的句向量表征CLS;通过外部知识编码网络得到外部知识向量表征,将其存储于向量数据库D中;计算待纠错文本的句向量表征CLS与向量数据库D中所有外部知识向量表征的相似度,得到该句向量表征CLS相对于所有外部知识向量表征的相似度得分;选取相似度得分最高的外部知识向量表征并用其替换该待纠错文本的句向量表征CLS,得到新句向量表征CLS’;将新句向量表征CLS’输入到文本纠错网络中的其他模块,该文本纠错网络输出纠错后的文本数据。本发明可以解决文本纠错模型无法利用外部知识进行事实性纠错的问题,提高文本纠错模型的性能。

    一种基于大数据的微博异常用户检测方法

    公开(公告)号:CN117453916B

    公开(公告)日:2024-10-11

    申请号:CN202311403088.7

    申请日:2023-10-26

    Abstract: 本发明属于社交网络安全领域,具体涉及一种基于大数据的微博异常用户检测方法;包括:获取带标签的微博用户数据;根据微博用户数据提取用户行为特征和用户文本特征,得到用户行为特征高维表征和用户文本特征高维表征;根据微博用户数据提取用户基本特征,得到用户基本特征高维表征;对三种高维表征进行两两交互,得到基本‑行为特征表、基本‑文本特征表和行为‑文本特征表;对三种特征表进行处理,得到用户交叉高维特征;将用户交叉高维特征输入到全连接神经网络中进行处理,得到异常用户检测结果;计算全连接分类损失并根据全连接分类损失调整模型参数,得到训练好的异常用户检测模型;本发明检测结果准确,有助于相关部分对舆情进行控制。

    一种异常用电智能检测方法

    公开(公告)号:CN117786564A

    公开(公告)日:2024-03-29

    申请号:CN202311575884.9

    申请日:2023-11-23

    Abstract: 本发明属于异常用电检测技术领域,具体涉及一种异常用电智能检测方法,包括:获取待检测的电网用户数据;输入异常用电检测模型中;得到电网用户的异常用电检测结果。异常用电检测模型的训练过程主要包括:获取模型训练样本;提取用户每日用电量行为表征向量序列,提取用户用电量行为表征向量,通过聚类获得用户类别特征;将用户用电量行为表征向量和连续型特征向量进行拼接并输入特征交叉网络,将用户每日用电量行为表征向量序列输入条件层级归一化网络;通过全连接神经网络进行迭代训练;损失函数收敛,则训练结束,得到训练后的异常用电检测模型。本发明参考用户的多样性以及用户用电习惯的周期性影响,有效提高异常用电检测的准确性。

    一种基于大数据的微博异常用户检测方法

    公开(公告)号:CN117453916A

    公开(公告)日:2024-01-26

    申请号:CN202311403088.7

    申请日:2023-10-26

    Abstract: 本发明属于社交网络安全领域,具体涉及一种基于大数据的微博异常用户检测方法;包括:获取带标签的微博用户数据;根据微博用户数据提取用户行为特征和用户文本特征,得到用户行为特征高维表征和用户文本特征高维表征;根据微博用户数据提取用户基本特征,得到用户基本特征高维表征;对三种高维表征进行两两交互,得到基本‑行为特征表、基本‑文本特征表和行为‑文本特征表;对三种特征表进行处理,得到用户交叉高维特征;将用户交叉高维特征输入到全连接神经网络中进行处理,得到异常用户检测结果;计算全连接分类损失并根据全连接分类损失调整模型参数,得到训练好的异常用户检测模型;本发明检测结果准确,有助于相关部分对舆情进行控制。

    一种基于大数据的法律判决舆情分类方法

    公开(公告)号:CN116541523A

    公开(公告)日:2023-08-04

    申请号:CN202310485333.7

    申请日:2023-04-28

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于大数据的法律判决舆情分类方法;该方法包括:获取法律判决文本数据和带标签的舆情文本数据;提取舆情文本的词级特征向量和句级特征向量;提取法律判决文本的词级特征向量;根据舆情文本的词级特征向量和法律判决文本的词级特征向量得到舆情文本的交叉词级特征向量;对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心;根据交叉词级特征进行分类,得到舆情文本的分类结果;计算模型总损失;根据总损失调整模型参数,得到训练好的文本分类模型;本发明提高了模型的分类准确度。

Patent Agency Ranking