文本数据处理方法及装置、文本数据检测方法及装置

    公开(公告)号:CN119621984A

    公开(公告)日:2025-03-14

    申请号:CN202411739848.6

    申请日:2024-11-29

    Abstract: 本发明涉及对比学习领域,特别涉及一种文本数据处理方法及装置、文本数据检测方法及装置,所述方法包括将多个领域的人造文本输入大模型工具按照启发式规则分别得到对应的AIGC文本,组成检测增强文本对,并通过多层级的编码器网络和对应多层级的辅助编码网络分别对检测增强文本对中的文本进行编码,并使用多层级知识保护对比学习损失函数优化编码器模型。本发明使编码器模型能够同时对多个领域的文本数据进行无领域语义混淆的高精度文本AIGC检测并能在保持原始知识分布细微变化的情况下拉开人造文本与AIGC文本之间的语义分布,实现插件式的检测领域拓展与检测精度增强。

    一种基于多视角图神经网络的药物靶标匹配推荐方法

    公开(公告)号:CN119601078A

    公开(公告)日:2025-03-11

    申请号:CN202411665435.8

    申请日:2024-11-20

    Abstract: 本发明属于计算生物学领域,具体涉及一种基于多视角图神经网络的药物靶标匹配推荐方法,包括:获取待预测的药物靶标信息,将其输入训练好的药物靶标推荐模型,选取预测概率大于交互阈值的药物靶标推荐给用户;本发明利用基于点和边进行消息传递的图神经网络提取药物分子特征向量,从原子和化学键两个角度对药物分子进行建模和特征提取,同时考虑到药物序列信息的全局性,利用交叉注意力机制对药物分子的原子特征、化学键特征和序列特征进行交互,更准确的捕捉药物分子和靶标蛋白之间的复杂关系,提高药物靶标相互作用预测的准确性。

    一种基于大数据的智能政务问答系统

    公开(公告)号:CN118410132B

    公开(公告)日:2024-12-06

    申请号:CN202310362407.8

    申请日:2023-04-07

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于大数据的智能政务问答系统,包括:文本解析模块、特征提取模块、信息交互模块、答案预测模块;文本解析模块计算用户的问题Q与文档之间的相关性,选取相关性最高的前K个文档作为召回文档P;特征提取模块提取召回文档P与用户问题Q之间的依存关系特征;所述信息交互模块将召回文档P、用户问题Q以及依存关系特征进行多重注意力信息交互,得到最终的文本向量表示;所述答案预测模块将最终的文本向量表示通过全连接层来预测最终答案的起止位置。本发明通过融入依存关系特征,深入挖掘问题与文档中答案的联系,从而提高了问答系统中标准答案的定位,提升了用户体验。

    一种基于深度学习技术的风速与温度预测方法

    公开(公告)号:CN118916635A

    公开(公告)日:2024-11-08

    申请号:CN202410982897.6

    申请日:2024-07-22

    Inventor: 吴思远 王进

    Abstract: 本发明涉及深度学习技术领域,特别涉及一种基于深度学习技术的风速与温度预测方法,包括:获取气象平台的风速与温度数据,并对数据进行缺失值填充处理;构建属性集,并对属性集中的数据进行映射处理;构建自适应属性交互图神经网络;对数据中的风速指标和温度指标进行初始化,并分别标记为Y1和Y2;将映射后的属性特征、Y1和Y2输入到自适应属性交互图神经网络中进行交互拼接,得到总的特征向量;将总的特征向量通过CVAE网络映射到标签对应的潜在语义空间中,得到映射后的特征空间向量;将映射后的特征空间向量输入到训练后的DNN网络中,得到风速与温度预测结果;本发明的方法能够捕捉到风速与温度数据的深层次特征和复杂关系。

    一种基于大数据的电力系统短期净负荷预测方法

    公开(公告)号:CN118411048A

    公开(公告)日:2024-07-30

    申请号:CN202410506244.0

    申请日:2024-04-25

    Abstract: 本发明属于大数据技术领域,具体涉及一种基于大数据的电力系统短期净负荷预测方法,包括:获取电力系统电力负荷序列数据以及气压、温度、湿度序列数据;对气压、温度、湿度序列数据进行变换以提取其周期性特征;使用多噪声CEEMDAN对电力负荷序列数据进行分解并合并所有分量,与温度、湿度、气压序列数据以及周期性特征构成加强特征,并通过CNN提取加强特征的空间特征,并进行融合得到X1;将温度、气压、湿度、电力负荷序列数据选择不同组合送入Multi‑AE进行去噪得到X2;拼接X1和X2送入MLP得到预测结果。本发明采用添加周期突变噪声的方式,有效降低了序列数据的噪声水平,并提高了对于突变情况的准确预测能力。

    一种基于大数据的电力变压器故障智能诊断方法

    公开(公告)号:CN118410165A

    公开(公告)日:2024-07-30

    申请号:CN202410488207.1

    申请日:2024-04-23

    Abstract: 本发明涉及深度学习、大模型领域,特别涉及一种基于大数据的电力变压器故障智能诊断方法,包括获取电力变压器关键词参数以及对应的外部数据,通过获取的数据构建查询文档;将电力变压器待检测的查询数据转换为词嵌入向量,并对词嵌入向量进行位置编码,得到对应的向量表示;基于注意力机制对词的向量表示进行处理,得到每个词的注意力向量;通过神经网络对注意力向量进行非线性变换处理,得到查询文档中每个词的表示向量;基于查询文档中每个词的表示向量,检索与查询文档最相似的K个文档;将检索到的K个文档以及查询文档输入大语言模型中进行诊断,大语言模型输出诊断结果,并将大语言模型的诊断结果并入外部数据;本发明所创造的方法通过利用丰富的外部数据检索和大模型优秀的学习能力,使得电力变压器故障诊断的结果更加精准。

    一种基于情绪感知的语音情绪识别方法

    公开(公告)号:CN118136055A

    公开(公告)日:2024-06-04

    申请号:CN202410269416.7

    申请日:2024-03-11

    Abstract: 本发明属于人工智能计算领域,具体涉及一种基于情绪感知的语音情绪识别方法,包括:获取预训练数据集和微调数据集,预训练数据集中包括原始音频序列和原始音频对应的原始文本;采用基于情绪词掩码策略对原始文本序列进行遮蔽,得到遮蔽后的文本序列;将遮蔽后的文本序列和原始音频序列输入到语音情绪识别模型中进行预训练;将微调数据集中的数据输入到预训练后的语音情绪识别模型中进行微调,得到最终的训练好的语音情绪识别模型;本发明利用情绪感知交互层中的相对位置嵌入层、相对位置类型嵌入层为文本编码特征赋予了情绪词的相对位置信息和相对位置类型信息。

Patent Agency Ranking