-
公开(公告)号:CN116644751A
公开(公告)日:2023-08-25
申请号:CN202310621806.1
申请日:2023-05-30
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
IPC: G06F40/295 , G06N3/045 , G06N3/0895 , G06N3/094 , G06N3/084
Abstract: 基于跨度对比学习的跨域命名实体识别方法、设备、存储介质和产品,属于命名实体识别技术领域,解决领域偏移及跨度边界信息学习性能低的问题。本发明的方法包括:使用预训练语言模型、对抗训练、对比学习、KL散度等技术构建基于跨度对比学习的跨域命名实体识别模型,利用实体边界信息,将顺序标签转化为全局边界矩阵,完成跨度级别的对比学习以及KL散度的计算,模型在训练过程中不断更改其中相关参数,充分考虑到了实体边界信息,学习到更多领域不变性信息,大大提高了跨域命名实体识别的性能。本发明适用于跨域命名实体的识别。
-
公开(公告)号:CN116502164A
公开(公告)日:2023-07-28
申请号:CN202310447016.6
申请日:2023-04-24
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
IPC: G06F18/2433 , G06F18/214 , G06F18/10 , G06N3/0464 , G06N3/047 , G06N3/094 , G06F123/02
Abstract: 基于对抗训练和频域改良自注意力机制的多维时序数据异常检测方法,解决模型的鲁棒性较差,容易收到外部干扰,从而导致检测结果的准确率下降;以及时序数据的频域特征没有被充分考虑,从而导致模型精度受限,分析结构不精准的问题。所述方法整体分为两个阶段:训练阶段和异常检测阶段。在训练阶段,需要利用历史采集到的数据训练模型,使得模型参数能够拟合对应的应用场景。在异常检测阶段中,在每个最新的真实数据产生的时候,模型需要重构出以最新的时间点为结尾的定长时间窗口长度的时序数据,来和原始的真实数据进行残差计算,根据真实数据与重构数据的残差大小来判断当前数据是否是异常数据。本发明适用于工业设备故障检测以及生产线运行状态检测和分析。
-
公开(公告)号:CN116341003A
公开(公告)日:2023-06-27
申请号:CN202310281312.3
申请日:2023-03-21
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
IPC: G06F21/62 , G06F16/901 , G06Q50/00
Abstract: 本发明公开了一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法、设备及介质,属于数据安全领域,解决了直接使用随机响应机制的图结构边密度膨胀,无法保留图上重要的社区特征,以及模型学习过程中的隐私泄露问题。该方法在用户和收集者之间设计了两轮交互,第一轮交互中,用户端使用个性化采样技术和随机响应机制扰动和其他用户间的链接关系并发送给收集者,收集者聚集所有用户发送的链接关系使用社区发现算法划分用户所属社区。第二轮交互中,用户端结合社区划分结果进行个性化采样随机响应然后发送扰动后的链接关系给收集者,收集者聚集所有用户发送的链接关系得到最终的图邻接矩阵。本发明适用于图隐私保护场景。
-
公开(公告)号:CN116776880A
公开(公告)日:2023-09-19
申请号:CN202310576018.5
申请日:2023-05-19
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
IPC: G06F40/295 , G06F40/242 , G06N5/025 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/082 , G06N3/0895
Abstract: 一种外部信息辅助的中文知识抽取方法、系统、存储介质及计算机,涉及信息抽取领域。解决现有中文中的实体识别任务困难,需要处理更多的歧义性和上下文依赖性的问题。所述方法包括:获取中文嵌套命名实体识别数据集,将所述数据集进行预处理,并划分为训练集、验证集和测试集;构建外部信息辅助的中文知识抽取模型;利用所述训练集对所述外部信息辅助的中文知识抽取模型进行训练,获取优化模型;根据所述优化模型进行解码操作,获取优化模型预测的输入序列的所有互不冲突的命名实体。本发明应用于命名实体识别领域。
-
公开(公告)号:CN116595465A
公开(公告)日:2023-08-15
申请号:CN202310378368.0
申请日:2023-04-10
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
IPC: G06F18/2433 , G06F18/2136 , G06F18/214 , G06N3/0455 , G06N3/048
Abstract: 本发明公开了一种基于自编码器和数据增强的高维稀疏数据离群点检测方法及系统,属于数据挖掘技术领域,其中,该方法包括:获取异常检测样本数据集作为试验数据集,并对其进行预处理,得到训练集和测试集;构建数据增强模型,以对训练集进行上下采集处理,得到类异常样本与正常样本相等的增强数据;将训练集输入注意力机制模块中,以计算特征关联度;将增强数据输入注意力机制模型中,根据特征关联度计算相关特征数,根据相关特征数计算重构数据;利用离群点检测基准器对重构数据进行异常检测。该方法基于自编码器对数据进行降维操作,将稀疏的高维数据映射到低维空间中进行离群点检测,解决了维度过高对检测结果准确率的影响。
-
公开(公告)号:CN115757822A
公开(公告)日:2023-03-07
申请号:CN202211405144.6
申请日:2022-11-10
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
IPC: G06F16/36 , G06F40/295 , G06F40/30 , G06F18/214
Abstract: 本发明公开了一种基于超关系的全局数据空间链接预测方法及系统,属于知识图谱补全技术领域,其中,该方法包括:获取超关系数据集,提取超关系数据集中主三元组和附加超关系事实数据,并将超关系数据集进行预处理,以划分为训练集和测试集;构建基于超关系的全局数据空间链接预测方法;利用训练集对基于超关系的全局数据空间链接预测方法进行训练;将待预测的尾实体输入到训练好的基于超关系的全局数据空间链接预测方法中,得到全部尾实体的预测得分,再将最高预测分数作为预测尾实体。该方法提升了超关系事实之间的语义交互,还充分考虑了附加超关系事实对主三元组预测的影响,通过注意力机制设置不同超关系事实的影响权重来提升预测性能。
-
公开(公告)号:CN116701992A
公开(公告)日:2023-09-05
申请号:CN202310555050.5
申请日:2023-05-17
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
IPC: G06F18/24 , G06F18/214 , G06F18/22 , G06F18/213 , G06N3/0475 , G06N3/045 , G06N3/0464 , G06N3/088
Abstract: 本申请公开了一种基于图注意力网络和时间卷积网络的多模态异常检测方法,属于多模态数据异常检测技术领域,包括:基于若干传感器获取多模态数据集,对多模态数据集进行预处理,并将预处理后的多模态数据集划分为训练集和测试集;基于图注意力网络和多头注意力机制构造用于提取空间相关特征的空间特征提取模块,基于时间卷积生成对抗网络构造时间特征提取模块,根据空间特征提取模块和时间特征提取模块构建多模态异常检测模型;通过训练集对多模态异常检测模型进行训练及参数优化,得到目标网络;将测试集输入到目标网络中,通过目标网络进行多模态异常检测。本申请提供的方法,在实验数据集上有着明显的优势,适用于多模态异常检测的工作。
-
公开(公告)号:CN116843026A
公开(公告)日:2023-10-03
申请号:CN202310620744.2
申请日:2023-05-29
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
IPC: G06N5/02 , G06N3/042 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/0455
Abstract: 一种基于多任务学习的知识图谱链接预测方法、计算机设备及存储介质,涉及知识图谱补全领域。解决现有InteractE模型存在的平移特性被破坏的问题。本发明提供以下方案,对知识图谱数据集进行预处理生成逆关系三元组,将得到的逆关系三元组的知识图谱数据集作为输入;构建基于多任务学习的知识图谱链接预测模型;在所述预测模型的训练集上进行迭代训练;将验证集中待预测逆关系三元组的头实体和关系输入到所述模型中,得到InteractE模型作为解码器的全部尾实体的预测得分,将测试集中待预测三元组的头实体和关系输入加载模型参数的模型中,预测得分最高的尾实体作为输出。适用于知识图谱中已经存在的头实体和关系信息预测缺失的尾实体的方法中。
-
公开(公告)号:CN116669015A
公开(公告)日:2023-08-29
申请号:CN202310379571.X
申请日:2023-04-11
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
Abstract: 本发明提出了一种满足本地差分隐私的基于方向感知的轨迹数据采集方法及系统,首先通过基于锚的空间约束方法,对用户的轨迹区域进行自适应的限制,从而在不违反隐私约束的情况下显著提高性能;其次利用隐私预算将轨迹中每个点的相邻方向信息离散化用于该点的扰动过程;这种信息用作连接相邻点的线索,并且可以用于限制轨迹中每个点的区域;最后利用指数机制和优化进程得到最终经过扰动的轨迹并上传给服务器;本发明满足严格的本地差分隐私,为移动用户轨迹数据提供可证明的隐私保护,且不需要访问额外的公开知识,通过使用本方法解决了轨迹数据采集过程中的隐私泄露问题。
-
公开(公告)号:CN116340647A
公开(公告)日:2023-06-27
申请号:CN202310165758.X
申请日:2023-02-27
Applicant: 哈尔滨工程大学 , 哈尔滨龙明科技有限公司
IPC: G06F16/9536 , G06F16/9535 , G06N3/08 , G06F18/214 , G06N3/0442
Abstract: 本发明公开了一种基于对比学习的解耦合负采样方法及其系统。与传统的负采样方法将物品视为一个整体的策略不同,本发明指出了用户的交互仅由物品的某些相关因素驱动,而并不是物品整体。本发明利用了门控网络解耦合物品的相关因素和非相关因素,综合考虑了两种因素选择出最合适的负样本,用于训练隐式协同过滤模型。同时基于对比学习的思想提出了四个对比任务,用于确保解耦合的准确度。作为一种新颖的采样策略,本发明能够完美地兼容各种隐式协同过滤模型。由于本发明充分考虑了用户交互的形成特性,利用门控网络提供了解耦方向,以及提出了对比学习任务确保解耦精度,隐式协同过滤模型的性能有着大幅提升。
-
-
-
-
-
-
-
-
-