-
公开(公告)号:CN113987522B
公开(公告)日:2022-05-03
申请号:CN202111637333.1
申请日:2021-12-30
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种用于源代码漏洞检测的代码属性图压缩方法及装置,所述方法包括如下步骤:根据代码属性图计算基于前K跳邻居的节点邻域信息增益;对节点邻域信息增益进行局部归一化处理;选择归一化处理后的节点邻域信息增益低的节点组成候选删除节点集合,判断候选删除节点集合中是否存在割点,并将割点从候选删除节点集合中移除,最终得到删除节点集合;从代码属性图中去掉删除节点集合中的节点以及与节点相连的边,得到代码属性压缩图。本发明通过计算节点的前K跳邻居增益信息,选择增益信息低的节点进行删除同时保证压缩图的连通性,在尽可能保持代码属性图的节点属性和结构特征的情况下降低其复杂度,从而提高后续模型训练的时空效率。
-
公开(公告)号:CN113918743B
公开(公告)日:2022-04-15
申请号:CN202111526779.7
申请日:2021-12-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/51 , G06F16/54 , G06V10/774 , G06V10/764 , G06K9/62
Abstract: 本发明提供了一种面向长尾分布场景下图片分类的模型训练方法,包括:构建第一损失函数,用于加入原型归一化以及角域上与类别数量相关的带有边界的交叉熵分类损失;构建第二损失函数,使得各个类别的原型分散的更加均匀的,与类别数量相关最小角度最大化的正则项损失;构建第三损失函数,用于帮助模型有效训练的特征向量模长大小的正则化损失;将第一损失函数、第二损失函数、第三损失函数组合起来得到最终的损失函数Loss。本发明的有益效果是:本发明可以避免训练数据不均衡带来的模型先验偏差的问题以及进一步提升模型在测试集上的泛化性,从而在长尾分布场景下提升图片分类准确率。
-
公开(公告)号:CN112819052B
公开(公告)日:2021-12-24
申请号:CN202110094267.1
申请日:2021-01-25
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及机器视觉技术领域,公开了一种多模态细粒度混合方法、系统、设备和存储介质,所述多模态细粒度混合方法包括:从多模态图文数据中提取数据特征,并获取数据特征的各个组成成分;数据特征包括视觉区域特征和文本单词特征;对数据特征的各个组成成分的模态信息进行细粒度分类,得到分类结果;根据分类结果,对各个组成成分进行来自模态内和模态间的信息融合,得到融合特征。本发明实施例提供的多模态细粒度混合方法在多模态细粒度混合时不以模态为单位进行,考虑到了各模态中不同组成成分的特点,所处上下文环境的差异,选择对应的合适的交互方式,可以使得多模态模型在利用多模态数据互补的特点的同时,避免不相关信息的影响。
-
公开(公告)号:CN112183108B
公开(公告)日:2021-06-22
申请号:CN202010927402.1
申请日:2020-09-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/30 , G06F16/36 , G06F16/383
Abstract: 本申请涉及一种短文本主题分布的推理方法、系统、计算机设备和存储介质。该方法包括:抽取单位时间内短文本中出现的共现词对,整合共现词对获取词组集合;根据语义相似度和历史共现度对所述词组集合进行关联,获取词组集合的动态关联度,并以词组矩阵形式存储所述动态关联度;从词组集合中进行主题名称的抽取,并根据所述动态关联度修正所述主题名称;统计修正后的所述短文本中主题名称,获取所述短文本的主题分布。通过设计的动态关联度这一指标,赋予了各个共现词对不同的重要性。此外,该方法中主题名称的提取具有偏向性的主题模型,从而能够抽取出更加连续紧凑的各种主题名称,更加准确的推理出各个短文本的主题分布。
-
公开(公告)号:CN111462817A
公开(公告)日:2020-07-28
申请号:CN202010221082.8
申请日:2020-03-25
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种分类模型构建方法、装置、分类模型及分类方法。所述分类模型构建方法通过构建初始分类模型,在初始分类模型中引入生成层、选择层和比较层,并通过在基因表达谱训练数据集中随机选择两个样本,对生成层、选择层和比较层进行训练和更新,得到目标分类模型,使得可利用生成层,根据基因表达谱数据中任意两个样本生成新的样本,利用选择层,根据新的样本各个特征的权重选择若干个样本特征,利用比较层,根据从所有样本特征中选择的若干个目标特征对新的样本进行分类。本发明能够构建一种适用于基因表达谱的分类模型,实现增加基因表达谱数据的样本数量,缓解少样本特性带来的欠拟合问题,从而进一步提高基因表达谱数据的分类准确度。
-
公开(公告)号:CN119854038A
公开(公告)日:2025-04-18
申请号:CN202510322616.9
申请日:2025-03-19
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请提供一种用于认证加密与解密数据的方法及相关设备。该方法包括:获取原始数据包,所述原始数据包是利用XDP技术在链路层捕获的;对所述原始数据包的有效载荷进行加密,以得到第一数据包;生成消息摘要并对所述消息摘要进行签名,以生成消息认证码;将所述消息认证码和所述第一数据包进行封装,以得到第二数据包;对所述第二数据包的真实性进行验证;响应于所述第二数据包验证通过,将所述第二数据包写入解密线程队列进行解密,以得到所述原始数据包。通过上述方法实现了终端与业务系统之间数据传输的认证加密,使得终端与业务系统之间的数据传输更加安全。
-
公开(公告)号:CN119557785A
公开(公告)日:2025-03-04
申请号:CN202411601665.8
申请日:2024-11-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/2431 , G06F18/21 , G06F18/25 , G06F18/213 , G06N5/04 , G06N3/045
Abstract: 本发明涉及人工智能技术领域,具体涉及一种多模态情感分类模型训练方法及多模态情感分类方法。方法包括:获取包含多模态样本的训练样本;采用预设神经网络提取多模态样本的多模态特征;采用可学习掩码对多模态特征过滤,得到多模态因果特征;采用多模态特征的情感分类损失和多模态因果特征的情感分类损失计算因果效应;采用由因果效应和可学习参数确定的调度权重和情感分类损失确定联合损失;采用联合优化对预设神经网络、预设分类器以及联合损失中的参数进行参数优化,并基于参数优化后的预设神经网络、可学习掩码和预设分类器构建多模态情感分类模型。该方法实现了基于因果关系的多模态特征学习,缓解了虚假关联问题,提高了情感分类的性能。
-
公开(公告)号:CN117909912B
公开(公告)日:2024-07-02
申请号:CN202410312729.6
申请日:2024-03-19
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/2433 , G06F18/213 , G06F18/243 , G06F18/214
Abstract: 本发明涉及计算机与人工智能技术领域,特别涉及一种两阶段异常用户行为分析的检测方法及系统。其方法包括步骤:S1.数据特征处理:在获取用户行为信息及用户身份信息后将数据进行特征处理;S2.建立基准模型:分析用户行为的时间分布情况,选取部分特征数据建立基准模型,利用基准模型进行粗粒度的用户行为检测,找出存在异常用户;S3.细粒度检测:对基准模型找出的存在异常用户进行细粒度的第二阶段检测。本发明在第一阶段的基准模型实现行为级异常的检测,并能按时间顺序依次检测每周用户的行为情况,在第二阶段进行细粒度的用户级异常的检测,找出异常行为与用户的对应关系,更准确、更高比例地找出异常行为和用户并减少误报。
-
公开(公告)号:CN117909912A
公开(公告)日:2024-04-19
申请号:CN202410312729.6
申请日:2024-03-19
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/2433 , G06F18/213 , G06F18/243 , G06F18/214
Abstract: 本发明涉及计算机与人工智能技术领域,特别涉及一种两阶段异常用户行为分析的检测方法及系统。其方法包括步骤:S1.数据特征处理:在获取用户行为信息及用户身份信息后将数据进行特征处理;S2.建立基准模型:分析用户行为的时间分布情况,选取部分特征数据建立基准模型,利用基准模型进行粗粒度的用户行为检测,找出存在异常用户;S3.细粒度检测:对基准模型找出的存在异常用户进行细粒度的第二阶段检测。本发明在第一阶段的基准模型实现行为级异常的检测,并能按时间顺序依次检测每周用户的行为情况,在第二阶段进行细粒度的用户级异常的检测,找出异常行为与用户的对应关系,更准确、更高比例地找出异常行为和用户并减少误报。
-
公开(公告)号:CN117573975A
公开(公告)日:2024-02-20
申请号:CN202311548012.3
申请日:2023-11-17
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 鹏城实验室
IPC: G06F16/9535 , G06N3/0455 , G06N3/042 , G06N3/048 , G06N3/098
Abstract: 本发明提供了一种联邦跨领域的信息推荐方法、装置、终端设备及介质,所述信息推荐方法从服务器获取预先训练好的跨域序列推荐模型,并且通过用户的交互信息,确定对用户的推荐建议。该模型由服务器将多个本地模型聚合得到,每个本地模型对应一个客户端,并且每个本地模型在对应的客户端本地训练得到,这样,对于客户端来说,不需要将本地的数据上传到服务器,也可以通过服务器训练得到跨域序列推荐模型,然后从服务器获取该模型并进行应用,确保了客户端数据拥有方的数据隐私,此外相比现有的定制化推荐模型,跨域序列推荐模型通过多个本地模型聚合得到并且各本地模型分别由对应客户端本地训练得到,可以有效提高跨域序列推荐模型的性能和质量。
-
-
-
-
-
-
-
-
-