-
公开(公告)号:CN116127351A
公开(公告)日:2023-05-16
申请号:CN202211606757.6
申请日:2022-12-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 东莞理工学院 , 平安科技(深圳)有限公司
IPC: G06F18/24 , H04L67/01 , G06F18/214 , G06N3/098
Abstract: 本发明公开了一种面向双不均衡的联邦学习方法和系统,客户端接收服务器发送的服务器模型参数,并载入本地模型;根据当前样本类别的样本数量占当前客户端样本总数量的比值确定当前样本类别对应的权重因子;利用权重因子计算本地模型识别当前样本类别产生的损失值;利用损失值计算关于当前样本类别的参数变化量,并基于参数变化量对服务器模型参数中关于当前样本类别的模型参数进行更新,直至当前客户端内所有样本类别相关的模型参数均完成更新,得到客户端模型参数;将客户端模型参数发送至服务器,以使服务器通过引力正则项对各个客户端发送的客户端模型参数进行聚合。本发明提供的技术方案,解决了联邦学习的双重不均衡场景模型训练较差的问题。
-
公开(公告)号:CN115497555A
公开(公告)日:2022-12-20
申请号:CN202210980663.9
申请日:2022-08-16
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请公开了一种多物种蛋白质功能预测方法、装置、设备及存储介质,属于生物信息技术领域,该方法包括:将多物种蛋白质的标签矩阵和特征矩阵输入预先构建的跨物种异构网络;在所述跨物种异构网络的每个传播层传播所述标签矩阵和所述特征矩阵,获得传播后的目标标签矩阵和目标特征矩阵;将所述目标标签矩阵和所述目标特征矩阵进行加权获得预测得分矩阵,并基于所述预测得分矩阵获得所述多物种蛋白质的功能预测得分。如此,基于跨物种异构网络上实现了标签与特征的同时传播,提高了多物种蛋白质功能的预测的准确性和有效性。
-
公开(公告)号:CN114492387B
公开(公告)日:2022-07-19
申请号:CN202210401179.6
申请日:2022-04-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/211 , G06F40/284 , G06F40/237 , G06N20/00
Abstract: 本发明公开一种基于句法结构的领域自适应方面术语抽取方法及系统,包括将源领域和目标领域中词的词性和句法依赖关系作为句法结构信息;计算源领域方面术语的平均词性特征和平均句法依赖关系特征并作为方面术语的平均句法结构特征;根据句法结构信息计算源领域和目标领域中每个词和平均句法结构特征的相似度;对基于Transformer的预训练模型进行基于句法结构相似度的再预训练;基于掩码语言模型MLM构建方面术语抽取模型并进行训练,训练过程中对术语抽取模型的交叉熵损失函数进行加权。本发明能学习到词语级领域不变表征,在细粒度的文本抽取任务中能取得不错的成效。
-
公开(公告)号:CN114723071A
公开(公告)日:2022-07-08
申请号:CN202210450751.8
申请日:2022-04-26
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于客户端分类和信息熵的联邦学习方法及装置,涉及机器学习技术领域,该方法包括:基于客户端在非独立同分布数据场景的偏置程度,将客户端归入第一服务器或第二服务器;在相对应的服务器中训练客户端,得到训练好的客户端模型,并确定客户端模型的本地模型参数,并基于本地模型参数对应的更新第一服务器的第一模型参数和第二服务器的第二模型参数;确定第一服务器和第二服务器满足交互条件,基于第一模型参数和第二模型参数分别对应的权重,更新中央服务器的中央模型参数。本发明可以提升联邦学习的模型准确率,使得联邦学习适用于在不同混合程度的Non‑IID场景。
-
公开(公告)号:CN114492387A
公开(公告)日:2022-05-13
申请号:CN202210401179.6
申请日:2022-04-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/211 , G06F40/284 , G06F40/237 , G06N20/00
Abstract: 本发明公开一种基于句法结构的领域自适应方面术语抽取方法及系统,包括将源领域和目标领域中词的词性和句法依赖关系作为句法结构信息;计算源领域方面术语的平均词性特征和平均句法依赖关系特征并作为方面术语的平均句法结构特征;根据句法结构信息计算源领域和目标领域中每个词和平均句法结构特征的相似度;对基于Transformer的预训练模型进行基于句法结构相似度的再预训练;基于掩码语言模型MLM构建方面术语抽取模型并进行训练,训练过程中对术语抽取模型的交叉熵损失函数进行加权。本发明能学习到词语级领域不变表征,在细粒度的文本抽取任务中能取得不错的成效。
-
公开(公告)号:CN113553610B
公开(公告)日:2021-12-31
申请号:CN202111103182.1
申请日:2021-09-22
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于同态加密和可信硬件的多方隐私保护机器学习方法,包括:将私钥sk发送给各个数据方和可信硬件R;服务器S整合各个数据方上传的密文数据得到密文数据集;服务器S在密文数据集的基础上,将普通机器学习算法中的线性运算替换为同态加法和同态乘法,在密文状态下进行机器学习建模;服务器S在完成密文下的机器学习建模后,将加密的模型密文下发给各个数据方;各个数据方利用私钥解密模型密文,得到由各个数据方的数据D训练得到的模型。本发明利用全同态加密的性质、以及依靠可信硬件实现的模拟自举和执行激活函数功能,能够获得与对未加密数据进行机器学习训练的模型一致的准确率。
-
公开(公告)号:CN112988981A
公开(公告)日:2021-06-18
申请号:CN202110525248.X
申请日:2021-05-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于遗传算法的自动标注方法,包括依次执行以下步骤:步骤1,预处理:获取评论,从评论中删除长度小于两个单词的评论和所有非字母数字字符,然后取小写字母,在标记化后剔除存在于NLTK语料库中的终止词,接下来,将单词简化为词根形式;步骤2,主题建模:采用LDA主题建模方法,给定一个评论列表R={r1,r2,…,rn},获得相应的词汇D={ω1,ω2,...,ωd},话题β={β1,β2,...,βk};步骤3,基于遗传算法的主题标注:设计适合该主题标注场景的染色体结构、适应度参数以及遗传算子。本发明的有益效果是:利于开发者和用户了解应用评论。
-
公开(公告)号:CN111260039B
公开(公告)日:2020-08-07
申请号:CN202010369831.1
申请日:2020-05-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于辅助任务学习的视频游戏决策方法,包括以下步骤:S1、构建神经网格模型;S2、启动多进程视频游戏环境;S3、判断是否运行了指定轮次,如果否,则进入步骤S4,如果是,则进入步骤S6;S4、获取游戏经验,更新经验池;S5、将经验输入到神经网格模型,更新神经网格模型参数,返回步骤S3;S6、保存神经网格模型;S7、在视频游戏里利用神经网格模型决策;S8、结束。本发明的有益效果是:可以更准确地估计三维场景中的状态价值以及引起状态改变的智能体动作。
-
公开(公告)号:CN111260039A
公开(公告)日:2020-06-09
申请号:CN202010369831.1
申请日:2020-05-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于辅助任务学习的视频游戏决策方法,包括以下步骤:S1、构建神经网格模型;S2、启动多进程视频游戏环境;S3、判断是否运行了指定轮次,如果否,则进入步骤S4,如果是,则进入步骤S6;S4、获取游戏经验,更新经验池;S5、将经验输入到神经网格模型,更新神经网格模型参数,返回步骤S3;S6、保存神经网格模型;S7、在视频游戏里利用神经网格模型决策;S8、结束。本发明的有益效果是:可以更准确地估计三维场景中的状态价值以及引起状态改变的智能体动作。
-
公开(公告)号:CN119889451A
公开(公告)日:2025-04-25
申请号:CN202411684130.1
申请日:2024-11-22
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G16B40/00 , G16B20/00 , G06F18/15 , G06F18/25 , G06N3/042 , G06N3/044 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094 , G06N3/084
Abstract: 本发明公开了基于图卷积神经网络的合成致死基因对预测方法、装置、终端及介质。合成致死基因对预测方法包括:基于蛋白质结构数据获取蛋白质的结构特征;基于蛋白质序列数据获取蛋白质的序列特征;基于蛋白质‑蛋白质相互作用网络获取蛋白质的功能特征;将蛋白质的结构特征、序列特征和功能特征进行合并与标准化,获得蛋白质的主要生成基因的基因特征;获取基因间的相互作用,以基因间的相互作用和基因特征训练基于图卷积神经网络的合成致死基因对预测模型;基于训练好的合成致死基因对预测模型获得每个基因的最终特征表示,根据最终特征表示预测两个基因是否为合成致死基因对。该方法提高了特征提取的效率和对基因相互作用的预测能力。
-
-
-
-
-
-
-
-
-