-
公开(公告)号:CN118551068A
公开(公告)日:2024-08-27
申请号:CN202410559309.8
申请日:2024-05-08
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/58 , G06F16/532 , G06F40/166 , G06F40/35 , G06N5/04
Abstract: 本申请公开了一种表情包检索方法、电子设备和计算机可读存储介质,该方法包括:获取对话文本,为对话文本拼接多种关系补充文本,得到拼接文本;其中,每种关系补充文本对应一种预设的常识关系;基于拼接文本,确定对话文本的意图信息和对话文本对应的意图融合文本特征;其中,意图融合文本特征融合有意图信息;获取意图融合文本特征相匹配的目标视觉属性,从目标视觉属性所对应的表情包合集中,获取与意图融合文本特征相匹配的目标表情包;其中,目标视觉属性从多个候选视觉属性中选取,候选视觉属性是基于多个表情包的描述文本确定的,且每个候选视觉属性对应各自的表情包合集。上述方案,能够提高表情包检索的准确性。
-
公开(公告)号:CN118262159A
公开(公告)日:2024-06-28
申请号:CN202410360323.5
申请日:2024-03-25
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/764 , G06V10/44 , G06V10/82 , G06V10/75 , G06N3/0464 , G06N3/0455 , G06N3/0985
Abstract: 本申请公开了一种图像标签确定方法、电子设备及计算机可读存储介质,该方法包括:获取待分析表情图像以及待分析表情图像的多维度属性表示;根据待分析表情图像中各图像块的注意力权重对待分析表情图像进行重构处理,得到待分析表情图像的重构图像表示;基于待分析表情图像的多维度属性表示和重构图像表示从预设表情图像标签库中选取得到待分析表情图像的目标图像标签。由此可以提高图像标签确定的准确性。
-
公开(公告)号:CN113486665B
公开(公告)日:2023-06-20
申请号:CN202110757350.2
申请日:2021-07-05
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F40/295 , G06F21/62 , G06N3/042 , G06N3/047 , G06N3/084 , G06F18/214 , G06F18/2415
Abstract: 本发明公开了一种隐私保护文本命名实体识别方法、装置、计算机设备及存储介质,方法包括:接收多个数据持有方发送的多个训练好的教师模型,所述教师模型通过使用源数据进行训练,包括第一预训练网络和第一序列标注层,所述源数据为标注文本数据;根据多个训练好的教师模型,利用无标签的迁移集合进行多教师知识蒸馏从而训练学生模型,所述学生模型包括第二预训练网络和第二序列标注层;利用训练好的学生模型对无标签文本数据的命名实体进行预测。本发明将知识蒸馏应用于数据分散的真实场景,在数据可用不可见的前提下,通过无标签的迁移集合,训练出强大的学生模型,从而在隐私保护的前提下,保证学生模型在命名实体识别任务上的泛化性和准确性。
-
公开(公告)号:CN116257625A
公开(公告)日:2023-06-13
申请号:CN202211295835.5
申请日:2022-10-21
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/35 , G06F16/33 , G06F16/34 , G06F40/258 , G06N20/00
Abstract: 本申请公开了一种话题立场检测方法、装置及计算机可读存储介质,该方法包括:获取待检测话题文本,待检测话题文本包括目标话题以及和目标话题对应的目标文本;获取与目标话题相关的至少两个相关话题文本;确定目标文本中的关键词,筛选出至少两个相关话题文本中与关键词对应的句子;将待检测话题文本和句子输入立场检测网络中进行预测,得到目标文本对于目标话题的立场。通过上述方法,能够提高立场检测的准确性。
-
公开(公告)号:CN115719063A
公开(公告)日:2023-02-28
申请号:CN202211506938.1
申请日:2022-11-24
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F40/284 , G06F40/242 , G06F40/205 , G06F40/30
Abstract: 本申请公开了一种情感分析模型训练方法、情感分析方法、设备及存储介质,情感分析模型训练方法包括:获取用于情感分析的第一标注文本;对第一标注文本进行词性分析,得到名词集合;以及对第一标注文本进行情感词分析,得到情感词集合;基于名词集合和情感词集合,对第一标注文本进行掩码处理,得到目标文本序列;利用第一情感分析模型对目标文本序列进行依赖关系预测和掩码词预测,得到预测掩码词和预测依赖关系;利用真实掩码词和预测掩码词、真实依赖关系和预测依赖关系对第一情感分析模型进行网络参数调整,以使第一情感分析模型达到领域不变性表示学习的目的。通过上述方式,可以同时进行依赖关系预测和掩码词预测,以实现领域不变性学习。
-
公开(公告)号:CN110335639B
公开(公告)日:2021-10-29
申请号:CN201910511069.3
申请日:2019-06-13
Applicant: 哈尔滨工业大学(深圳)
IPC: G16B20/30
Abstract: 本发明提供了一种跨转录因子的转录因子结合位点预测算法及装置,所述方法包括如下步骤:步骤1:预测所有转录因子中能够与DNA结合的氨基酸,称为DNA结合位点,预测的DNA结合位点主要用于衡量不同转录因子的标注数据在目标转录因子模型训练过程中的贡献;步骤2:从由预测的DNA结合位点组成的序列中学习转录因子的表示向量;步骤3:从DNA片段的组蛋白修饰特征中学习DNA片段的高阶依存关系;步骤4:从DNA片段的序列特征中学习DNA片段的低阶依存关系;步骤5:将学习的转录因子向量表示、DNA片段的高阶依存关系和低阶依存关系拼接成特征向量并输入多层感知器中对目标DNA片段分类,判定其是否为目标转录因子的结合位点。
-
公开(公告)号:CN112329052A
公开(公告)日:2021-02-05
申请号:CN202011155392.0
申请日:2020-10-26
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本申请公开了一种模型隐私保护方法,该方法包括以下步骤:基于当前训练场景,确定用于对模型进行隐私保护的目标保护方式;如果目标保护方式为PATE方式,则在使用训练数据集进行模型训练过程中,对中间产生的投票结果进行加噪处理,训练完成后,获得最终的待使用第一模型;如果目标保护方式为差分隐私随机梯度下降DPSGD方式,则在使用训练数据集进行模型训练过程中,对将训练数据集输入到模型后计算得到的梯度进行加噪处理,训练完成后,获得最终的待使用第二模型。应用本申请所提供的技术方案,可以较好地且有效地进行隐私保护,提高训练数据及模型的安全性。本申请还公开了一种模型隐私保护装置,具有相应技术效果。
-
公开(公告)号:CN111931233A
公开(公告)日:2020-11-13
申请号:CN202010806166.8
申请日:2020-08-12
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F21/62 , G06F16/2458 , G06F16/27
Abstract: 本申请实施例公开了一种基于区块链和本地化差分隐私保护的信息推荐方法及系统,用于在进行信息推荐的同时保证用户数据的安全性和确保用户隐私信息不被泄露。本申请实施例方法包括:对区块链用户的用户数据进行聚类分析,以及对该区块链用户的预处理数据进行本地化差分隐私处理而得到模糊化数据,并由星际文件系统对该模糊化数据进行哈希计算而得到哈希值,在得到区块链用户的桶号以及哈希值之后,可以基于该桶号及哈希值,根据推荐算法向目标区块链用户进行信息推荐。本申请实施例中,免除了中心服务器的参与,避免中心服务器被攻击而导致用户信息泄露,同时本地化差分隐私处理也保证了用户数据的隐秘性,增强了数据的安全性,降低隐私泄露的风险。
-
公开(公告)号:CN110335639A
公开(公告)日:2019-10-15
申请号:CN201910511069.3
申请日:2019-06-13
Applicant: 哈尔滨工业大学(深圳)
IPC: G16B20/30
Abstract: 本发明提供了一种跨转录因子的转录因子结合位点预测算法及装置,所述方法包括如下步骤:步骤1:预测所有转录因子中能够与DNA结合的氨基酸,称为DNA结合位点,预测的DNA结合位点主要用于衡量不同转录因子的标注数据在目标转录因子模型训练过程中的贡献;步骤2:从由预测的DNA结合位点组成的序列中学习转录因子的表示向量;步骤3:从DNA片段的组蛋白修饰特征中学习DNA片段的高阶依存关系;步骤4:从DNA片段的序列特征中学习DNA片段的低阶依存关系;步骤5:将学习的转录因子向量表示、DNA片段的高阶依存关系和低阶依存关系拼接成特征向量并输入多层感知器中对目标DNA片段分类,判定其是否为目标转录因子的结合位点。
-
公开(公告)号:CN110222185A
公开(公告)日:2019-09-10
申请号:CN201910511692.9
申请日:2019-06-13
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明专利涉及一种关联实体的情感信息分类方法。该方法包括步骤一),利用维基百科语料训练大规模的词向量作为文本中词语的通用词向量表示;步骤二),结合强化学习中的Q学习方法针对文本中不同的实体和实体属性对词向量进行微调,使词语在修饰不同实体或实体属性时有不同的向量表示;步骤三),将学习获得的词语情感信息向量表示应用到实体级别文本情感分析任务中。使用该方法能在不使用注意力机制的情况下,有效判别不同实体或实体属性的情感极性。
-
-
-
-
-
-
-
-
-