-
公开(公告)号:CN110335639B
公开(公告)日:2021-10-29
申请号:CN201910511069.3
申请日:2019-06-13
Applicant: 哈尔滨工业大学(深圳)
IPC: G16B20/30
Abstract: 本发明提供了一种跨转录因子的转录因子结合位点预测算法及装置,所述方法包括如下步骤:步骤1:预测所有转录因子中能够与DNA结合的氨基酸,称为DNA结合位点,预测的DNA结合位点主要用于衡量不同转录因子的标注数据在目标转录因子模型训练过程中的贡献;步骤2:从由预测的DNA结合位点组成的序列中学习转录因子的表示向量;步骤3:从DNA片段的组蛋白修饰特征中学习DNA片段的高阶依存关系;步骤4:从DNA片段的序列特征中学习DNA片段的低阶依存关系;步骤5:将学习的转录因子向量表示、DNA片段的高阶依存关系和低阶依存关系拼接成特征向量并输入多层感知器中对目标DNA片段分类,判定其是否为目标转录因子的结合位点。
-
公开(公告)号:CN110335639A
公开(公告)日:2019-10-15
申请号:CN201910511069.3
申请日:2019-06-13
Applicant: 哈尔滨工业大学(深圳)
IPC: G16B20/30
Abstract: 本发明提供了一种跨转录因子的转录因子结合位点预测算法及装置,所述方法包括如下步骤:步骤1:预测所有转录因子中能够与DNA结合的氨基酸,称为DNA结合位点,预测的DNA结合位点主要用于衡量不同转录因子的标注数据在目标转录因子模型训练过程中的贡献;步骤2:从由预测的DNA结合位点组成的序列中学习转录因子的表示向量;步骤3:从DNA片段的组蛋白修饰特征中学习DNA片段的高阶依存关系;步骤4:从DNA片段的序列特征中学习DNA片段的低阶依存关系;步骤5:将学习的转录因子向量表示、DNA片段的高阶依存关系和低阶依存关系拼接成特征向量并输入多层感知器中对目标DNA片段分类,判定其是否为目标转录因子的结合位点。
-
公开(公告)号:CN111339310B
公开(公告)日:2023-05-16
申请号:CN201911191509.8
申请日:2019-11-28
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/36 , G06F16/951 , G06F16/9536 , G06F40/289 , G06Q50/00
Abstract: 本发明提供了一种面向社交媒体的在线争辩生成方法、系统及存储介质,该在线争辩生成方法包括:步骤1:收集用户在社交媒体上针对热点事件的在线争辩文本数据,对在线争辩文本数据进行人工标注;步骤2:收集与在线争辩文本数据相关的结构化知识与文本知识;步骤3:结合结构化知识与文本知识,利用在线争辩文本数据训练自然语言生成模型;步骤4:在真实争辩文本中,使用自然语言生成模型生成相应的争辩文本,该争辩文本用于改变用户的观点。本发明的有益效果是:本发明结合知识图谱信息,可以充分利用文本信息中的尝试知识,可以生成更流畅、更具有争辩性的文本。
-
公开(公告)号:CN106446264A
公开(公告)日:2017-02-22
申请号:CN201610907526.7
申请日:2016-10-18
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
Abstract: 本发明公开了一种文本表示方法及系统,所述文本表示方法包括:获取文本中词语的相关属性,利用所述文本中词语的相关属性构建基于主体间性的异质网络,所述相关属性至少包括所述词语的社交属性和评论习惯属性;使用网络节点嵌入的学习算法对所述异质网络中不同属性的节点进行连续低维向量表示,得到词语发布者低维连续向量表示及词语评论对象低维连续向量表示;将所述发布者低维连续向量表示及评论对象的低维连续向量表示,应用于文本分类的具体任务并汇总,得到相应的文本分类模型。本发明综合考虑词语的社交属性以及词语的评论习惯属性,给予了词向量更丰富的语义信息,提高了词向量表示学习的精准性,获得更加准确的文本分类结果。
-
公开(公告)号:CN104573031A
公开(公告)日:2015-04-29
申请号:CN201510018617.0
申请日:2015-01-14
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
CPC classification number: G06F17/30684 , G06F17/30654
Abstract: 一种微博突发事件检测方法,包括步骤:降维处理:基于LSH算法对微博数据流中的词汇进行映射处理;创建B-Sketch模型:创建微博数据流中的B-Sketch数据;推测突发事件:根据B-Sketch数据计算微博数据流中的事件加速率a和事件中词的分布向量p,根据事件加速率a判断事件是否为突发事件。由于通过LSH算法将所有词汇映射到低维空间,降低了计算的复杂度,并基于B-Sketch模型推测隐含的突发事件,使得能够快速有效的实时处理微博数据流,及早地检测出突发事件。
-
公开(公告)号:CN110222342A
公开(公告)日:2019-09-10
申请号:CN201910511670.2
申请日:2019-06-13
Applicant: 哈尔滨工业大学(深圳)
Abstract: 一种文本情感原因发现装置,该装置包括词-子句层级结构,包含有四部分:词级别编码器、词级别注意力、子句级别编码器、子句级别注意力;其中,词级别编码器,将文本送入词级别编码器,用于捕获词与词之间的序列特征;词级别注意力,通过当前词语的隐状态表示和与之对应的情绪表达词之间的关系来获得词级别的注意力值,用来指示当前词在其所在的子句中所占的重要程度,然后通过权重和累加操作获得每个子句的表示;子句级别注意力,利用一个分类器来获得当前子句是情感原因的概率,并以此作为子句的注意力值,同时将当前子句距离情绪表达词的距离的分布式表示与子句表示拼接;子句级别编码器,通过子句级编码器获取不同子句之间的结构性信息更新子句表示,通过softmax来获得分类特征的概率分布。通过该装置可以帮助机器更加精准地判断人类触发情感的原因。
-
公开(公告)号:CN106528529A
公开(公告)日:2017-03-22
申请号:CN201610907157.1
申请日:2016-10-18
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明提供了一种词语相似度计算方法及装置。所述词语相似度计算方法包括:收集未标注的词典,对所述词典中的词语进行处理,得到待标注词语对;将所述待标注词语对呈现给标注者,供标注者阅读,采集标注者阅读所述待标注词语对时的脑电信号;对采集到的脑电信号进行处理,基于处理后的脑电信号对相应的词语对进行相似度标注,构建基于脑电信号标注的词语相似度语料库。本发明提供的词语相似度计算方法及装置提高了词语相似度计算的准确性。
-
公开(公告)号:CN106491143A
公开(公告)日:2017-03-15
申请号:CN201610906907.3
申请日:2016-10-18
Applicant: 哈尔滨工业大学深圳研究生院
IPC: A61B5/16
CPC classification number: A61B5/164
Abstract: 本发明提供了一种基于脑电信号的真实性判断方法及装置。所述基于脑电信号的真实性判断方法包括:步骤S1,采集被测试者当前行为的脑电信号;步骤S2,将所述被测试者当前行为的脑电信号与预先存储的样本脑电信号相比对,得到比对结果,所述样本脑电信号包括已知真实性内容的脑电信号及已知虚假内容的脑电信号;步骤S3,根据所述比对结果判断被测试者当前行为是否真实。本发明提供的基于脑电信号的真实性判断方法及装置利用脑电信号的人为主观影响小的特性,提高了真实性判断的准确性。
-
公开(公告)号:CN111339310A
公开(公告)日:2020-06-26
申请号:CN201911191509.8
申请日:2019-11-28
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/36 , G06F16/951 , G06F16/9536 , G06F40/289 , G06Q50/00
Abstract: 本发明提供了一种面向社交媒体的在线争辩生成方法、系统及存储介质,该在线争辩生成方法包括:步骤1:收集用户在社交媒体上针对热点事件的在线争辩文本数据,对在线争辩文本数据进行人工标注;步骤2:收集与在线争辩文本数据相关的结构化知识与文本知识;步骤3:结合结构化知识与文本知识,利用在线争辩文本数据训练自然语言生成模型;步骤4:在真实争辩文本中,使用自然语言生成模型生成相应的争辩文本,该争辩文本用于改变用户的观点。本发明的有益效果是:本发明结合知识图谱信息,可以充分利用文本信息中的尝试知识,可以生成更流畅、更具有争辩性的文本。
-
公开(公告)号:CN106446264B
公开(公告)日:2019-08-27
申请号:CN201610907526.7
申请日:2016-10-18
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F16/35
Abstract: 本发明公开了一种文本表示方法及系统,所述文本表示方法包括:获取文本中词语的相关属性,利用所述文本中词语的相关属性构建基于主体间性的异质网络,所述相关属性至少包括所述词语的社交属性和评论习惯属性;使用网络节点嵌入的学习算法对所述异质网络中不同属性的节点进行连续低维向量表示,得到词语发布者低维连续向量表示及词语评论对象低维连续向量表示;将所述发布者低维连续向量表示及评论对象的低维连续向量表示,应用于文本分类的具体任务并汇总,得到相应的文本分类模型。本发明综合考虑词语的社交属性以及词语的评论习惯属性,给予了词向量更丰富的语义信息,提高了词向量表示学习的精准性,获得更加准确的文本分类结果。
-
-
-
-
-
-
-
-
-