-
公开(公告)号:CN111339310B
公开(公告)日:2023-05-16
申请号:CN201911191509.8
申请日:2019-11-28
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/36 , G06F16/951 , G06F16/9536 , G06F40/289 , G06Q50/00
Abstract: 本发明提供了一种面向社交媒体的在线争辩生成方法、系统及存储介质,该在线争辩生成方法包括:步骤1:收集用户在社交媒体上针对热点事件的在线争辩文本数据,对在线争辩文本数据进行人工标注;步骤2:收集与在线争辩文本数据相关的结构化知识与文本知识;步骤3:结合结构化知识与文本知识,利用在线争辩文本数据训练自然语言生成模型;步骤4:在真实争辩文本中,使用自然语言生成模型生成相应的争辩文本,该争辩文本用于改变用户的观点。本发明的有益效果是:本发明结合知识图谱信息,可以充分利用文本信息中的尝试知识,可以生成更流畅、更具有争辩性的文本。
-
公开(公告)号:CN115859922A
公开(公告)日:2023-03-28
申请号:CN202211440697.5
申请日:2022-11-17
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F40/166 , G06F40/12
Abstract: 本申请公开了一种文章生成方法、电子设备及存储介质,文章生成方法包括:获取文章题目,以利用题目编码器对文章题目进行编码,得到题目编码特征,利用规划解码器对题目编码特征进行文章规划预测,得到目标规划特征;进而,利用写作解码器按照目标规划特征和题目编码特征进行文章预测,得到与文章题目对应的目标预测文章。通过上述方式,本申请公开的文章生成方法可以将规划解码器和写作解码器分开使用,将文章规划和文章写作分离,以实现基于文章题目生成文章。
-
公开(公告)号:CN115292551A
公开(公告)日:2022-11-04
申请号:CN202210793375.2
申请日:2022-07-05
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/901 , G06N3/04 , G06N3/08 , G06N5/04 , G06F40/279
Abstract: 本申请公开了事件因果关系识别模型的识别方法、设备及存储介质。该方法包括:基于文档的文本内容建立以向量表征的实例节点、事件节点以及文档节点;将各实例节点、事件节点与文档节点之间有条件地进行连接,以构建关系图模型;通过图卷积网络对关系图模型进行训练,以利用与每个实例节点、每个事件节点以及文档节点连接的其他节点对应更新各节点;基于更新后的各节点,通过节点之间已建立的连接关系获得两个事件节点之间的连接路径;基于两个事件节点之间的连接路径,计算两个事件节点之间的因果概率,以识别两个事件节点对应的文本事件之间的因果关系。通过上述方式,本申请实现以事件为单位进行因果关系识别,降低因果关系识别的误差。
-
公开(公告)号:CN113486665A
公开(公告)日:2021-10-08
申请号:CN202110757350.2
申请日:2021-07-05
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F40/295 , G06F21/62 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种隐私保护文本命名实体识别方法、装置、计算机设备及存储介质,方法包括:接收多个数据持有方发送的多个训练好的教师模型,所述教师模型通过使用源数据进行训练,包括第一预训练网络和第一序列标注层,所述源数据为标注文本数据;根据多个训练好的教师模型,利用无标签的迁移集合进行多教师知识蒸馏从而训练学生模型,所述学生模型包括第二预训练网络和第二序列标注层;利用训练好的学生模型对无标签文本数据的命名实体进行预测。本发明将知识蒸馏应用于数据分散的真实场景,在数据可用不可见的前提下,通过无标签的迁移集合,训练出强大的学生模型,从而在隐私保护的前提下,保证学生模型在命名实体识别任务上的泛化性和准确性。
-
公开(公告)号:CN110321479B
公开(公告)日:2021-07-20
申请号:CN201910447142.5
申请日:2019-05-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/9535 , G06F21/62
Abstract: 一种隐私保护移动服务推荐方法及客户端、推荐系统,其中隐私保护移动服务推荐方法包括以下步骤:获取用户的样本数据,样本数据为用户的个人信息的省却信息、虚假信息、粗粒度信息或细粒度信息;根据样本数据从一网络服务提供商接收第一服务推荐列表;根据用户的细粒度信息从第一服务推荐列表中筛选且生成第二服务推荐列表;将第二服务推荐列表展示给用户。由于将第一服务推荐列表下载到本地客户端来辅助生成符合用户需求的第二服务推荐列表,使得在保证用户个人信息不受网络服务提供商侵犯的前提下,实现了为用户提供准确推荐服务的功能,能够维持移动服务推荐精度与保护用户隐私之间的平衡,利于用户更好地管理好个人信息。
-
公开(公告)号:CN106528528A
公开(公告)日:2017-03-22
申请号:CN201610907156.7
申请日:2016-10-18
Applicant: 哈尔滨工业大学深圳研究生院
CPC classification number: G06F17/271 , G06F16/35 , G06F17/2785
Abstract: 本发明涉及自然语言处理技术领域,提供了一种文本情感分析的方法及装置。所述文本情感分析的方法包括以下步骤:获取原始语料,使用带有条件随机场的双向LSTM神经网络对所述原始语料的语句中的情感表达目标进行分析和识别;统计识别出的所述情感表达目标的数量,并根据所述情感表达目标的数量将所述语句判断为无情感表达目标的语句、带有一个情感表达目标的语句或带有多个情感表达目标的语句;将所述原始语料中的无情感表达目标的语句、带有一个情感表达目标的语句和/或带有多个情感表达目标的语句分别输入到三个一维卷积神经网络中进行情感分类,得到情感分类结果。本发明提高了文本情感分类的效率、准确性和容错性,能满足大规模语料处理的需求。
-
公开(公告)号:CN106502394A
公开(公告)日:2017-03-15
申请号:CN201610907518.2
申请日:2016-10-18
Applicant: 哈尔滨工业大学深圳研究生院
CPC classification number: G06F3/015 , G06F17/2765 , G06F2203/011 , G06K9/00503
Abstract: 本发明提供了一种基于脑电信号的词向量计算方法及装置,所述基于脑电信号的词向量计算方法包括:步骤S1,收集文本语料库,对文本语料库中的语料进行处理,得到以词组为单位的连续短语格式的语料;步骤S2,将连续短语格式的语料呈现给标注者,供标注者阅读,采集标注者阅读每一词组时的脑电信号;步骤S3,将采集到的词组对应的脑电信号作为预测目标,训练词向量,以当前词组为特征预测其上下文的脑电信号,构建基于脑电信号的词向量表示模型。本发明通过上述方案提高了词向量计算的准确性。
-
公开(公告)号:CN106446264A
公开(公告)日:2017-02-22
申请号:CN201610907526.7
申请日:2016-10-18
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
Abstract: 本发明公开了一种文本表示方法及系统,所述文本表示方法包括:获取文本中词语的相关属性,利用所述文本中词语的相关属性构建基于主体间性的异质网络,所述相关属性至少包括所述词语的社交属性和评论习惯属性;使用网络节点嵌入的学习算法对所述异质网络中不同属性的节点进行连续低维向量表示,得到词语发布者低维连续向量表示及词语评论对象低维连续向量表示;将所述发布者低维连续向量表示及评论对象的低维连续向量表示,应用于文本分类的具体任务并汇总,得到相应的文本分类模型。本发明综合考虑词语的社交属性以及词语的评论习惯属性,给予了词向量更丰富的语义信息,提高了词向量表示学习的精准性,获得更加准确的文本分类结果。
-
公开(公告)号:CN104573031A
公开(公告)日:2015-04-29
申请号:CN201510018617.0
申请日:2015-01-14
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
CPC classification number: G06F17/30684 , G06F17/30654
Abstract: 一种微博突发事件检测方法,包括步骤:降维处理:基于LSH算法对微博数据流中的词汇进行映射处理;创建B-Sketch模型:创建微博数据流中的B-Sketch数据;推测突发事件:根据B-Sketch数据计算微博数据流中的事件加速率a和事件中词的分布向量p,根据事件加速率a判断事件是否为突发事件。由于通过LSH算法将所有词汇映射到低维空间,降低了计算的复杂度,并基于B-Sketch模型推测隐含的突发事件,使得能够快速有效的实时处理微博数据流,及早地检测出突发事件。
-
-
-
-
-
-
-
-