-
公开(公告)号:CN104866554A
公开(公告)日:2015-08-26
申请号:CN201510246503.1
申请日:2015-05-15
Applicant: 大连理工大学
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 一种基于社会化标注的个性化搜索方法及系统,该方法包括以下步骤:A、预处理网页内容:B、在提取内容集中提取相关向量:C、计算用户相似度:D、选取相似用户E、计算用户对文档的个性化标签向量F、计算用户的扩展属性向量;G、文档打分及排序;本发明的搜索方法及系统通过用户给出的标签深度挖掘用户的偏好兴趣,即从网页用户的标注信息出发,使用用户主动公开的信息进行个性化优化,避免了隐私和冷启动的问题,完全基于用户本身进行考虑,较好地提升了搜索的准确度。
-
公开(公告)号:CN104834735A
公开(公告)日:2015-08-12
申请号:CN201510254719.2
申请日:2015-05-18
Applicant: 大连理工大学
IPC: G06F17/30
CPC classification number: G06F17/30719
Abstract: 一种基于词向量的文档摘要自动提取方法,包括以下步骤:S1、利用深度神经网络模型训练语料获取特征词的词向量表示;S2、构建句子图模型;S3、计算句子权重;S4、利用最大边缘相关算法生成摘要。本发明通过采集语料集并对该语料集进行预处理,得到训练特征语料集;并利用深度神经网络模型对所构建的训练特征语料集进行训练,用于得到特征词的词向量;语料集中根据预设查询词得到候选文档集合及候选句子集合,再根据特征词的词向量得到句子间的语义相似性,从而得到两个句子之间的语义联系,避免了传统基于词共现计算方法在同义不同词情况下出现的计算误差问题,从而提高相似性计算的准确性和摘要性能。
-
-
公开(公告)号:CN111783980B
公开(公告)日:2023-04-07
申请号:CN202010594875.4
申请日:2020-06-28
Applicant: 大连理工大学
Abstract: 一种基于双重协作生成式对抗网络的排序学习方法,该生成式对抗网络包含三个角色:导师,生成器和判别器,该方法主要步骤包括:S1、构建排序学习所需数据集步骤;S2、创建导师网络和生成器网络步骤;S3、创建判别器网络步骤;S4、数据细节及参数设置步骤;S5、T‑G网络模型迭代训练步骤;S6、G‑D网络模型迭代训练步骤;S7、多指标有效性测试结果返回步骤,效果是改善了用于排序学习的生成式对抗网络,在先前的知识体系基础上,通过导师与生成器之间的交互帮助与监督,减少了生成器和判别器之间的差异,提高了生成器的效率与有效性,在训练过程中大大削弱了过拟合的风险,改善了排序学习的性能。
-
公开(公告)号:CN115237424A
公开(公告)日:2022-10-25
申请号:CN202210922180.3
申请日:2022-08-02
Applicant: 大连理工大学
IPC: G06F8/41
Abstract: 本发明公开了基于KNN解码增强的代码摘要生成方法及系统,基于代码摘要模型中的编码器对代码序列上下文语义信息进行向量表示;基于模型中的解码器对向量进行解码输出对应的预测摘要;同时在解码器后创新性的加入一个基于标注语料训练得到的存储向量‑单词数据对的离线数据库,使得模型每个时间步的预测同时对原模型解码器端的输出和使用KNN算法参考离线数据库的判断进行加权概率分布。本发明使用非参数的方法将KNN加入原模型的概率输出分布函数上,在原本输出的基础上起到了解码增强的作用,证明了基于KNN解码增强的代码摘要生成方法及系统的实用性,提高了模型对代码摘要的质量,以及模型的泛化性,同时降低了模型的迁移难度。
-
公开(公告)号:CN113468874A
公开(公告)日:2021-10-01
申请号:CN202110643976.0
申请日:2021-06-09
Applicant: 大连理工大学
IPC: G06F40/279 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 一种基于图卷积自编码的生物医学关系抽取方法,为了充分利用依赖关系,有效捕获语义结构,并降低计算成本,包括卷积自编码器通过编码器对所述不同子空间的邻接矩阵编码,通过解码器对编码器输出的邻接矩阵进行重构,得到维度与输入矩阵相同的邻接矩阵;将从获得单词的隐层状态表示和重构的邻接矩阵输入到N个单独图卷积网络中,编码不同子空间表示,使图卷积网络编码依存森林中长距离依赖特征;将不同子空间表示串联,获得所有子空间信息的输出向量,经过全连接层获得各节点输出向量后进行关系分类,实验结果证明,本模型可以更有效地捕获依赖信息,获取语义结构。
-
公开(公告)号:CN112597271A
公开(公告)日:2021-04-02
申请号:CN202011103541.9
申请日:2020-10-15
Applicant: 大连理工大学
IPC: G06F16/33 , G06F16/35 , G06F16/951 , G06K9/62
Abstract: 一种面向庭审过程中犯罪嫌疑人态度预测的方法,属于智能司法的领域,用于对犯罪嫌疑人态度进行预测,要点是包括S1、庭审数据的获取与解析;S2、数据规整及标注对齐;S3、庭审过程多模态信息的抽取与拓展;S4、利用多模态信息对犯罪嫌疑人态度进行预测。效果是针对智能司法中的庭审过程,构建了从原始数据获取、特征工程、模型构建等完整的流程框架,在犯罪嫌疑人态度预测任务上实现了较好的预测性能。
-
公开(公告)号:CN111966827A
公开(公告)日:2020-11-20
申请号:CN202010724469.5
申请日:2020-07-24
Applicant: 大连理工大学
IPC: G06F16/35 , G06F16/335 , G06F40/211 , G06F40/30 , G06N3/04 , G06F16/332
Abstract: 一种基于异构二部图的对话情感分析方法,属于数据挖掘技术领域,用以解决对话文本中用户的情绪识别任务的问题,要点是包括S1、中文对话情感分析数据集的构建;S2、构建基于依存关系的异构二部图;S3、构建并拼接文本的语义表示和句法表示;S4、利用文本分类模型预测情感极性,效果是将对话文本的依存关系表示为异构二部图形式,与经典的情感分析模型相结合建模文本的语义和句法特征,在对话情感分析任务上实现了优秀的预测性能。
-
公开(公告)号:CN108021616B
公开(公告)日:2020-08-14
申请号:CN201711077790.3
申请日:2017-11-06
Applicant: 大连理工大学
IPC: G06F16/332 , G06F40/284 , G06F40/30 , G06F40/253
Abstract: 本发明公开了一种基于循环神经网络的社区问答专家推荐方法,其包括:对数据进行预处理;对所述问答社区所对应的全部用户进行候选专家筛选;构建各所述候选专家所对应的专家用户档案;基于特定领域知识的词向量训练获得词向量查找表;基于循环神经网络模型进行特征表示学习并构建社区问答专家推荐模型;基于构建社区问答专家推荐模型,确定待处理问答社区中的新的问题所对应的专家推荐顺序。本发明能有效地表示句子的语法和语义信息并且能够挖掘句子级别的高层次特征,减少了人工干预,并能进行自动的训练和学习。
-
公开(公告)号:CN108897989A
公开(公告)日:2018-11-27
申请号:CN201810572450.6
申请日:2018-06-06
Applicant: 大连理工大学
Abstract: 本发明涉及一种生物事件抽取方法,一种基于候选事件元素注意力机制的生物事件抽取方法,包括以下步骤:(1)训练语料预处理,(2)使用PubMed数据库语料进行词向量训练,(3)构建序列的分布式表示方式,(4)构造基于BiLSTM-Attention的特征表示方式,(5)使用CRF学习、获取当前文档序列的最优序列标注结果,(6)生物事件抽取。本发明方法具有以下优点:一是采用序列标注的方式进行针对触发词的事件元素识别,可以对一个触发词识别多个事件元素,二是构建了针对候选事件元素的Attention层,相比于传统的序列标注方法可以增加对候选事件元素的注意力权重,三是简化了生成事件的步骤。
-
-
-
-
-
-
-
-
-