一种融合领域知识的医疗对话意图识别方法

    公开(公告)号:CN113268594A

    公开(公告)日:2021-08-17

    申请号:CN202110559683.4

    申请日:2021-05-21

    Abstract: 一种融合领域知识的医疗对话意图识别方法,属于医疗对话和意图识别技术领域,该方法包括以下步骤:S1、语料采集和预处理,划分对话数据;S2、领域知识检索:采用检索方法获取相关的问题,以及相应问题的答案,检索模型将用户提问u和待检索的问题基于意图词的频率计算二者相似度,进而根据相似度由高到低进行排序;S3、输入单词的序列,通过领域知识问答对向量计算注意力权重,融合领域知识的对话问句表示:S4、基于组排序损失的意图识别采用面向多样化意图的组排序损失函数,训练意图识别模型,实现意图词的识别和分类。本方法可以显著提升医疗对话中用户意图识别的效果,有助于医疗对话系统的整体优化。

    基于特征筛选与半监督学习的用户成长性画像构建方法

    公开(公告)号:CN109359137B

    公开(公告)日:2021-03-26

    申请号:CN201811199944.0

    申请日:2018-10-16

    Abstract: 本发明涉及一种用户成长性画像构建方法,一种基于特征筛选与半监督学习的用户成长性画像构建方法,包括以下步骤:(1)对原始用户数据进行预处理,(2)根据用户的行为数据,提取用户的行为特征和时间特征,(3)在行为特征和时间特征上进行特征筛选,(4)使用半监督学习扩大训练集,(5)训练一级模型,(6)模型融合,(7)用户成长值的预测。本发明除了关注用户的行为特征,还关注了用户的时间特征,并且使用特征筛选的方法选出其中区分度明显的特征,结合半监督方法扩充训练集,最后使用模型融合的方法,提高模型最终的准确率和稳定性。

    一种面向代码检索的查询扩展方法

    公开(公告)号:CN108491407B

    公开(公告)日:2021-01-08

    申请号:CN201810067067.5

    申请日:2018-01-24

    Inventor: 林鸿飞 徐博 林原

    Abstract: 一种面向代码检索的查询扩展方法,包括:A、语料采集和预处理;B、初次检索获取候选扩展词;C、查询扩展词集提取;D、基于扩展查询的二次检索。本发明基于查询词与扩展词的共现信息和扩展词在代码文件内的分布信息实现有效的面向代码检索的查询扩展,有助于改善现有代码检索中查询与代码片段的匹配问题,提升代码检索中扩展查询的质量和代码检索的整体性能。当将本发明应用于真实代码检索场景时,代码检索的准确率可以达到35.34%,显著提升现有代码检索方法的性能,有助于实现代码检索中查询意图的精确理解。

    一种基于文档级别注意力机制的事件触发词抽取方法

    公开(公告)号:CN108829801B

    公开(公告)日:2020-11-20

    申请号:CN201810572351.8

    申请日:2018-06-06

    Abstract: 本发明涉及一种事件触发词抽取方法,一种基于文档级别注意力机制的事件触发词抽取方法,包括以下步骤:(1)训练语料预处理,(2)使用PubMed数据库语料进行词向量训练,(3)构建样本的分布式表示方式,(4)构造基于BiLSTM‑Attention的特征表示方式,(5)使用CRF学习、获取当前文档序列的最优序列标注结果,(6)事件触发词的抽取。本发明方法具有以下优点:一是采用BIO标签标注方式,实现了包括对多词触发词的识别;二是针对触发词识别任务,构建了相应的单词和特征的分布式表示方式;三是提出了BiLSTM‑Attention模型,通过引入Attention机制,实现了针对当前输入的文档级别信息的分布式表达构造,提高触发词识别效果。

    一种基于循环神经网络的查询词项权重学习方法

    公开(公告)号:CN106056209B

    公开(公告)日:2019-04-19

    申请号:CN201610346162.X

    申请日:2016-05-23

    Abstract: 一种基于循环神经网络的查询词项权重学习方法,包括S1、搜索最优词项权重、S2、构造查询词项特征向量、S3、构建查询词项权重学习模型、S4、利用查询词项权重学习模型预测查询词项权重。本发明将查询词项权重预测问题转换为序列标注问题,创新性地提出了一种基于循环神经网络的查询词项权重学习方法,实现了自动和高效地对查询词项权重进行预测,在数据集上的主要评价指标MAP上提高幅度分别为16.8%(Robust04)和11.8%(GOV2),验证了本发明方法对查询词项权重学习任务的有效性。

    一种社交媒体事件级新闻中新闻媒体影响力评估方法

    公开(公告)号:CN108959364A

    公开(公告)日:2018-12-07

    申请号:CN201810486091.2

    申请日:2018-05-21

    CPC classification number: G06Q50/01

    Abstract: 一种社交媒体事件级新闻中新闻媒体影响力评估方法,属于数据挖掘和复杂网络技术领域,用于解决评估新闻媒体影响力的问题,技术要点是包括R1、采集社交媒体数据,构建事件语料库;R2、统计语料库中各用户的相关数据;R3、构建转发网络;R4、构建评价模型评估新闻媒体影响力;R5、以国家为单位,对影响力进行可视化;本发明可以从事件层面出发,评估新闻媒体影响力,并以国家为单位对影响力进行展示。

    一种基于多故事线的微博事件摘要提取方法

    公开(公告)号:CN105787121B

    公开(公告)日:2018-08-14

    申请号:CN201610179286.3

    申请日:2016-03-25

    Inventor: 林鸿飞 刘龙飞

    Abstract: 一种基于多故事线的微博事件摘要提取方法,包括:S1、微博语料预处理;S2、微博矢量化;S3、初步提取微博事件故事线;S4、故事线合并;S5、故事线重构;S6、展示摘要结果。本发明利用词嵌入技术将微博矢量化,通过矢量余弦值获得微博间的相似度配合改进条件随机域方法,实现故事线的构建与合并;本发明对某一微博事件可以生成一份包含多条故事线的微博事件摘要,故事线中的节点内容为该时间段内最有代表性微博。通过多条故事线对事件的多个方面进行刻画,可以让用户更加高效、更加全面的了解某个微博事件。为了评估摘要的优劣,在n位置上的精度P@N被选作度量标准。本发明达到的精度基本上维持在0.6以上,明显优于现有方法。

    一种融合社会化信息的个性化推荐方法

    公开(公告)号:CN105740430B

    公开(公告)日:2018-08-14

    申请号:CN201610067099.6

    申请日:2016-01-29

    Inventor: 林鸿飞 练绪宝

    Abstract: 一种融合社会化信息的个性化推荐方法,包括以下步骤:S1、构建用户‑用户信任矩阵;S2、构建项目‑项目标签相似度矩阵;S3、构建及训练模型:S4、预测用户对于未知项目的偏好。本发明主要有如下优点:1)将信息检索领域中排序学习的方法应用到Top‑K推荐中,有效地解决了推荐系统中的排序问题,同时克服了传统的基于评分预测方法无法有效进行Top‑K推荐的缺点;2)在基于排序学习的模型中融合了社会化信息即用户社交信息和项目标签信息,提高了推荐结果的准确率。

    一种基于特征自动学习的生物医学事件触发词识别方法

    公开(公告)号:CN105512209B

    公开(公告)日:2018-06-19

    申请号:CN201510848996.6

    申请日:2015-11-28

    Abstract: 本发明涉及生物医学技术领域,一种基于特征自动学习的生物医学事件触发词识别方法,包括以下步骤:1、数据预处理,2、构建事件触发词词典,3、构建候选触发词实例,4、卷积神经网络模型学习特征,5、神经网络模型训练,6、事件触发词分类。本发明方法具有以下优点:一是,简化了对数据的复杂预处理,省去了人工进行特征设计的繁琐步骤;二是,引入了领域知识,有效地利用了大量未标注语料等外部资源;三是,使用卷积神经网络进行特征的自动学习,不仅减少了人工干预,而且能够挖掘和探索到更深层次的句子级别特征,并通过融合局部特征,发现了隐含的全局特征,有助于识别触发词类别;四是,本发明方法在MLEE语料上得到了较好的实验结果,事件触发词检测的整体性能有所提高。

    一种基于循环神经网络的社区问答专家推荐方法

    公开(公告)号:CN108021616A

    公开(公告)日:2018-05-11

    申请号:CN201711077790.3

    申请日:2017-11-06

    Abstract: 本发明公开了一种基于循环神经网络的社区问答专家推荐方法,其包括:对数据进行预处理;对所述问答社区所对应的全部用户进行候选专家筛选;构建各所述候选专家所对应的专家用户档案;基于特定领域知识的词向量训练获得词向量查找表;基于循环神经网络模型进行特征表示学习并构建社区问答专家推荐模型;基于构建社区问答专家推荐模型,确定待处理问答社区中的新的问题所对应的专家推荐顺序。本发明能有效地表示句子的语法和语义信息并且能够挖掘句子级别的高层次特征,减少了人工干预,并能进行自动的训练和学习。

Patent Agency Ranking