一种融合领域知识的医疗对话意图识别方法

    公开(公告)号:CN113268594A

    公开(公告)日:2021-08-17

    申请号:CN202110559683.4

    申请日:2021-05-21

    Abstract: 一种融合领域知识的医疗对话意图识别方法,属于医疗对话和意图识别技术领域,该方法包括以下步骤:S1、语料采集和预处理,划分对话数据;S2、领域知识检索:采用检索方法获取相关的问题,以及相应问题的答案,检索模型将用户提问u和待检索的问题基于意图词的频率计算二者相似度,进而根据相似度由高到低进行排序;S3、输入单词的序列,通过领域知识问答对向量计算注意力权重,融合领域知识的对话问句表示:S4、基于组排序损失的意图识别采用面向多样化意图的组排序损失函数,训练意图识别模型,实现意图词的识别和分类。本方法可以显著提升医疗对话中用户意图识别的效果,有助于医疗对话系统的整体优化。

    一种面向代码检索的查询扩展方法

    公开(公告)号:CN108491407B

    公开(公告)日:2021-01-08

    申请号:CN201810067067.5

    申请日:2018-01-24

    Inventor: 林鸿飞 徐博 林原

    Abstract: 一种面向代码检索的查询扩展方法,包括:A、语料采集和预处理;B、初次检索获取候选扩展词;C、查询扩展词集提取;D、基于扩展查询的二次检索。本发明基于查询词与扩展词的共现信息和扩展词在代码文件内的分布信息实现有效的面向代码检索的查询扩展,有助于改善现有代码检索中查询与代码片段的匹配问题,提升代码检索中扩展查询的质量和代码检索的整体性能。当将本发明应用于真实代码检索场景时,代码检索的准确率可以达到35.34%,显著提升现有代码检索方法的性能,有助于实现代码检索中查询意图的精确理解。

    面向社交媒体文本抑郁倾向性分析的基于排序学习模型的特征加权方法

    公开(公告)号:CN113268582B

    公开(公告)日:2024-12-17

    申请号:CN202110559680.0

    申请日:2021-05-21

    Abstract: 一种面向社交媒体文本抑郁倾向性分析的基于排序学习模型的特征加权方法,该方法包括以下步骤:S1、采集和预处理社交媒体文本数据;S2、面向抑郁情绪的文本特征抽取;S3、训练排序模型;S4、基于排序模型的抑郁风险评估。采集社交媒体文本上用户所发布的文本数据,文本数据包括“抑郁”话题下的数据和其他话题下的数据,“抑郁”话题下的数据作为模型训练中的正样本,其他话题下的数据作为模型训练的负样本;本发明将基于社交媒体的抑郁检测看作是风险评估问题,进而利用排序学习算法,对于具有潜在抑郁风险的社交媒体用户进行风险水平的排序,有益于早期检测出具有抑郁倾向的用户,有针对性的开展心理疏导和临床治疗。

    一种结合排序学习的电影排名预测方法

    公开(公告)号:CN109034908A

    公开(公告)日:2018-12-18

    申请号:CN201810892082.3

    申请日:2018-08-07

    CPC classification number: G06Q30/0202

    Abstract: 一种结合排序学习的电影排名预测方法,属于数据挖掘技术领域,用于对电影的排名进行预测,要点是包括S1、电影数据获取与解析;S2、多类电影特征的抽取与拓展;S3、数据规整及标注对齐;S4、数据格式化以及评价指标领域化迁移;S5、利用排序学习模型预测电影排名结果。本发明针对电影排名预测主题,构建了从原始数据获取、特征工程、模型构建等完整的技术方案,提高了电影排名预测的性能。

    一种面向代码检索的查询扩展方法

    公开(公告)号:CN108491407A

    公开(公告)日:2018-09-04

    申请号:CN201810067067.5

    申请日:2018-01-24

    Inventor: 林鸿飞 徐博 林原

    Abstract: 一种面向代码检索的查询扩展方法,包括:A、语料采集和预处理;B、初次检索获取候选扩展词;C、查询扩展词集提取;D、基于扩展查询的二次检索。本发明基于查询词与扩展词的共现信息和扩展词在代码文件内的分布信息实现有效的面向代码检索的查询扩展,有助于改善现有代码检索中查询与代码片段的匹配问题,提升代码检索中扩展查询的质量和代码检索的整体性能。当将本发明应用于真实代码检索场景时,代码检索的准确率可以达到35.34%,显著提升现有代码检索方法的性能,有助于实现代码检索中查询意图的精确理解。

    基于协同增强的词项级查询扩展方法

    公开(公告)号:CN118467708B

    公开(公告)日:2024-09-10

    申请号:CN202410924102.6

    申请日:2024-07-11

    Abstract: 本发明提供了一种基于协同增强的词项级查询扩展方法,属于信息技术和人工智能领域。本发明通过使用零样本提示的生成式与检索式方式获得语义信息更为丰富的协同增强的相关反馈,并基于同样的协同增强方式获得与查询更为相关的查询扩展词;本发明证明这些词语作为查询扩展词的有效性,并且与仅伪相关文档的方法相比较,本发明获得的查询扩展词更为丰富与多样;在获得高质量的查询扩展词列表后,开发了一种基于通义千问大语言模型的扩展词排序模型来对查询扩展词列表进行精排获得相关性排名更为精确的查询扩展词列表,从而用于信息检索流水线中查询端的查询扩展框架中,显著提升了检索算法的性能。

    基于双重协作生成式对抗网络的排序学习方法

    公开(公告)号:CN111783980A

    公开(公告)日:2020-10-16

    申请号:CN202010594875.4

    申请日:2020-06-28

    Abstract: 一种基于双重协作生成式对抗网络的排序学习方法,该生成式对抗网络包含三个角色:导师,生成器和判别器,该方法主要步骤包括:S1、构建排序学习所需数据集步骤;S2、创建导师网络和生成器网络步骤;S3、创建判别器网络步骤;S4、数据细节及参数设置步骤;S5、T-G网络模型迭代训练步骤;S6、G-D网络模型迭代训练步骤;S7、多指标有效性测试结果返回步骤,效果是改善了用于排序学习的生成式对抗网络,在先前的知识体系基础上,通过导师与生成器之间的交互帮助与监督,减少了生成器和判别器之间的差异,提高了生成器的效率与有效性,在训练过程中大大削弱了过拟合的风险,改善了排序学习的性能。

    面向社交媒体文本抑郁倾向性分析的基于排序学习模型的特征加权方法

    公开(公告)号:CN113268582A

    公开(公告)日:2021-08-17

    申请号:CN202110559680.0

    申请日:2021-05-21

    Abstract: 一种面向社交媒体文本抑郁倾向性分析的基于排序学习模型的特征加权方法,该方法包括以下步骤:S1、采集和预处理社交媒体文本数据;S2、面向抑郁情绪的文本特征抽取;S3、训练排序模型;S4、基于排序模型的抑郁风险评估。采集社交媒体文本上用户所发布的文本数据,文本数据包括“抑郁”话题下的数据和其他话题下的数据,“抑郁”话题下的数据作为模型训练中的正样本,其他话题下的数据作为模型训练的负样本;本发明将基于社交媒体的抑郁检测看作是风险评估问题,进而利用排序学习算法,对于具有潜在抑郁风险的社交媒体用户进行风险水平的排序,有益于早期检测出具有抑郁倾向的用户,有针对性的开展心理疏导和临床治疗。

Patent Agency Ranking