基于特征筛选与半监督学习的用户成长性画像构建方法

    公开(公告)号:CN109359137A

    公开(公告)日:2019-02-19

    申请号:CN201811199944.0

    申请日:2018-10-16

    Abstract: 本发明涉及一种用户成长性画像构建方法,一种基于特征筛选与半监督学习的用户成长性画像构建方法,包括以下步骤:(1)对原始用户数据进行预处理,(2)根据用户的行为数据,提取用户的行为特征和时间特征,(3)在行为特征和时间特征上进行特征筛选,(4)使用半监督学习扩大训练集,(5)训练一级模型,(6)模型融合,(7)用户成长值的预测。本发明除了关注用户的行为特征,还关注了用户的时间特征,并且使用特征筛选的方法选出其中区分度明显的特征,结合半监督方法扩充训练集,最后使用模型融合的方法,提高模型最终的准确率和稳定性。

    面向生物医学文献的跨模态图像模式识别方法

    公开(公告)号:CN108960073A

    公开(公告)日:2018-12-07

    申请号:CN201810575135.9

    申请日:2018-06-05

    Abstract: 一种面向生物医学文献的跨模态图像模式识别方法,属于图像识别和自然语言处理领域,用以解决医学文献中跨模态图像识别问题,技术要点包括:利用预先训练的跨模态复合图像探测模型对图像和文本进行处理,判断待识别图像是否为复合图像;利用预先训练的跨模态复合图像多标签分类模型对图像和文本进行处理,以输出复合图像子图的生物医学模式类别;利用预先训练的跨模态简单图像模式分类模型对图像和文本进行处理,以输出简单图像的生物医学模式类别,效果是:有效地完成生物医学文献中图像模式识别任务,充分利用通用领域和生物医学领域资源改善识别的性能,降低人力和时间成本。

    联合attention机制与神经网络的生物医学实体关系分类方法

    公开(公告)号:CN108875809A

    公开(公告)日:2018-11-23

    申请号:CN201810554915.5

    申请日:2018-06-01

    Inventor: 林鸿飞 郑巍

    Abstract: 一种联合attention机制与神经网络的生物医学实体关系分类方法,属于生物医学和数据挖掘技术领域,用以解决生物医学实体关系分类问题,要点是包括S1、基于指代解析的文本处理;S2、构建基于attention机制的模型输入向量;S3、构建基于双向LSTM的生物医学实体关系分类模型;S4、利用关系分类模型进行生物医学实体关系分类。本发明针对生物文献中的句子设计了基于following的指代解析,然后从构成句子的基本单位单词出发,利用attention机制加权于单词的嵌入向量,突出对生物医学实体关系分类有重要影响的关键词的权重,使候选实体间的关系更清晰明了,进行生物医学实体关系分类。

    一种基于神经网络和幽默特征的幽默识别方法

    公开(公告)号:CN108874896A

    公开(公告)日:2018-11-23

    申请号:CN201810496016.4

    申请日:2018-05-22

    Abstract: 一种基于神经网络和幽默特征的幽默识别方法,属于数据挖掘和自然语言处理领域,用以解决进行幽默识别的问题,要点是包括S1、幽默语料采集及预处理;S2、幽默特征提取;S3、文本的词向量表示;S4、神经网络模型构建;S5、幽默识别结果评价,效果是:对特定形式的幽默数据进行采集和预处理,根据相关成熟的幽默理论,充分考虑到幽默文本的语音特性,构造幽默的语音特征;利用幽默的模糊性特性,提取了句子中拥有同义词最多的词作为特征词并对其进行向量化;采用了深度学习方法,提取了幽默文本背后深层次的语义特征,并将幽默的语音特征和模糊性特征融合到神经网络当中,从而进行幽默识别,在数据集上的实验验证了本发明方法对幽默识别的有效性。

    一种基于排序学习算法的生物医学文献检索方法

    公开(公告)号:CN108520038A

    公开(公告)日:2018-09-11

    申请号:CN201810279010.1

    申请日:2018-03-31

    Abstract: 本发明涉及数据挖掘和搜索引擎技术领域,一种基于排序学习算法的生物医学文献检索方法,包括以下步骤:(1)利用原始查询进行检索并提取结果,(2)构建推荐模型对查询概念进行评级,(3)构建查询优化模型并对原始查询进行细化,(4)构建查询扩展模型并对查询进行扩展,(5)融合排序模型,(6)利用新查询进行检索并提取结果。本发明方法能够利用生物医学领域的知识库等资源对用户提交的原始查询进行扩展,在扩展中使用了排序算法用于扩展词汇重要性度量,通过查询扩展过程对用户提交的查询进行了补充和完善,保证了查询结果的准确性,进一步满足了用户的信息需求。

    一种专利技术预测方法及系统

    公开(公告)号:CN105760946A

    公开(公告)日:2016-07-13

    申请号:CN201610067078.4

    申请日:2016-01-29

    Inventor: 林鸿飞 赵虹杰

    Abstract: 一种专利技术预测方法及系统,包括:S1、预处理、S2、获取词语重要程度、S3、构建高权词集、S4、计算时间因子、S5、获取关联强度、S6、构建词语关联图、S7、专利技术预测。本发明从专利摘要出发,通过对专利摘要的量化处理构建词语关联图,并通过从词语关联图的局部范围和全局范围衡量词语的重要程度,进行专利技术预测,挖掘出可能成为主流的专利技术,为公众提供一定的指导和参考。

    一种融合社会化信息的个性化推荐方法

    公开(公告)号:CN105740430A

    公开(公告)日:2016-07-06

    申请号:CN201610067099.6

    申请日:2016-01-29

    Inventor: 林鸿飞 练绪宝

    CPC classification number: G06F17/30867 G06Q50/01

    Abstract: 一种融合社会化信息的个性化推荐方法,包括以下步骤:S1、构建用户?用户信任矩阵;S2、构建项目?项目标签相似度矩阵;S3、构建及训练模型:S4、预测用户对于未知项目的偏好。本发明主要有如下优点:1) 将信息检索领域中排序学习的方法应用到Top?K推荐中,有效地解决了推荐系统中的排序问题,同时克服了传统的基于评分预测方法无法有效进行Top?K推荐的缺点;2) 在基于排序学习的模型中融合了社会化信息即用户社交信息和项目标签信息,提高了推荐结果的准确率。

Patent Agency Ranking