一种短文本实体消歧方法

    公开(公告)号:CN112906397B

    公开(公告)日:2021-11-19

    申请号:CN202110366911.6

    申请日:2021-04-06

    Applicant: 南通大学

    Abstract: 本发明提供一种基于深度学习的短文本实体消歧方法,主要用于解决语句中的实体在不同的短文本中存在含义不同指向的问题,包括如下步骤:步骤1、使用jieba分词技术对语句进行分词,找出待消歧实体,并且使用上市公司实体及其缩写作为词典;步骤2、对句子以待消歧实体为中心,32字大小进行切分;步骤3、将含有待消歧实体的语句转换为Bidirectional Encoder Representation from Transformers(BERT)词向量模型;步骤4、将词向量模型分批次放入到Long‑Short Term Memory RNN(LSTM)模型中,通过交叉熵进行损失函数计算,不断优化参数,获得最终模型。本发明不仅可以在特殊领域如公司实体上取得很好的结果,也可以在一般领域取得不错的结果。

    一种基于词嵌入技术的API推荐方法

    公开(公告)号:CN110990003B

    公开(公告)日:2021-11-23

    申请号:CN201911118507.6

    申请日:2019-11-15

    Applicant: 南通大学

    Abstract: 本发明提供一种基于词嵌入技术的API推荐方法,给开发人员推荐合适的API,属于代码推荐的技术领域,包括如下步骤:步骤1、收集Java帮助文档和Stack Overflow上Java语言的问答数据集;步骤2、通过收集得到的Stack Overflow中的数据进行词嵌入建模;步骤3、通过UI界面收集开发者输入的问题,使用单词模型和TF‑IDF来计算与目标问题集之间的相似度,并使用LSA模型来过滤候选问题列表;步骤4、通过LDA提取主题词,最后从Java帮助文档中得到API推荐信息,开发者使用本发明进行API查询的时候,能够给开发者推荐出较为准确的API信息。

    一种短文本实体消歧方法

    公开(公告)号:CN112906397A

    公开(公告)日:2021-06-04

    申请号:CN202110366911.6

    申请日:2021-04-06

    Applicant: 南通大学

    Abstract: 本发明提供一种基于深度学习的短文本实体消歧方法,主要用于解决语句中的实体在不同的短文本中存在含义不同指向的问题,包括如下步骤:步骤1、使用jieba分词技术对语句进行分词,找出待消歧实体,并且使用上市公司实体及其缩写作为词典;步骤2、对句子以待消歧实体为中心,32字大小进行切分;步骤3、将含有待消歧实体的语句转换为Bidirectional Encoder Representation from Transformers(BERT)词向量模型;步骤4、将词向量模型分批次放入到Long‑Short Term Memory RNN(LSTM)模型中,通过交叉熵进行损失函数计算,不断优化参数,获得最终模型。本发明不仅可以在特殊领域如公司实体上取得很好的结果,也可以在一般领域取得不错的结果。

    一种基于词嵌入技术的API推荐方法

    公开(公告)号:CN110990003A

    公开(公告)日:2020-04-10

    申请号:CN201911118507.6

    申请日:2019-11-15

    Applicant: 南通大学

    Abstract: 本发明提供一种基于词嵌入技术的API推荐方法,给开发人员推荐合适的API,属于代码推荐的技术领域,包括如下步骤:步骤1、收集Java帮助文档和Stack Overflow上Java语言的问答数据集;步骤2、通过收集得到的Stack Overflow中的数据进行词嵌入建模;步骤3、通过UI界面收集开发者输入的问题,使用单词模型和TF-IDF来计算与目标问题集之间的相似度,并使用LSA模型来过滤候选问题列表;步骤4、通过LDA提取主题词,最后从Java帮助文档中得到API推荐信息,开发者使用本发明进行API查询的时候,能够给开发者推荐出较为准确的API信息。

Patent Agency Ranking