一种基于协同训练的双语命名实体识别方法

    公开(公告)号:CN103853710A

    公开(公告)日:2014-06-11

    申请号:CN201310593746.3

    申请日:2013-11-21

    Abstract: 本发明公开了一种基于双语协同训练的命名实体的识别方法,属于计算机科学中的自然语言处理技术领域。把平行的汉语句子和英语句子这两个数据集看作为一个数据集的两个不同的视图进行双语协同训练。在投射过程中使用一个对数线性模型修正投射标记,在利用模型对未见示例进行预测时引入命名实体双语对齐标注一致率作为标记置信度估计的衡量指标。本方法对比现有技术,降低了命名实体识别的领域依赖性,融合了双语识别的优势,解决了单语识别中的部分识别歧义问题,尤其适合用于大规模语料的双语命名实体同步识别。

    一种面向知识管理的自定义知识分类方法

    公开(公告)号:CN103793474A

    公开(公告)日:2014-05-14

    申请号:CN201410003685.5

    申请日:2014-01-04

    CPC classification number: G06F17/30705

    Abstract: 本发明属于计算机应用技术领域,涉及应用于知识管理系统的一种自定义知识分类方法。本发明的目的是为了解决知识管理系统中,在缺乏标注文本集合的条件下,实现用户自定义分类管理知识的问题,提出了一种基于词匹配的用户自定义的知识分类方法。本方法绕过了训练文本集合标注的难题,通过用《同义词词林》扩展用户自定义关键词,利用Wu-Manber多模式匹配算法来快速匹配关键词,根据关键词在文档中的命中率来判断分类类别。本方法有适应缺乏标注文本的条件,且速度快的特点。

    一种未登录词的识别方法
    33.
    发明公开

    公开(公告)号:CN101751386A

    公开(公告)日:2010-06-23

    申请号:CN200910265839.7

    申请日:2009-12-28

    Abstract: 本发明公开了一种未登录词的识别方法,属于计算机科学中的自然语言处理技术领域。在未登录词的检测阶段,先用多重规则过滤重复串集合,然后使用统计模型作为主体统计框架,将尽可能多的特征融入到框架内,确保未登录词检测具有较高的准确率和召回率;在未登录词词性猜测阶段,基于统计模型框架,在通用特征的基础上,通过引入有效的新特征,来提高未登录词词性猜测的准确率。本方法对比现有技术,不受内存规模的限制,扩大了未登录词的检测范围,有效减少了未登录词检测过程中的漏召问题,尤其适合用于大规模语料的未登录词的识别。

    一种融合句法依存关系的方面级情感二元组抽取方法

    公开(公告)号:CN117610542A

    公开(公告)日:2024-02-27

    申请号:CN202311431792.3

    申请日:2023-10-31

    Abstract: 本发明涉及一种融合句法依存关系的方面级情感二元组抽取方法,属于自然语言处理情感分析技术领域。本方法首先提取句子的句法依存树,然后统计训练集的句法依存关系。对句子的句法依存树进行编码,之后获取句子中词的特征表示,然后进行图卷积网络训练,对句中单词进行序列标注,最后获取方面词与情感极性。本方法利用句法依存种类信息对包含有方面词的句子信息进行扩充,丰富了句子的语义表达,能够更好地建模句子表示,提升了方面级情感分析的性能。

    一种基于用户意图增强的会话推荐方法

    公开(公告)号:CN116431901A

    公开(公告)日:2023-07-14

    申请号:CN202310225305.1

    申请日:2023-03-09

    Abstract: 本发明涉及一种基于用户意图增强的会话推荐方法,属于数据挖掘与应用技术领域。本方法利用在用户会话序列中增加了多个意图节点,表示用户在会话中的意图变化。对于添加了意图节点的会话序列,利用稀疏注意力网络进行训练,挖掘用户意图偏好,计算意图节点的表示。对于得到的用户意图表示,利用对比学习方法进行意图增强,通过区分意图间的差异性获得更准确的会话向量表示。最后根据会话向量表示计算候选物品的推荐概率。本方法增强了用户意图,更好地建模会话表示,提升了推荐系统的性能。

    一种融合超图的对比学习会话推荐方法

    公开(公告)号:CN116186390A

    公开(公告)日:2023-05-30

    申请号:CN202211692089.3

    申请日:2022-12-28

    Abstract: 本发明公开了一种融合超图的对比学习会话推荐方法,属于数据挖掘和应用技术领域。本方法通过构建全局超图来获得项目之间高阶信息,同时为每个会话构建局部会话图来获得项目之间交互信息。对于所构建的全局超图,使用超图注意力网络进行处理,获得全局超图下的项目嵌入,对于构建的局部会话图,使用门控图神经网络学习项目嵌入。在得到两种项目嵌入后使用注意力机制得到两种会话嵌入信息,使用对比学习作为辅助任务使两种会话嵌入互信息最大化。最后根据会话特征计算候选物品的推荐概率。本方法使用超图结构建模,更好的获取项目之间的复杂信息,使用对比学习方法有效弥补了会话数据稀疏的缺点,提升了推荐系统的性能。

    一种基于自适应会话选择机制的会话推荐方法

    公开(公告)号:CN115563383A

    公开(公告)日:2023-01-03

    申请号:CN202211165287.4

    申请日:2022-09-23

    Abstract: 本发明涉及一种基于自适应会话选择机制的会话推荐方法,属于数据挖掘应用技术领域。本方法利用自适应会话选择机制,根据会话中是否包含高频物品区分出高频会话和低频会话。对于高频会话,利用图神经网络进行训练,计算高频会话的特征表示。对于低频会话,利用改进注意力网络进行训练,通过自注意力层计算低频会话中物品的特征表示,通过普通注意力层计算低频会话的特征表示。最后根据会话特征表示计算候选物品的推荐概率。本方法区分了会话类型,更好地建模会话表示,提升了推荐系统的性能。

    一种结合外部知识的文本向量检索方法

    公开(公告)号:CN112685538B

    公开(公告)日:2022-10-14

    申请号:CN202011612232.4

    申请日:2020-12-30

    Abstract: 本发明涉及一种结合外部知识的文本向量检索方法,属于开放域文档检索应用技术领域。本方法旨在文本向量空间模型的框架中,引入语言本身的句法结构和词性信息来获得问题的子条件结构,将问题表示成若干个子条件,同时通过BM25算法召回文档来计算问题每个子条件的重要程度,为问题最终的表示提供额外的训练标签。本方法通过提取的子条件以及BM25算法引入的相应的权重分数来优化现有表示方法,最终达到提升文本向量方法检索性能的目的。本方法可以利用基于预训练的深度学习模型获得更好的表示能力和泛化能力,能够更好的建模问题和文档的语义信息,提升了开放域检索的检索质量。

    一种结合外部知识的文本隐式情感分析方法

    公开(公告)号:CN113435211B

    公开(公告)日:2022-07-19

    申请号:CN202110811087.0

    申请日:2021-07-19

    Abstract: 本发明涉及一种结合外部知识的文本隐式情感分析方法,属于自然语言处理情感分析技术领域。本方法利用TransE模型对常识知识数据集预训练。对常识知识数据集中的每个知识子图,通过注意力机制计算每个知识子图的向量表示。对于需要进行隐式情感分析的句子采用预训练的单词特征向量表示文本序列中的每个单词的向量化表示,并与知识图特征向量表示进行拼接,得到结合外部知识的单词融合特征表示。使用双向长短时记忆网络对融合外部知识的单词表示进行句子层面的文本编码。通过注意力机制决定每个词语在表示学习过程中的重要性。最后将句子表示通过Softmax层计算对应的概率向量。本方法丰富了句子语义表达,更好建模句子表示,提升了文本隐式情感分析性能。

    一种基于元擦除的证据句自动抽取方法

    公开(公告)号:CN114398467A

    公开(公告)日:2022-04-26

    申请号:CN202111477094.8

    申请日:2021-12-06

    Abstract: 本发明涉及一种基于元擦除的证据句自动抽取方法,属于自然语言处理中的机器阅读理解技术领域。本方法无需人工标注,通过在句子级别进行擦除,根据每句话对答案的贡献程度来进行证据句的选择,实现自动选择证据句,并能够根据提升效果的幅度来评估证据句的选择,从而使多选阅读理解数据集能够根据证据句来解释模型行为。对比现有技术,本方法能够在证据句抽取与标注方面节省大量的时间和人力,并且得到很好的效果。

Patent Agency Ranking