融合词向量和词性向量的命名实体识别方法及装置

    公开(公告)号:CN109657230B

    公开(公告)日:2023-07-28

    申请号:CN201811316154.6

    申请日:2018-11-06

    Abstract: 本发明公开了一种融合词向量和词性向量的命名实体识别方法及装置,所述方法包括:对原始语料数据进行处理,获取序列训练数据以及序列测试数据;训练所述原始语料数据中的原文数据获取词向量和词性向量,并生成词向量矩阵和词性向量矩阵;利用所述序列训练数据以及词向量矩阵和词性向量矩阵对预先构建的模型进行训练,所述模型至少包括用于融合不同类型的信息的第一非线性转化层;将待测文本序列化生成序列待测数据后输入所述训练好的模型,获取序列化的预测结果;利用实体标签和其编号的对照词典的反向词典,将序列化的预测结果转化为可读的实体标签。本发明通过预先构建的模型对文本信息进行命名实体识别,能有效地提高命名实体识别的正确率。

    媒体友好度评估方法、装置及计算机可读存储介质

    公开(公告)号:CN108595564B

    公开(公告)日:2020-08-11

    申请号:CN201810330401.1

    申请日:2018-04-13

    Abstract: 本发明公开了一种媒体友好度评估方法、装置及计算机可读存储介质,涉及舆情分析技术领域,方法包括:获取目标媒体发布的与舆情客体相关的多个相关文本;对多个相关文本中的各相关文本进行情感极性分析,得到各相关文本的情感极性值;分别将各相关文本的情感极性值转换为各相关文本对应的媒体友好度指数,并构成媒体友好度指数时间序列;对媒体友好度指数时间序列进行平滑处理,得到平滑后的媒体友好度指数时间序列;基于平滑后的媒体友好度指数时间序列评估目标媒体的媒体友好度。本发明实施例能够实现从文本情感到媒体长期态度的转换,进而实现准确地评估目标媒体对舆情客体的长期稳定态度。

    一种保险行业知识图谱问答系统构建方法及装置

    公开(公告)号:CN110019844A

    公开(公告)日:2019-07-16

    申请号:CN201910125877.6

    申请日:2019-02-20

    Abstract: 本发明公开了一种保险行业知识图谱问答系统构建方法及装置,属于行业知识图谱问答系统,方法包括:构建保险知识图谱的本体与知识表示;将与保险行业相关的多种原始数据基于本体与知识表示,生成保险知识图谱数据,并存储至图谱数据库中;获取用户问句,并对所述用户问句进行问句理解,其中,所述问句理解包括问句类型识别、问句意图识别、实体识别以及实体标准化;基于查询模板对所述问句理解获得的信息进行问句映射,生成查询语句;使用所述查询语句在所述图谱数据库中进行查询,得到查询结果并返回。本发明实施例创新性地提出了数据层(知识表示)与逻辑层(问句映射)的联动机制,从而可以提供可靠的、可扩展的保险行业智能客服服务。

    一种智能问诊方法及装置

    公开(公告)号:CN111180081A

    公开(公告)日:2020-05-19

    申请号:CN201911396213.X

    申请日:2019-12-30

    Abstract: 本发明公开了一种智能问诊方法及装置,所述方法包括:当选出的候选疾病的准确度不满足预设的确认条件时,在所述候选疾病的关联症状中选出疾病区分症状,所述疾病区分症状为至少能够区分两种所述候选疾病的症状;将所述疾病区分症状作为下一个问询症状向用户展示,根据接收到的用户对所述疾病区分症状的描述信息确定诊断结果。本发明能够在准确获得诊断结果的基础上,减少与用户的交互次数,提高诊断效率并不损失诊断的准确性。

    媒体友好度评估方法、装置及计算机可读存储介质

    公开(公告)号:CN108595564A

    公开(公告)日:2018-09-28

    申请号:CN201810330401.1

    申请日:2018-04-13

    Abstract: 本发明公开了一种媒体友好度评估方法、装置及计算机可读存储介质,涉及舆情分析技术领域,方法包括:获取目标媒体发布的与舆情客体相关的多个相关文本;对多个相关文本中的各相关文本进行情感极性分析,得到各相关文本的情感极性值;分别将各相关文本的情感极性值转换为各相关文本对应的媒体友好度指数,并构成媒体友好度指数时间序列;对媒体友好度指数时间序列进行平滑处理,得到平滑后的媒体友好度指数时间序列;基于平滑后的媒体友好度指数时间序列评估目标媒体的媒体友好度。本发明实施例能够实现从文本情感到媒体长期态度的转换,进而实现准确地评估目标媒体对舆情客体的长期稳定态度。

    一种智能问诊方法及装置

    公开(公告)号:CN111180081B

    公开(公告)日:2023-11-03

    申请号:CN201911396213.X

    申请日:2019-12-30

    Abstract: 本发明公开了一种智能问诊方法及装置,所述方法包括:当选出的候选疾病的准确度不满足预设的确认条件时,在所述候选疾病的关联症状中选出疾病区分症状,所述疾病区分症状为至少能够区分两种所述候选疾病的症状;将所述疾病区分症状作为下一个问询症状向用户展示,根据接收到的用户对所述疾病区分症状的描述信息确定诊断结果。本发明能够在准确获得诊断结果的基础上,减少与用户的交互次数,提高诊断效率并不损失诊断的准确性。

    融合词向量和词性向量的命名实体识别方法及装置

    公开(公告)号:CN109657230A

    公开(公告)日:2019-04-19

    申请号:CN201811316154.6

    申请日:2018-11-06

    Abstract: 本发明公开了一种融合词向量和词性向量的命名实体识别方法及装置,所述方法包括:对原始语料数据进行处理,获取序列训练数据以及序列测试数据;训练所述原始语料数据中的原文数据获取词向量和词性向量,并生成词向量矩阵和词性向量矩阵;利用所述序列训练数据以及词向量矩阵和词性向量矩阵对预先构建的模型进行训练,所述模型至少包括用于融合不同类型的信息的第一非线性转化层;将待测文本序列化生成序列待测数据后输入所述训练好的模型,获取序列化的预测结果;利用实体标签和其编号的对照词典的反向词典,将序列化的预测结果转化为可读的实体标签。本发明通过预先构建的模型对文本信息进行命名实体识别,能有效地提高命名实体识别的正确率。

Patent Agency Ranking