-
公开(公告)号:CN109657230B
公开(公告)日:2023-07-28
申请号:CN201811316154.6
申请日:2018-11-06
Applicant: 众安信息技术服务有限公司
IPC: G06F40/295
Abstract: 本发明公开了一种融合词向量和词性向量的命名实体识别方法及装置,所述方法包括:对原始语料数据进行处理,获取序列训练数据以及序列测试数据;训练所述原始语料数据中的原文数据获取词向量和词性向量,并生成词向量矩阵和词性向量矩阵;利用所述序列训练数据以及词向量矩阵和词性向量矩阵对预先构建的模型进行训练,所述模型至少包括用于融合不同类型的信息的第一非线性转化层;将待测文本序列化生成序列待测数据后输入所述训练好的模型,获取序列化的预测结果;利用实体标签和其编号的对照词典的反向词典,将序列化的预测结果转化为可读的实体标签。本发明通过预先构建的模型对文本信息进行命名实体识别,能有效地提高命名实体识别的正确率。
-
公开(公告)号:CN110019844A
公开(公告)日:2019-07-16
申请号:CN201910125877.6
申请日:2019-02-20
Applicant: 众安信息技术服务有限公司
IPC: G06F16/36 , G06F16/332 , G06Q40/08
Abstract: 本发明公开了一种保险行业知识图谱问答系统构建方法及装置,属于行业知识图谱问答系统,方法包括:构建保险知识图谱的本体与知识表示;将与保险行业相关的多种原始数据基于本体与知识表示,生成保险知识图谱数据,并存储至图谱数据库中;获取用户问句,并对所述用户问句进行问句理解,其中,所述问句理解包括问句类型识别、问句意图识别、实体识别以及实体标准化;基于查询模板对所述问句理解获得的信息进行问句映射,生成查询语句;使用所述查询语句在所述图谱数据库中进行查询,得到查询结果并返回。本发明实施例创新性地提出了数据层(知识表示)与逻辑层(问句映射)的联动机制,从而可以提供可靠的、可扩展的保险行业智能客服服务。
-
公开(公告)号:CN109408627B
公开(公告)日:2021-03-02
申请号:CN201811371591.8
申请日:2018-11-15
Applicant: 众安信息技术服务有限公司
IPC: G06F16/332 , G06F16/36 , G06N3/04
Abstract: 本发明公开了一种融合卷积神经网络和循环神经网络的问答方法及系统,方法包括:根据用户输入的问句,获取问句的实体以及实体的查询ID;根据实体将问句简化成问句模式;根据查询ID收集实体的相关属性,生成候选属性列表;将问句模式以及候选属性列表输入预先训练好的属性判别器中,获取每个候选属性与问句的得分;根据得分判定与问句最相近的属性关系,取出最相近的属性关系的属性值完成回答。本发明利用字典树的方法实现快速的实体定位,可以满足高并发的商业系统,且可以减少无谓的字符串比较,提高查询效率,通过基于神经网络的方法进行属性推断,利用向量化的数值计算不需要人工整理模板,能够有效解决人工整理的操作繁杂以及不完备等问题。
-
公开(公告)号:CN109657230A
公开(公告)日:2019-04-19
申请号:CN201811316154.6
申请日:2018-11-06
Applicant: 众安信息技术服务有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种融合词向量和词性向量的命名实体识别方法及装置,所述方法包括:对原始语料数据进行处理,获取序列训练数据以及序列测试数据;训练所述原始语料数据中的原文数据获取词向量和词性向量,并生成词向量矩阵和词性向量矩阵;利用所述序列训练数据以及词向量矩阵和词性向量矩阵对预先构建的模型进行训练,所述模型至少包括用于融合不同类型的信息的第一非线性转化层;将待测文本序列化生成序列待测数据后输入所述训练好的模型,获取序列化的预测结果;利用实体标签和其编号的对照词典的反向词典,将序列化的预测结果转化为可读的实体标签。本发明通过预先构建的模型对文本信息进行命名实体识别,能有效地提高命名实体识别的正确率。
-
公开(公告)号:CN109408627A
公开(公告)日:2019-03-01
申请号:CN201811371591.8
申请日:2018-11-15
Applicant: 众安信息技术服务有限公司
IPC: G06F16/332 , G06F16/36 , G06N3/04
CPC classification number: G06N3/0454
Abstract: 本发明公开了一种融合卷积神经网络和循环神经网络的问答方法及系统,方法包括:根据用户输入的问句,获取问句的实体以及实体的查询ID;根据实体将问句简化成问句模式;根据查询ID收集实体的相关属性,生成候选属性列表;将问句模式以及候选属性列表输入预先训练好的属性判别器中,获取每个候选属性与问句的得分;根据得分判定与问句最相近的属性关系,取出最相近的属性关系的属性值完成回答。本发明利用字典树的方法实现快速的实体定位,可以满足高并发的商业系统,且可以减少无谓的字符串比较,提高查询效率,通过基于神经网络的方法进行属性推断,利用向量化的数值计算不需要人工整理模板,能够有效解决人工整理的操作繁杂以及不完备等问题。
-
-
-
-