-
公开(公告)号:CN109783806B
公开(公告)日:2023-05-02
申请号:CN201811570080.9
申请日:2018-12-21
Applicant: 众安信息技术服务有限公司
IPC: G06F40/30 , G06F16/35 , G06F40/295
Abstract: 本发明公开了一种利用语义解析结构的文本匹配方法,该方法包括:定义初始语料集Cqa和补充语料集Cq;利用语义依存解析方法,定义文本对应的语义结构DP‑tree;基于此语义结构,定义文本的核函数,以及文本相似度的度量函数;对文本进行核聚类,得到聚合的文本类函数:i=1,2,...,M;其中,q′ij为每个聚类中选取的ni个最靠近类中的样本点;通过人工审核,给Ci类核准并标记上特定的标签Ti。本发明采用了以句法结构等语法分析结构为比较基础,结合了卷积核函数理论,以及树核(tree kernel,TK)定义了表示两个树形句法结构间距离的核函数,引入了句法相似性、词向量、词义网等的内、外部知识,能够精确判断文本之间的相似度。
-
公开(公告)号:CN108920500B
公开(公告)日:2022-02-11
申请号:CN201810507457.X
申请日:2018-05-24
Applicant: 众安信息技术服务有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本发明公开了一种时间解析方法,所述方法包括以下步骤:S1:构建时间表达集并存储于系统中;S2:获取语音信息,将所述语音信息转换成文本数据;对所述文本数据进行预处理的前或后提取所述文本数据中的第一时间特征;提取所述文本数据中的介词特征和代词特征;S3:对上述所得的代词特征进行指代消解;根据所述指代消解的结果与第一时间特征恢复所述代词特征对应的第二时间特征;S4:根据所得时间特征进行解析处理。通过本技术方案,能解析多轮语音对话中时间;进一步地,还能解决提高时间解析的解析效率;更进一步地,还能解决提高时间解析的解析准确率。
-
公开(公告)号:CN108038234B
公开(公告)日:2021-06-15
申请号:CN201711436114.0
申请日:2017-12-26
Applicant: 众安信息技术服务有限公司
Inventor: 邹辉
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F16/35
Abstract: 本发明公开了一种问句模板自动生成方法及装置,属于智能问答技术领域。所述方法包括:准备问句日志语料;对所述日志语料进行分词和词性标注;进行命名实体识别和替换;进行语义替换;进行频繁项集挖掘,生成问句模板。本方法及装置不仅提高了问句模板生成的效率,大量节约了人工资源,而且能对生成的问句模板进行评估,自主的持续扩展问句模板库,提升智能问答系统知识库的质量。
-
公开(公告)号:CN110019844A
公开(公告)日:2019-07-16
申请号:CN201910125877.6
申请日:2019-02-20
Applicant: 众安信息技术服务有限公司
IPC: G06F16/36 , G06F16/332 , G06Q40/08
Abstract: 本发明公开了一种保险行业知识图谱问答系统构建方法及装置,属于行业知识图谱问答系统,方法包括:构建保险知识图谱的本体与知识表示;将与保险行业相关的多种原始数据基于本体与知识表示,生成保险知识图谱数据,并存储至图谱数据库中;获取用户问句,并对所述用户问句进行问句理解,其中,所述问句理解包括问句类型识别、问句意图识别、实体识别以及实体标准化;基于查询模板对所述问句理解获得的信息进行问句映射,生成查询语句;使用所述查询语句在所述图谱数据库中进行查询,得到查询结果并返回。本发明实施例创新性地提出了数据层(知识表示)与逻辑层(问句映射)的联动机制,从而可以提供可靠的、可扩展的保险行业智能客服服务。
-
公开(公告)号:CN109783806A
公开(公告)日:2019-05-21
申请号:CN201811570080.9
申请日:2018-12-21
Applicant: 众安信息技术服务有限公司
Abstract: 本发明公开了一种利用语义解析结构的文本匹配方法,该方法包括:定义初始语料集Cqa和补充语料集Cq;利用语义依存解析方法,定义文本对应的语义结构DP-tree;基于此语义结构,定义文本的核函数,以及文本相似度的度量函数;对文本进行核聚类,得到聚合的文本类函数:i=1,2,...,M;其中,q′ij为每个聚类中选取的ni个最靠近类中的样本点;通过人工审核,给Ci类核准并标记上特定的标签Ti。本发明采用了以句法结构等语法分析结构为比较基础,结合了卷积核函数理论,以及树核(tree kernel,TK)定义了表示两个树形句法结构间距离的核函数,引入了句法相似性、词向量、词义网等的内、外部知识,能够精确判断文本之间的相似度。
-
公开(公告)号:CN108920500A
公开(公告)日:2018-11-30
申请号:CN201810507457.X
申请日:2018-05-24
Applicant: 众安信息技术服务有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种时间解析方法,所述方法包括以下步骤:S1:构建时间表达集并存储于系统中;S2:获取语音信息,将所述语音信息转换成文本数据;对所述文本数据进行预处理的前或后提取所述文本数据中的第一时间特征;提取所述文本数据中的介词特征和代词特征;S3:对上述所得的代词特征进行指代消解;根据所述指代消解的结果与第一时间特征恢复所述代词特征对应的第二时间特征;S4:根据所得时间特征进行解析处理。通过本技术方案,能解析多轮语音对话中时间;进一步地,还能解决提高时间解析的解析效率;更进一步地,还能解决提高时间解析的解析准确率。
-
公开(公告)号:CN108038234A
公开(公告)日:2018-05-15
申请号:CN201711436114.0
申请日:2017-12-26
Applicant: 众安信息技术服务有限公司
Inventor: 邹辉
IPC: G06F17/30
Abstract: 本发明公开了一种问句模板自动生成方法及装置,属于智能问答技术领域。所述方法包括:准备问句日志语料;对所述日志语料进行分词和词性标注;进行命名实体识别和替换;进行语义替换;进行频繁项集挖掘,生成问句模板。本方法及装置不仅提高了问句模板生成的效率,大量节约了人工资源,而且能对生成的问句模板进行评估,自主的持续扩展问句模板库,提升智能问答系统知识库的质量。
-
-
-
-
-
-