一种智能问诊方法及装置

    公开(公告)号:CN111180081B

    公开(公告)日:2023-11-03

    申请号:CN201911396213.X

    申请日:2019-12-30

    Abstract: 本发明公开了一种智能问诊方法及装置,所述方法包括:当选出的候选疾病的准确度不满足预设的确认条件时,在所述候选疾病的关联症状中选出疾病区分症状,所述疾病区分症状为至少能够区分两种所述候选疾病的症状;将所述疾病区分症状作为下一个问询症状向用户展示,根据接收到的用户对所述疾病区分症状的描述信息确定诊断结果。本发明能够在准确获得诊断结果的基础上,减少与用户的交互次数,提高诊断效率并不损失诊断的准确性。

    一种基于深度学习的简历解析方法

    公开(公告)号:CN108664474A

    公开(公告)日:2018-10-16

    申请号:CN201810489651.X

    申请日:2018-05-21

    Abstract: 本发明公开了一种基于深度学习的简历解析方法,其包括以下步骤:数据预处理:将简历统一转换为文本格式,确定简历的内容分段标签,并将简历文本按行进行数据标记;模型训练:利用神经网络将简历文本按行表达为一个固定长度的向量,在获得行向量后,根据所述行向量对简历进行内容分段;信息提取:在完成内容分段后,从指定的内容段中提取标签字段,获得相关信息。通过本技术方案,能够提高解析简历以及信息提取准确度。

    一种文本相似度计算方法及装置

    公开(公告)号:CN109992772A

    公开(公告)日:2019-07-09

    申请号:CN201910191756.1

    申请日:2019-03-13

    Abstract: 本发明公开了一种文本相似度计算方法及装置,该方法包括:S1:利用预先训练的词向量模型对待计算文本分别进行向量化,获取待计算文本的词向量;S2:计算获取待计算文本之间的第一相似度;S3:根据预先构建的预测模型、待计算文本的词向量以及第一相似度,获取待计算文本之间的第二相似度。本发明一方面利用监督学习技术,融合中文分词,Tf‑Idf,LSA,LDA,Word2Vec等多种自然语言特征提取技术,Jaccard,WMD等多种文本相似度(距离)的计算方法,提高文本相似度计算的准确性,另一方面利用模型融合技术,将深度学习和传统特征学习结合起来,进一步提高了文本相似度计算的准确性。

    一种基于语言模型和词特征的纠错方法及其系统

    公开(公告)号:CN108959250A

    公开(公告)日:2018-12-07

    申请号:CN201810679125.X

    申请日:2018-06-27

    CPC classification number: G06F17/273 G06F17/2705 G06F17/2775

    Abstract: 本发明公开了一种基于语言模型和词特征的纠错方法,所述方法包括以下步骤:S1:获取第一语句并输入至错词检测系统中,然后利用语言模型检测所述第一语句并返回嫌疑词;S2:将所得嫌疑词输入至候选词推荐系统中,利用至少两种不同的相似度算法结合选出候选词并输出;S3:将所述第一语句中的嫌疑词替换成S2所得候选词形成第二语句,对所述第一语句和第二语句分别进行语句打分,选择分数更高的语句进行输出。所述系统包括检测模块、推荐模块和打分模块。通过本技术方案,能够提高纠错准确性。

    一种检索多轮对话的客服问答处理方法及其系统

    公开(公告)号:CN111046132B

    公开(公告)日:2023-06-16

    申请号:CN201911022722.6

    申请日:2019-10-25

    Inventor: 冯璠 雷画雨 王恒

    Abstract: 一种检索多轮对话的客服问答处理方法及其系统,其中客服问答处理方法包括:获取用户输入的当前信息;根据当前信息识别归属的业务领域,从业务领域中筛选多条候选回复信息,以及提取用户输入的与业务领域相关的历史信息;将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配,得到对应的匹配度得分;确定最高的匹配度得分对应的候选回复信息作为当前信息的回复内容。在依据业务领域确定当前信息的回复内容时,是将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配,可以避免仅与当前信息进行检索匹配的局限问题,能够从上下文的语境中准确理解用户的真实意图,提高检索匹配的准确度。

    一种基于深度学习的简历解析方法

    公开(公告)号:CN108664474B

    公开(公告)日:2023-04-18

    申请号:CN201810489651.X

    申请日:2018-05-21

    Abstract: 本发明公开了一种基于深度学习的简历解析方法,其包括以下步骤:数据预处理:将简历统一转换为文本格式,确定简历的内容分段标签,并将简历文本按行进行数据标记;模型训练:利用神经网络将简历文本按行表达为一个固定长度的向量,在获得行向量后,根据所述行向量对简历进行内容分段;信息提取:在完成内容分段后,从指定的内容段中提取标签字段,获得相关信息。通过本技术方案,能够提高解析简历以及信息提取准确度。

    一种检索多轮对话的客服问答处理方法及其系统

    公开(公告)号:CN111046132A

    公开(公告)日:2020-04-21

    申请号:CN201911022722.6

    申请日:2019-10-25

    Inventor: 冯璠 雷画雨 王恒

    Abstract: 一种检索多轮对话的客服问答处理方法及其系统,其中客服问答处理方法包括:获取用户输入的当前信息;根据当前信息识别归属的业务领域,从业务领域中筛选多条候选回复信息,以及提取用户输入的与业务领域相关的历史信息;将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配,得到对应的匹配度得分;确定最高的匹配度得分对应的候选回复信息作为当前信息的回复内容。在依据业务领域确定当前信息的回复内容时,是将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配,可以避免仅与当前信息进行检索匹配的局限问题,能够从上下文的语境中准确理解用户的真实意图,提高检索匹配的准确度。

    一种基于空间键位的拼音纠错方法及装置

    公开(公告)号:CN109857264B

    公开(公告)日:2022-09-20

    申请号:CN201910010325.0

    申请日:2019-01-02

    Inventor: 马龙 雷画雨 冯璠

    Abstract: 本发明公开了一种基于空间键位的拼音纠错方法及装置,该方法包括:S1:基于键盘构建二维直角坐标系,并对构成音节的每个字母进行坐标编码;S2:将所有的音节按照各自长度映射到不同的高维空间中,并通过相应的二叉树进行存储;S3:将输入的字符串构建成相应的高维空间的待验证点后,根据待验证点判断字符串是否需要进行纠错,若需要,则执行步骤S4,否则,不做任何操作;S4:在相应的高维空间中查询与待验证点的距离不大于预设的搜索阈值的节点,输出节点对应的音节作为纠错候选项。本发明通过对键盘进行坐标编码,将拼音音节映射到高维空间中,通过二叉树进行存储,比较高维空间中两点之间距离的大小选取出纠错选项,且不需要遍历该高维空间中的所有点。

    一种音节切分方法和装置

    公开(公告)号:CN109377980A

    公开(公告)日:2019-02-22

    申请号:CN201811009619.3

    申请日:2018-08-31

    Abstract: 本发明公开了一种音节切分方法和装置,属于自然语言处理技术领域。方法包括:预先构造音节表的双数组Trie树结构;基于双数组Trie树结构,从输入的拼音序列中匹配出合法音节,并基于匹配出的合法音节,对拼音序列按照音节同权和音节优先的策略进行切分,以获取多种音节切分方案;对多种音节切分方案进行存储。本发明实施例提供的方法实现了能够在不影响结果准确性的情况下,达到快速、合理地进行音节切分的目的。

    一种音节切分方法和装置

    公开(公告)号:CN109377980B

    公开(公告)日:2022-06-07

    申请号:CN201811009619.3

    申请日:2018-08-31

    Abstract: 本发明公开了一种音节切分方法和装置,属于自然语言处理技术领域。方法包括:预先构造音节表的双数组Trie树结构;基于双数组Trie树结构,从输入的拼音序列中匹配出合法音节,并基于匹配出的合法音节,对拼音序列按照音节同权和音节优先的策略进行切分,以获取多种音节切分方案;对多种音节切分方案进行存储。本发明实施例提供的方法实现了能够在不影响结果准确性的情况下,达到快速、合理地进行音节切分的目的。

Patent Agency Ranking