一种基于深度学习的简历解析方法

    公开(公告)号:CN108664474A

    公开(公告)日:2018-10-16

    申请号:CN201810489651.X

    申请日:2018-05-21

    Abstract: 本发明公开了一种基于深度学习的简历解析方法,其包括以下步骤:数据预处理:将简历统一转换为文本格式,确定简历的内容分段标签,并将简历文本按行进行数据标记;模型训练:利用神经网络将简历文本按行表达为一个固定长度的向量,在获得行向量后,根据所述行向量对简历进行内容分段;信息提取:在完成内容分段后,从指定的内容段中提取标签字段,获得相关信息。通过本技术方案,能够提高解析简历以及信息提取准确度。

    一种基于空间键位的拼音纠错方法及装置

    公开(公告)号:CN109857264B

    公开(公告)日:2022-09-20

    申请号:CN201910010325.0

    申请日:2019-01-02

    Inventor: 马龙 雷画雨 冯璠

    Abstract: 本发明公开了一种基于空间键位的拼音纠错方法及装置,该方法包括:S1:基于键盘构建二维直角坐标系,并对构成音节的每个字母进行坐标编码;S2:将所有的音节按照各自长度映射到不同的高维空间中,并通过相应的二叉树进行存储;S3:将输入的字符串构建成相应的高维空间的待验证点后,根据待验证点判断字符串是否需要进行纠错,若需要,则执行步骤S4,否则,不做任何操作;S4:在相应的高维空间中查询与待验证点的距离不大于预设的搜索阈值的节点,输出节点对应的音节作为纠错候选项。本发明通过对键盘进行坐标编码,将拼音音节映射到高维空间中,通过二叉树进行存储,比较高维空间中两点之间距离的大小选取出纠错选项,且不需要遍历该高维空间中的所有点。

    一种音节切分方法和装置

    公开(公告)号:CN109377980A

    公开(公告)日:2019-02-22

    申请号:CN201811009619.3

    申请日:2018-08-31

    Abstract: 本发明公开了一种音节切分方法和装置,属于自然语言处理技术领域。方法包括:预先构造音节表的双数组Trie树结构;基于双数组Trie树结构,从输入的拼音序列中匹配出合法音节,并基于匹配出的合法音节,对拼音序列按照音节同权和音节优先的策略进行切分,以获取多种音节切分方案;对多种音节切分方案进行存储。本发明实施例提供的方法实现了能够在不影响结果准确性的情况下,达到快速、合理地进行音节切分的目的。

    一种音节切分方法和装置

    公开(公告)号:CN109377980B

    公开(公告)日:2022-06-07

    申请号:CN201811009619.3

    申请日:2018-08-31

    Abstract: 本发明公开了一种音节切分方法和装置,属于自然语言处理技术领域。方法包括:预先构造音节表的双数组Trie树结构;基于双数组Trie树结构,从输入的拼音序列中匹配出合法音节,并基于匹配出的合法音节,对拼音序列按照音节同权和音节优先的策略进行切分,以获取多种音节切分方案;对多种音节切分方案进行存储。本发明实施例提供的方法实现了能够在不影响结果准确性的情况下,达到快速、合理地进行音节切分的目的。

    一种基于空间键位的拼音纠错方法及装置

    公开(公告)号:CN109857264A

    公开(公告)日:2019-06-07

    申请号:CN201910010325.0

    申请日:2019-01-02

    Inventor: 马龙 雷画雨 冯璠

    Abstract: 本发明公开了一种基于空间键位的拼音纠错方法,该方法包括:S1:基于键盘构建二维直角坐标系,并对构成音节的每个字母进行坐标编码;S2:将所有的音节按照各自长度映射到不同的高维空间中,并通过相应的二叉树进行存储;S3:将输入的字符串构建成相应的高维空间的待验证点后,根据待验证点判断字符串是否需要进行纠错,若需要,则执行步骤S4,否则,不做任何操作;S4:在相应的高维空间中查询与待验证点的距离不大于预设的搜索阈值的节点,输出节点对应的音节作为纠错候选项。本发明通过对键盘进行坐标编码,将拼音音节映射到高维空间中,通过二叉树进行存储,比较高维空间中两点之间距离的大小选取出纠错选项,且不需要遍历该高维空间中的所有点。

    一种基于深度学习的简历解析方法

    公开(公告)号:CN108664474B

    公开(公告)日:2023-04-18

    申请号:CN201810489651.X

    申请日:2018-05-21

    Abstract: 本发明公开了一种基于深度学习的简历解析方法,其包括以下步骤:数据预处理:将简历统一转换为文本格式,确定简历的内容分段标签,并将简历文本按行进行数据标记;模型训练:利用神经网络将简历文本按行表达为一个固定长度的向量,在获得行向量后,根据所述行向量对简历进行内容分段;信息提取:在完成内容分段后,从指定的内容段中提取标签字段,获得相关信息。通过本技术方案,能够提高解析简历以及信息提取准确度。

Patent Agency Ranking