问答对生成模型的训练方法及装置

    公开(公告)号:CN116186212A

    公开(公告)日:2023-05-30

    申请号:CN202211657971.4

    申请日:2022-12-22

    Abstract: 一种问答对生成模型的训练方法及装置,该方法包括:采用预先收集的源域的问答对数据集对初始问答对生成模型进行训练,得到基础问答对生成模型;将目标域的文档集的段落输入基础问答对生成模型,生成目标域的问答对数据集;按照预设比例,将源域的问答对数据集与目标域的问答对数据集混合,得到混合问答对数据集;采用混合问答对数据集对基础问答对生成模型进行迁移训练,得到最终问答对生成模型。通过本发明实施例提供的方法及装置,可在不需要目标域标注数据的情况下,利用源域的先验知识,保障目标域问答对的生成质量,获得较好的问答对生成效果。

    文本分析系统、方法、电子设备及存储介质

    公开(公告)号:CN115496066A

    公开(公告)日:2022-12-20

    申请号:CN202211181576.3

    申请日:2022-09-27

    Abstract: 本申请提供一种文本分析系统、方法、电子设备及存储介质,该系统包括预处理模块和文本分析模块;文本分析模块包括多级文本分类单元、文本摘要抽取单元、标签要素抽取单元、智能文本推荐单元和情感意图分析单元中的至少一个;多级文本分类单元用于根据文本向量对待处理文本进行分类;文本摘要抽取单元用于根据文本向量对待处理文本信息整合获得文本摘要;标签要素抽取单元用于根据文本向量从待处理文本中抽取标签并采集指标数据,根据标签和指标数据获得文本指标数据信息;智能文本推荐单元用于根据文本向量从待处理文本中确定推荐文本;情感意图分析单元用于根据文本向量确定待处理文本的情感倾向和文本的意图类别。该方案能满足多种应用场景。

    一种问答控制方法、装置及系统

    公开(公告)号:CN110970021B

    公开(公告)日:2022-03-08

    申请号:CN201811159936.3

    申请日:2018-09-30

    Abstract: 本发明公开了一种问答控制方法、装置及系统,用以解决现有的机器人客服存在多轮问答咨询中断后需重新开始进行问答,而造成的咨询流程繁琐冗长,服务效率低的问题。该方法包括:服务器接收终端发送的携带有语音消息的问答请求;将语音消息转换为文字,从语音消息中提取声音特征;对文字提取关键词;根据存储的声音特征与语音输入者的身份标识的对应关系确定与声音特征相匹配的语音输入者的身份标识;根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息;将关键词、上下文信息与存储的语料库进行匹配;当确定从语料库中匹配到与关键词和上下文信息对应的问题的答案信息时,将答案信息发送至终端。

    一种意图识别方法及装置
    24.
    发明公开

    公开(公告)号:CN112836025A

    公开(公告)日:2021-05-25

    申请号:CN201911158972.2

    申请日:2019-11-22

    Abstract: 本申请涉及计算机技术领域,尤其涉及一种意图识别方法及装置,获取待识别对象的对话咨询信息;将所述对话咨询信息的文本输入到预先训练的意图识别模型中,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询信息对应于各预设意图类别的概率值,其中,所述意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络;根据所述对应于各预设意图类别的概率值,确定所述待识别对象的意图类别,这样,能提升意图识别效率和准确性。

    一种基于主动学习的问答语料情感分类方法及系统

    公开(公告)号:CN111177374A

    公开(公告)日:2020-05-19

    申请号:CN201911283416.8

    申请日:2019-12-13

    Abstract: 本发明公开了一种基于主动学习的问答语料情感分类方法及系统,包括:对语料库中的训练语句进行分词,确定TF-IDF值,根据TF-IDF值构建句子相量样本,确定训练数据;将训练数据与人工标注数据集合、伪标签数据集、相似数据集分别组合训练,得到人工标注分类器,伪标签分类器和相似分类器;对训练数据中的未标签数据进行无监督的聚类,将相似数据加入相似数据集并重新训练相似分类器;利用人工标注分类器,伪标签分类器和相似分类器分别对未标注数据进行分类,并根据投票策略更新投票数据集、伪标签数据集和未标注数据集;利用投票数据集和人工标注数据集对综合分类器进行训练;根据待分类语料确定句子相量,并利用已训练好的综合分类器确定情感分类结果。

    一种问答控制方法、装置及系统

    公开(公告)号:CN110970021A

    公开(公告)日:2020-04-07

    申请号:CN201811159936.3

    申请日:2018-09-30

    Abstract: 本发明公开了一种问答控制方法、装置及系统,用以解决现有的机器人客服存在多轮问答咨询中断后需重新开始进行问答,而造成的咨询流程繁琐冗长,服务效率低的问题。该方法包括:服务器接收终端发送的携带有语音消息的问答请求;将语音消息转换为文字,从语音消息中提取声音特征;对文字提取关键词;根据存储的声音特征与语音输入者的身份标识的对应关系确定与声音特征相匹配的语音输入者的身份标识;根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息;将关键词、上下文信息与存储的语料库进行匹配;当确定从语料库中匹配到与关键词和上下文信息对应的问题的答案信息时,将答案信息发送至终端。

    一种进行字符识别的方法及系统

    公开(公告)号:CN112733828B

    公开(公告)日:2025-03-25

    申请号:CN202011611147.6

    申请日:2020-12-30

    Abstract: 本发明涉及一种进行字符识别的方法及系统,其中方法包括:对待识别的图像文件进行光学字符识别以获得多个文字字符,从多个文字字符中确定多个待调整字符;从每个待调整字符的识别结果列表中选择置信度最大的预定数量的识别结果字符,以构成每个待调整字符的识别结果集合;获取每个待调整文字字符的至少两个邻近字符,并将每个待调整文字字符和至少两个邻近字符组成每个待调整文字字符的待调整字符组,基于关联规则挖掘模型对每个待调整字符的识别结果集合和待调整字符组进行处理以确定文本关联度;选择置信度最大的识别结果字符作为每个待调整字符的目标文字字符,利用目标文字字符替换相应的待调整字符,以获得经过调整的文本文件。

    数据扩充方法、装置、电子设备及存储介质

    公开(公告)号:CN117667206A

    公开(公告)日:2024-03-08

    申请号:CN202311714726.7

    申请日:2023-12-13

    Abstract: 本申请实施例提供了一种数据扩充方法、装置、电子设备及存储介质,该数据扩充方法包括:获取多个第一数据组,第一数据组包括第一指令、第一指令对应的参考数据和第一指令对应的结果数据;根据多个第一数据组中的第一指令,生成多个第二指令;根据各第二指令的指令类型,确定该第二指令对应的至少一个第二数据组,第二指令对应的第二数据组包括该第二指令、该第二指令对应的参考数据和该第二指令对应的结果数据,指令类型不同的任意两个第二指令对应的数据确定顺序不同;将多个第一数据组和多个第二数据组均确定为扩充后数据组。本方案使扩充后数据组较为多样化,以优化基于扩充后数据组进行模型训练的效果。

    粮温预测方法、装置、电子设备及存储介质

    公开(公告)号:CN117609736A

    公开(公告)日:2024-02-27

    申请号:CN202311774771.1

    申请日:2023-12-21

    Abstract: 本申请实施例提供了一种粮温预测方法、装置、电子设备及存储介质,该粮温预测方法包括:获取多个原始数据组,其中,原始数据组包括在对应的周期内目标粮仓中多个测温点对应的测量温度值,不同的原始数据组对应的周期不同;将对应的周期内目标粮仓处于非空仓状态的原始数据组作为第一数据组;根据多个第一数据组,确定至少一个第二数据组,其中,第二数据组包括在对应的周期内目标粮仓中多个测温点对应的预测温度值,不同的第二数据组对应的周期不同,多个第二数据组对应的周期中首个周期的开始时间,为多个原始数据组对应的周期中最后一个周期的结束时间,或者在结束时间之前。本方案可以使粮温预测更加可靠且更加准确。

Patent Agency Ranking