一种文本分类方法及装置

    公开(公告)号:CN117708322A

    公开(公告)日:2024-03-15

    申请号:CN202311342239.2

    申请日:2023-10-17

    Abstract: 本申请公开了一种文本分类方法及装置,该方法包括第一设备可以根据预设的文本编码器对获取的目标文本信息进行编码,获得该目标文本信息对应的第一向量。第一设备可以根据第一向量从向量检索库中确定与第一向量的相似度最大的目标向量。其中,相似度的最大值大于预设的第一阈值。目标向量是根据多个与目标向量对应的文本类别相同的相似向量生成的。第一设备可以将目标向量对应的文本类别作为目标文本信息的文本类别。采用该方法,可以增加用于训练模型的数据,从而提高文本分类的准确性。同时,由于目标向量是根据多个相似向量生成的,将目标向量对应的文本类别作为目标文本信息对应的文本类别,可以进一步的提高文本分类的准确性。

    一种纵向联邦学习模型的训练方法、装置及电子设备

    公开(公告)号:CN117574405A

    公开(公告)日:2024-02-20

    申请号:CN202311618653.1

    申请日:2023-11-30

    Abstract: 本申请涉及数据处理技术领域,尤其涉及一种纵向联邦学习模型的训练方法、装置及电子设备。该方法中,按照预设的排序规则确定自身是否为本轮训练过程中的虚拟融合节点和解密节点。在确定自身不为虚拟融合节点的情况下,按照预设节点排序规则以及配置参数确定用于加密参数集合的公钥,采用公钥加密参数集合得到密文,并向虚拟融合节点发送密文。在确定自身为虚拟融合节点的情况下,基于设置的融合规则对多个密文进行密文融合得到第一密文,并向解密节点发送第一密文。在确定自身为解密节点的情况下,采用私钥解密第一密文得到中间参数,并向各节点发送中间参数进行下一轮模型训练。上述方案,提升了纵向联邦学习模型训练的安全性。

    粮温预测方法、装置、电子设备和存储介质

    公开(公告)号:CN117556235A

    公开(公告)日:2024-02-13

    申请号:CN202311370257.1

    申请日:2023-10-20

    Abstract: 本申请提供了一种粮温预测方法、装置、电子设备和存储介质,所述方法包括:获取粮仓中多个探测点的点位信息,并根据点位信息构造包括多个传导节点的温度传导网络,不同的传导节点与不同的探测点相对应,每个传导节点与另外的至少一个传导节点连接,相连的传导节点对应的探测点相邻,传导节点包括对应的探测点的历史温度信息。根据温度传导网络中各传导节点的连接关系、及传导节点包括的历史温度信息,确定包括每个传导节点对应的特征向量的第一特征向量矩阵,特征向量用于指示相对应的传导节点的历史温度特征数据。根据第一特征向量矩阵,预测各传导节点对应的探测点在未来时间节点的温度,获得温度预测结果。本方案可以提升粮温预测的准确性。

    一种建立财税优惠政策的信息抽取模型的方法和系统

    公开(公告)号:CN114444483A

    公开(公告)日:2022-05-06

    申请号:CN202111639139.7

    申请日:2021-12-29

    Abstract: 本发明实施例公开了一种建立财税优惠政策的信息抽取模型的方法和系统,所述方法包括:获取第一标注数据集,根据第一标注数据集生成最优第一层级信息抽取模型;获取第二标注数据集,根据第二标注数据集生成最优第二层级信息抽取模型,以及将最优第一层级信息抽取模型和最优第二层级信息抽取模型的组合作为财税优惠政策的信息抽取模型,其中,最优第一层级信息抽取模型和最优第二层级信息抽取模型都是经过微调的Bert base后接CRF层。所述方法和系统通过为财税优惠政策信息的抽取设计一种双层级的Bert+CRF模型,有效解决了对信息进行识别时,由于自定义的种类多,且标注数据少带来的数据稀疏问题,有效提升了信息抽取的效率。

    一种进行字符识别的方法及系统

    公开(公告)号:CN112733828A

    公开(公告)日:2021-04-30

    申请号:CN202011611147.6

    申请日:2020-12-30

    Abstract: 本发明涉及一种进行字符识别的方法及系统,其中方法包括:对待识别的图像文件进行光学字符识别以获得多个文字字符,从多个文字字符中确定多个待调整字符;从每个待调整字符的识别结果列表中选择置信度最大的预定数量的识别结果字符,以构成每个待调整字符的识别结果集合;获取每个待调整文字字符的至少两个邻近字符,并将每个待调整文字字符和至少两个邻近字符组成每个待调整文字字符的待调整字符组,基于关联规则挖掘模型对每个待调整字符的识别结果集合和待调整字符组进行处理以确定文本关联度;选择置信度最大的识别结果字符作为每个待调整字符的目标文字字符,利用目标文字字符替换相应的待调整字符,以获得经过调整的文本文件。

    一种税务领域短文本的情感分类方法及装置

    公开(公告)号:CN111259138A

    公开(公告)日:2020-06-09

    申请号:CN201811358728.6

    申请日:2018-11-15

    Abstract: 本发明提供一种税务领域短文本的情感分类方法及装置,用于解决现有技术税务领域的智能应答机器人和自动语音识别系统不能理解人类语言情感,缺乏智能交互能力,导致对纳税人提出的问题回答生硬、不友好,造成用户满意度不高的技术问题。方法包括:对税务短文本进行预处理,利用Word2Vec模型训练所述税务短文本的词向量,获得至少一个词向量;基于所述至少一个词向量中每个词向量所带有的感情色彩,确定每个词向量的权重系数,并构建带有权重系数的所述词向量的二维矩阵向量;通过卷积神经网络对所述二维矩阵向量进行处理,获得所述税务短文本的情感分类结果。

    自然语言处理方法、装置、存储介质及电子设备

    公开(公告)号:CN111209746A

    公开(公告)日:2020-05-29

    申请号:CN201911401196.4

    申请日:2019-12-30

    Abstract: 本公开涉及一种自然语言处理方法、装置、存储介质及电子设备,所述方法包括:接收待分析文本数据和分析指令,分析指令用于指示对待分析文本数据进行的分析模式和分析结果格式;若分析模式指示对待分析文本数据进行句法依存分析,则对待分析文本数据进行分词处理,获得分词数据;根据分词数据对待分析文本数据进行词性标注,获得分词词性数据;对分词词性数据中的名词词性的分词词语进行实体识别,获得实体识别数据;根据分词词性数据和实体识别数据进行句法依存分析,获得句法依存数据;根据分析结果格式确定文本数据分析结果,输出文本数据分析结果,文本数据分析结果包括分词数据、分词词性数据、实体识别数据和句法依存数据中的一者或多者。

    一种针对大语言模型的评估方法、模型和计算机存储介质

    公开(公告)号:CN117668506A

    公开(公告)日:2024-03-08

    申请号:CN202311747478.6

    申请日:2023-12-18

    Abstract: 本申请提供一种针对大语言模型的评估方法、模型和计算机存储介质,评估方法包括:根据预先存储的数据元信息和所述大语言模型的待测项目,筛选采集的多个文本数据集以组成测评集合,每个文本数据集包括多条测评数据;将每一条测评数据多次输入被测大语言模型,并对应获得多次输出结果;基于每一条测评数据对应的标准结果,对每一条测评数据对应的多次输出结果进行评分,以获得每一条测评数据对应的评分结果,所述评分结果包括正确率得分和一致性得分;综合所述多条测评数据各自的评分结果,计算并获得针对所述大语言模型的评估结果。如此,测评集合既能满足待测项目的需求,又数据量较小,同时借助自动评估可以提高测评效率。

    一种建立短文本多层级分类模型的方法和系统

    公开(公告)号:CN114579737A

    公开(公告)日:2022-06-03

    申请号:CN202111636972.6

    申请日:2021-12-29

    Abstract: 本发明实施例公开了一种建立短文本多层级分类模型的方法和系统,所述方法包括:对同一份短文本数据集,按照设置的不同层级的短文本类别标签进行标注后生成的不同层级的标注数据集,并将其作为输入,对基于公开的预训练模型Bert base后接全连接层建立的分类模型分层级进行训练,生成不同层级的分类模型,并在训练下一层级分类模型时,将上一层级经过微调的预训练模型Bert base的部分训练参数迁移到下一层级初始预训练模型Bert base的对应部分,最后将生成的多层级的分类模型进行组合生成最终的分类模型。所述方法和系统可有效扩增每种类别下的数据总量,解决模型训练的数据稀疏度问题;并对低层级的分类学习,通过迁移高层级分类模型的通用参数提升训练效果。

    一种标准问题推荐方法、装置、介质和设备

    公开(公告)号:CN114443942A

    公开(公告)日:2022-05-06

    申请号:CN202011214886.1

    申请日:2020-11-04

    Abstract: 本发明涉及一种标准问题推荐方法、装置、介质和设备。根据本发明实施例提供的方案,可以根据获取的指定用户历史曾经提问的每个标准问题对应的标准问题序列,利用预先训练出的将递归神经网络模型与线性模型进行融合获得的推荐模型,确定出针对指定用户的待推荐的标准问题的标识,进而将对应的标准问题推荐给指定用户。从而可以通过将递归神经网络模型与线性模型进行融合获得的推荐模型,对用户下一步可能提问的标准问题进行快速准确预测,实现标准问题的快速准确推荐。

Patent Agency Ranking