程序名称宽泛检测方法和装置

    公开(公告)号:CN112199947A

    公开(公告)日:2021-01-08

    申请号:CN202011061564.8

    申请日:2020-09-30

    Abstract: 本说明书实施例提供一种程序名称宽泛检测方法和装置,该方法包括:获取一个程序的程序名称和主体名称后,首先从程序名称中解析出第一分词并分别将每个第一分词映射为第一词向量,从主体名称中解析出第二分词并分别将每个第二分词映射为第二词向量,接着根据各第一词向量生成用于表征程序名称内容特征的程序名称编码,接着根据程序名称编码和各第二词向量生成用于表征主体名称内容特征及第一分词与第二分词之间相似性的主体名称编码,接着将程序名称编码和主体名称编码输入分类器获得名称宽泛系数,接着根据名称宽泛系统与预设名称宽泛阈值的大小关系确定该程序的程序名称是否宽泛。

    一种模型训练方法、业务执行方法、装置以及存储介质

    公开(公告)号:CN119203933A

    公开(公告)日:2024-12-27

    申请号:CN202411217241.1

    申请日:2024-08-30

    Inventor: 周书恒 祝慧佳

    Abstract: 本说明书提供的一种模型训练方法、业务执行方法、装置以及存储介质,可以首先获取文本数据,将文本数据输入到预设的大语言模型中,以使大语言模型对文本数据进行语义分析,以确定出文本数据所对应的各文本要素信息,并根据各文本要素信息,生成用于对文本数据从至少部分角度进行总结的总结文本,以将总结文本与文本数据进行匹配,得到总结文本与文本数据之间的匹配结果,作为实际匹配结果,将文本数据以及总结文本输入到待训练的语言模型中,以使语言模型生成文本数据与总结文本之间的匹配结果,作为待验证匹配结果,根据待验证匹配结果和实际匹配结果之间的偏差,确定损失值,并根据损失值,对待训练的语言模型进行训练。

    程序名称宽泛检测方法和装置

    公开(公告)号:CN112199947B

    公开(公告)日:2024-10-18

    申请号:CN202011061564.8

    申请日:2020-09-30

    Abstract: 本说明书实施例提供一种程序名称宽泛检测方法和装置,该方法包括:获取一个程序的程序名称和主体名称后,首先从程序名称中解析出第一分词并分别将每个第一分词映射为第一词向量,从主体名称中解析出第二分词并分别将每个第二分词映射为第二词向量,接着根据各第一词向量生成用于表征程序名称内容特征的程序名称编码,接着根据程序名称编码和各第二词向量生成用于表征主体名称内容特征及第一分词与第二分词之间相似性的主体名称编码,接着将程序名称编码和主体名称编码输入分类器获得名称宽泛系数,接着根据名称宽泛系统与预设名称宽泛阈值的大小关系确定该程序的程序名称是否宽泛。

    模型处理方法及装置

    公开(公告)号:CN117574880A

    公开(公告)日:2024-02-20

    申请号:CN202311631559.X

    申请日:2023-11-30

    Inventor: 周书恒 祝慧佳

    Abstract: 本说明书一个或多个实施例公开了一种模型处理方法及装置。所述方法包括:获取金融交易报告训练文本中与关键词库中的关键词匹配的词语的编码数据,对每一个词语的编码数据进行错误编码处理,得到错误编码数据;基于词语和该词语的错误编码数据,确定与词语的错误编码数据对应的构造词语,将构造词语替换训练文本中的词语,以生成第一错误文本;选取一个或多个分词处理后得到的词语,分别插入训练文本中该词语的相邻位置,选取一个或多个标点,分别插入训练文本中该标点的相邻位置,以生成第二错误文本;基于第一错误文本、第二错误文本和金融交易报告训练文本对文本检错模型进行模型训练,得到训练后的文本检错模型。

    一种风险提示方法、装置及电子设备

    公开(公告)号:CN111553696B

    公开(公告)日:2022-05-31

    申请号:CN202010328350.6

    申请日:2020-04-23

    Inventor: 周书恒 祝慧佳

    Abstract: 本说明书公开了一种风险提示方法、装置及电子设备,该风险提示方法包括:获得用户对目标商品的操作行为所属的行为类型以及提供目标商品的目标商家;基于目标商家售卖的所有商品的类目信息,获得目标商家的商品类目分散度;基于用户的行为类型和目标商家的商品类目分散度,对用户的操作行为进行风险提示。通过商家的商品类目分散度、用户行为类型,综合考虑商家侧和用户侧的信息,来确定是否需要对用户进行风险提示,提高风险提示的准确性。

    一种应用的分类方法、装置及设备

    公开(公告)号:CN113553434B

    公开(公告)日:2021-11-30

    申请号:CN202111094272.9

    申请日:2021-09-17

    Inventor: 周书恒 祝慧佳

    Abstract: 本说明书实施例提供了一种应用的分类方法、装置及设备,包括:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。

    一种应用的分类方法、装置及设备

    公开(公告)号:CN113553434A

    公开(公告)日:2021-10-26

    申请号:CN202111094272.9

    申请日:2021-09-17

    Inventor: 周书恒 祝慧佳

    Abstract: 本说明书实施例提供了一种应用的分类方法、装置及设备,包括:获取待分类的目标应用程序的属性信息,并获取对应用程序进行分类的多个应用类别的信息;基于属性信息,确定目标应用程序对应的属性表征信息,并基于多个应用类别的信息和属性表征信息,通过注意力算法,确定目标应用程序对应的关系表征信息;对属性表征信息和关系表征信息进行合并处理,得到目标应用程序对应的分类特征信息;将分类特征信息输入至预设分类模型中,得到目标应用程序对应的应用类别,其中,预设分类模型为基于具有应用类别作为训练标签的样本数据进行有监督的训练得到的。

    一种风险识别的方法、装置、存储介质及电子设备

    公开(公告)号:CN118069824A

    公开(公告)日:2024-05-24

    申请号:CN202410276238.0

    申请日:2024-03-11

    Abstract: 本说明书公开了一种风险识别的方法、装置、存储介质及电子设备,所述方法包括:响应于用户的输入操作,确定用户输入的文本,并作为待识别文本。根据待识别文本的关键词,从预先构建的知识库中,确定与待识别文本匹配的文本,并作为第一文本。将第一文本和待识别文本输入预先训练的风险识别模型,以使风险识别模型在所述第一文本的提示下,确定待识别文本的第一特征。确定若干规则特征,从各规则特征中,确定与待识别文本匹配的规则特征,并作为第二特征。将第一特征和第二特征输入风险识别模型,确定待识别文本的风险识别结果。通过引入第一文本和用于识别文本风险的第二特征,提高待识别文本的风险识别结果的准确性。

    一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN117195871A

    公开(公告)日:2023-12-08

    申请号:CN202311008555.6

    申请日:2023-08-10

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质和电子设备,获取样本文本,并确定所述样本文本中的每个字符的标注实体类别,针对每个标注实体类别,获得该标注实体类别对应的代表字符集,所述代表字符集中包含至少两个代表字符,获取预训练的语言模型,将所述样本文本输入所述语言模型,确定所述语言模型针对每个字符识别出的代表字符,针对所述样本文本中的每个字符,判断所述语言模型针对该字符识别出的代表字符是否位于该字符的标注实体类别对应的代表字符集中,若否,则对所述语言模型进行微调训练。本方法通过语言模型识别文本中字符的实体类别,并利用多个代表字符代表一个实体类别,提高语言模型输出文本中字符的实体类别的准确性。

Patent Agency Ranking