-
公开(公告)号:CN112434167B
公开(公告)日:2021-04-20
申请号:CN202110100246.6
申请日:2021-01-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供了一种信息识别方法及装置,其中,该方法包括:获取待识别的多个目标文本信息;其中,该目标文本信息为针对历史事件所产生的文本信息文档;确定每个目标文本信息对应的文本分词关系图谱;其中,该文本分词关系图谱包括:文本分词节点和分词节点连接边;将确定出的文本分词关系图谱输入至预先训练好的神经网络模型,得到目标文本信息之间的信息关联程度;其中,该信息关联程度用于表征至少两个所述目标文本信息为针对同一历史事件所产生的文本信息文档的概率。
-
公开(公告)号:CN110795563A
公开(公告)日:2020-02-14
申请号:CN201911055524.X
申请日:2019-10-31
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 孙宝林
IPC: G06F16/35 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供文本分类模型训练方法、事件检测方法及对应的装置,其中所述文本分类模型训练方法包括:将舆情文本样本集中的舆情文本进行分句,得到若干条句子;将若干条句子进行词向量计算,生成若干条句子各自的矩阵向量;分别针对所述若干条句子,将所针对的句子与邻近的连续上下文句子的矩阵向量组合成为所针对的句子的三维矩阵向量;将所述若干条句子的三维矩阵向量输入到基于3D卷积神经网络的文本分类模型中进行训练,得到训练后的文本分类模型,其中,所述3D卷积神经网络的3D卷积层的3D卷积核对输入到该3D卷积层的三维矩阵向量从高度、宽度和深度上进行卷积操作,输出该3D卷积层捕捉到的上下文特征信息。
-
公开(公告)号:CN110674297A
公开(公告)日:2020-01-10
申请号:CN201910902658.4
申请日:2019-09-24
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 孙宝林
Abstract: 本说明书实施例公开了一种舆情文本分类模型构建和舆情文本的分类方法、装置及设备。方案包括:获取待分类的舆情文本;采用不同的特征提取方式对待分类的舆情文本进行特征提取,得到待分类的舆情文本的多个不同的特征信息;将待分类的舆情文本的多个不同的特征信息分别输入多个分类模型,得到每个分类模型的输出结果;输入任意一个分类模型的特征的特征提取方式与训练任意一个分类模型时的特征提取方式是相同的;将待分类的舆情文本的多个不同的特征信息与待分类的舆情文本的多个不同的特征信息对应的每个分类模型的输出结果输入至舆情文本分类模型中,得到待分类的舆情文本的分类结果,舆情文本分类模型是基于所述多个分类模型得到的。
-
公开(公告)号:CN118313367A
公开(公告)日:2024-07-09
申请号:CN202410418301.X
申请日:2020-08-17
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 孙宝林
IPC: G06F40/211 , G06F40/289 , G06F16/35 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例公开了一种文本信息的抽取方法、装置及设备。方案包括:获取目标文本;对所述目标文本进行向量化处理,得到所述目标文本的文本特征;提取所述目标文本的句法信息,确定所述目标文本的句法特征;将所述文本特征与所述句法特征进行卷积计算,得到所述目标文本的融合特征;根据所述融合特征,确定所述目标文本中包含的实体以及预设关系;按照所述预设关系对所述实体进行组合,得到组合结果;根据所述组合结果,确定所述目标文本的三元组信息;还可以将三元组信息存储在区块链网络中。
-
公开(公告)号:CN112465411B
公开(公告)日:2021-06-04
申请号:CN202110111444.2
申请日:2021-01-27
Applicant: 支付宝(杭州)信息技术有限公司 , 蚂蚁区块链科技(上海)有限公司
Inventor: 孙宝林
Abstract: 本说明书实施例公开了一种风险预测方法、装置及设备,所述方法包括:通过从区块链系统中获取待预测企业的具有时间顺序的风险标签序列,将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;预测结果中包括每个风险对应的预测概率,将预测概率达到预设阈值的风险作为所述待预测企业的预测风险,将预测得到的预测风险发送给相关用户。
-
公开(公告)号:CN112434167A
公开(公告)日:2021-03-02
申请号:CN202110100246.6
申请日:2021-01-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供了一种信息识别方法及装置,其中,该方法包括:获取待识别的多个目标文本信息;其中,该目标文本信息为针对历史事件所产生的文本信息文档;确定每个目标文本信息对应的文本分词关系图谱;其中,该文本分词关系图谱包括:文本分词节点和分词节点连接边;将确定出的文本分词关系图谱输入至预先训练好的神经网络模型,得到目标文本信息之间的信息关联程度;其中,该信息关联程度用于表征至少两个所述目标文本信息为针对同一历史事件所产生的文本信息文档的概率。
-
-
-
-
-