-
公开(公告)号:CN112199947A
公开(公告)日:2021-01-08
申请号:CN202011061564.8
申请日:2020-09-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/242 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06N20/00
Abstract: 本说明书实施例提供一种程序名称宽泛检测方法和装置,该方法包括:获取一个程序的程序名称和主体名称后,首先从程序名称中解析出第一分词并分别将每个第一分词映射为第一词向量,从主体名称中解析出第二分词并分别将每个第二分词映射为第二词向量,接着根据各第一词向量生成用于表征程序名称内容特征的程序名称编码,接着根据程序名称编码和各第二词向量生成用于表征主体名称内容特征及第一分词与第二分词之间相似性的主体名称编码,接着将程序名称编码和主体名称编码输入分类器获得名称宽泛系数,接着根据名称宽泛系统与预设名称宽泛阈值的大小关系确定该程序的程序名称是否宽泛。
-
公开(公告)号:CN112153035A
公开(公告)日:2020-12-29
申请号:CN202010988103.9
申请日:2020-09-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04L29/06
Abstract: 本说明书实施例提供了保护隐私的用户协议处理方法及装置,该方法的一具体实施方式包括:响应于获取到目标互联网产品的用户协议信息,从该用户协议信息中确定出涉及用户隐私的目标协议条款;从该目标协议条款中提取出涉及用户隐私的权限信息;根据该权限信息,获取针对该目标协议条款的风险解读结果;向目标互联网产品所属的目标用户输出该风险解读结果。
-
公开(公告)号:CN112199947B
公开(公告)日:2024-10-18
申请号:CN202011061564.8
申请日:2020-09-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/242 , G06F40/284 , G06F18/22 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本说明书实施例提供一种程序名称宽泛检测方法和装置,该方法包括:获取一个程序的程序名称和主体名称后,首先从程序名称中解析出第一分词并分别将每个第一分词映射为第一词向量,从主体名称中解析出第二分词并分别将每个第二分词映射为第二词向量,接着根据各第一词向量生成用于表征程序名称内容特征的程序名称编码,接着根据程序名称编码和各第二词向量生成用于表征主体名称内容特征及第一分词与第二分词之间相似性的主体名称编码,接着将程序名称编码和主体名称编码输入分类器获得名称宽泛系数,接着根据名称宽泛系统与预设名称宽泛阈值的大小关系确定该程序的程序名称是否宽泛。
-
公开(公告)号:CN114817444B
公开(公告)日:2024-07-16
申请号:CN202210344851.2
申请日:2022-04-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/30
Abstract: 本说明书实施例提供了一种文档处理方法及装置。该方法包括:从待处理的文档中提取出至少两个文本块;将每一个文本块作为一个节点,并得到每一个节点的至少一种特征;根据每一个节点的至少一种特征,得到该节点的初始表征向量;根据每一个节点的初始表征向量、该节点对应的文本块与其他各节点对应的文本块在待处理的文档中的位置关系,得到每一个节点的最终表征向量。本说明书实施例能够更为准确地得到表征文档中的信息的向量。
-
公开(公告)号:CN113486656B
公开(公告)日:2023-11-10
申请号:CN202110808793.X
申请日:2021-07-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F16/36
Abstract: 本说明书实施例提供了一种语料生成方法及装置,该方法包括:获取原始文本;对原始文本进行关键词匹配,从而确定出原始文本中的违规关键词以及其对应的基本关键词,基本关键词对应于违规关键词的正确形态;确定基本关键词的违规要素,并确定出与基本关键词关于违规要素存在关联的关联关键词;对关联关键词进行文本变种,获取变种文本;以变种文本,替换原始文本中的违规关键词,生成语料文本。
-
公开(公告)号:CN114817444A
公开(公告)日:2022-07-29
申请号:CN202210344851.2
申请日:2022-04-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/30
Abstract: 本说明书实施例提供了一种文档处理方法及装置。该方法包括:从待处理的文档中提取出至少两个文本块;将每一个文本块作为一个节点,并得到每一个节点的至少一种特征;根据每一个节点的至少一种特征,得到该节点的初始表征向量;根据每一个节点的初始表征向量、该节点对应的文本块与其他各节点对应的文本块在待处理的文档中的位置关系,得到每一个节点的最终表征向量。本说明书实施例能够更为准确地得到表征文档中的信息的向量。
-
公开(公告)号:CN113486656A
公开(公告)日:2021-10-08
申请号:CN202110808793.X
申请日:2021-07-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F16/36
Abstract: 本说明书实施例提供了一种语料生成方法及装置,该方法包括:获取原始文本;对原始文本进行关键词匹配,从而确定出原始文本中的违规关键词以及其对应的基本关键词,基本关键词对应于违规关键词的正确形态;确定基本关键词的违规要素,并确定出与基本关键词关于违规要素存在关联的关联关键词;对关联关键词进行文本变种,获取变种文本;以变种文本,替换原始文本中的违规关键词,生成语料文本。
-
-
-
-
-
-