程序名称宽泛检测方法和装置

    公开(公告)号:CN112199947A

    公开(公告)日:2021-01-08

    申请号:CN202011061564.8

    申请日:2020-09-30

    Abstract: 本说明书实施例提供一种程序名称宽泛检测方法和装置,该方法包括:获取一个程序的程序名称和主体名称后,首先从程序名称中解析出第一分词并分别将每个第一分词映射为第一词向量,从主体名称中解析出第二分词并分别将每个第二分词映射为第二词向量,接着根据各第一词向量生成用于表征程序名称内容特征的程序名称编码,接着根据程序名称编码和各第二词向量生成用于表征主体名称内容特征及第一分词与第二分词之间相似性的主体名称编码,接着将程序名称编码和主体名称编码输入分类器获得名称宽泛系数,接着根据名称宽泛系统与预设名称宽泛阈值的大小关系确定该程序的程序名称是否宽泛。

    保护隐私的用户协议处理方法及装置

    公开(公告)号:CN112153035A

    公开(公告)日:2020-12-29

    申请号:CN202010988103.9

    申请日:2020-09-18

    Inventor: 施登亮 祝慧佳

    Abstract: 本说明书实施例提供了保护隐私的用户协议处理方法及装置,该方法的一具体实施方式包括:响应于获取到目标互联网产品的用户协议信息,从该用户协议信息中确定出涉及用户隐私的目标协议条款;从该目标协议条款中提取出涉及用户隐私的权限信息;根据该权限信息,获取针对该目标协议条款的风险解读结果;向目标互联网产品所属的目标用户输出该风险解读结果。

    程序名称宽泛检测方法和装置

    公开(公告)号:CN112199947B

    公开(公告)日:2024-10-18

    申请号:CN202011061564.8

    申请日:2020-09-30

    Abstract: 本说明书实施例提供一种程序名称宽泛检测方法和装置,该方法包括:获取一个程序的程序名称和主体名称后,首先从程序名称中解析出第一分词并分别将每个第一分词映射为第一词向量,从主体名称中解析出第二分词并分别将每个第二分词映射为第二词向量,接着根据各第一词向量生成用于表征程序名称内容特征的程序名称编码,接着根据程序名称编码和各第二词向量生成用于表征主体名称内容特征及第一分词与第二分词之间相似性的主体名称编码,接着将程序名称编码和主体名称编码输入分类器获得名称宽泛系数,接着根据名称宽泛系统与预设名称宽泛阈值的大小关系确定该程序的程序名称是否宽泛。

    文档处理方法和装置
    4.
    发明授权

    公开(公告)号:CN114817444B

    公开(公告)日:2024-07-16

    申请号:CN202210344851.2

    申请日:2022-04-02

    Abstract: 本说明书实施例提供了一种文档处理方法及装置。该方法包括:从待处理的文档中提取出至少两个文本块;将每一个文本块作为一个节点,并得到每一个节点的至少一种特征;根据每一个节点的至少一种特征,得到该节点的初始表征向量;根据每一个节点的初始表征向量、该节点对应的文本块与其他各节点对应的文本块在待处理的文档中的位置关系,得到每一个节点的最终表征向量。本说明书实施例能够更为准确地得到表征文档中的信息的向量。

    一种语料生成方法及装置

    公开(公告)号:CN113486656B

    公开(公告)日:2023-11-10

    申请号:CN202110808793.X

    申请日:2021-07-16

    Abstract: 本说明书实施例提供了一种语料生成方法及装置,该方法包括:获取原始文本;对原始文本进行关键词匹配,从而确定出原始文本中的违规关键词以及其对应的基本关键词,基本关键词对应于违规关键词的正确形态;确定基本关键词的违规要素,并确定出与基本关键词关于违规要素存在关联的关联关键词;对关联关键词进行文本变种,获取变种文本;以变种文本,替换原始文本中的违规关键词,生成语料文本。

    文档处理方法和装置
    6.
    发明公开

    公开(公告)号:CN114817444A

    公开(公告)日:2022-07-29

    申请号:CN202210344851.2

    申请日:2022-04-02

    Abstract: 本说明书实施例提供了一种文档处理方法及装置。该方法包括:从待处理的文档中提取出至少两个文本块;将每一个文本块作为一个节点,并得到每一个节点的至少一种特征;根据每一个节点的至少一种特征,得到该节点的初始表征向量;根据每一个节点的初始表征向量、该节点对应的文本块与其他各节点对应的文本块在待处理的文档中的位置关系,得到每一个节点的最终表征向量。本说明书实施例能够更为准确地得到表征文档中的信息的向量。

    一种语料生成方法及装置

    公开(公告)号:CN113486656A

    公开(公告)日:2021-10-08

    申请号:CN202110808793.X

    申请日:2021-07-16

    Abstract: 本说明书实施例提供了一种语料生成方法及装置,该方法包括:获取原始文本;对原始文本进行关键词匹配,从而确定出原始文本中的违规关键词以及其对应的基本关键词,基本关键词对应于违规关键词的正确形态;确定基本关键词的违规要素,并确定出与基本关键词关于违规要素存在关联的关联关键词;对关联关键词进行文本变种,获取变种文本;以变种文本,替换原始文本中的违规关键词,生成语料文本。

Patent Agency Ranking