基于演进的数据流的自适应统计数据去标识

    公开(公告)号:CN111344708B

    公开(公告)日:2023-12-08

    申请号:CN201880073071.0

    申请日:2018-12-17

    Abstract: 一种动态地改变应用于数据集的数据去标识规则集以用于去标识数据的系统,所述系统包括至少一个处理器。所述系统周期性地监视从在一个条件集下根据数据去标识规则集被去标识的数据导出的数据集。相对于所监视的数据来评估针对数据去标识规则集的条件集,以确定数据去标识的适用性。响应于评估指示用于数据去标识规则集的条件的集合中的一个或多个条件不再被满足,动态地改变数据去标识规则集的一个或多个规则。本发明的实施例还可以包括用于以与上述基本相同的方式动态地改变应用于数据集的数据去标识规则集以去标识数据的方法和计算机程序产品。

    将数据匿名化的方法和系统

    公开(公告)号:CN104732154A

    公开(公告)日:2015-06-24

    申请号:CN201410680565.9

    申请日:2014-11-24

    CPC classification number: G06F21/6227 G06F21/6254

    Abstract: 本公开提供了将数据匿名化的方法和系统。所述方法包括:接收包括数据集的输入,所述数据集具有关系数据部分和序列数据部分两者;从数据集中识别与实体相对应的直接标识符属性;屏蔽或抑制所识别的直接标识符属性值;基于关于定义的成本函数F的相似性对记录排序;选择并迭代地将使用成本函数F而排序的至少前k个记录的每个组匿名化,至少k个记录的每个组构成一个群,将属性值匿名化是沿着关系部分和序列部分两者进行的,其中k是指定的k-匿名化参数;以及重复选择并迭代地将连续的群中的至少k个记录的每个连续组匿名化的步骤,将属性值匿名化是沿着所述组中的记录的关系部分和序列部分两者进行的,其中匿名化的表格表示是由匿名化产生的。

    语音识别和内容去识别
    3.
    发明公开

    公开(公告)号:CN115427958A

    公开(公告)日:2022-12-02

    申请号:CN202180029204.6

    申请日:2021-04-26

    Abstract: 本发明的一个实施例提供了一种用于隐私保证下讲话人身份和内容去识别的方法。该方法包括:接收指示要实施的隐私保护级别的输入,从记录在话音记录中的语音提取特征,从所述语音中识别并提取文本内容,解析所述文本内容以识别关于个体的隐私敏感个人信息,通过将所述个人信息匿名化到满足所述隐私保护级别并隐藏个人身份的程度来生成去识别文本内容,以及将所述去识别文本内容映射到传送所述语音的讲话者。该方法还包括基于与特征在满足所述隐私保护级别的程度上不相似的其他特征来生成合成讲话者身份,以及基于所述合成讲话者身份来合成新语音波形以传送所述去识别文本内容。所述新语音波形隐藏了所述讲话者的身份。

    用于对数据集进行推荐和定价的方法和系统

    公开(公告)号:CN104657878A

    公开(公告)日:2015-05-27

    申请号:CN201410641489.0

    申请日:2014-11-13

    Abstract: 用于对数据集进行推荐和定价的方法和系统。一种计算机处理器提供了至少包括第一数据集的数据集集合,其中该数据集的集合中的每个数据集分别被配置为允许该数据集根据多种变化进行呈现,其中每种变化由对至少一种变换的选择来定义。该计算机处理器接收与第一数据集的至少第一变化相关的顾客反馈信息。该计算机处理器至少部分地基于该顾客反馈信息而训练第一机器学习算法。该计算机处理器通过该第一机器学习算法来执行营销行为。该营销行为包括以下的至少一项:(i)定义第一数据集的新的变化,(ii)定义用于定义第一数据集的变化的新的变换,(iii)推荐第一数据集的预定义变化,和(iv)对第一数据集的预定义变化进行定价。

    基于演进的数据流的自适应统计数据去标识

    公开(公告)号:CN111344708A

    公开(公告)日:2020-06-26

    申请号:CN201880073071.0

    申请日:2018-12-17

    Abstract: 一种动态地改变应用于数据集的数据去标识规则集以用于去标识数据的系统,所述系统包括至少一个处理器。所述系统周期性地监视从在一个条件集下根据数据去标识规则集被去标识的数据导出的数据集。相对于所监视的数据来评估针对数据去标识规则集的条件集,以确定数据去标识的适用性。响应于评估指示用于数据去标识规则集的条件的集合中的一个或多个条件不再被满足,动态地改变数据去标识规则集的一个或多个规则。本发明的实施例还可以包括用于以与上述基本相同的方式动态地改变应用于数据集的数据去标识规则集以去标识数据的方法和计算机程序产品。

    用于从社交媒体中识别、监控和排名事件的方法和系统

    公开(公告)号:CN104750768B

    公开(公告)日:2018-01-12

    申请号:CN201410641037.2

    申请日:2014-11-13

    Abstract: 一种用于从社交媒体流中检测、监控并对事件排名的方法和系统包括:从社交媒体流中检测一个或多个事件,并持续地监控所述一个或多个事件,计算每一个所述事件的当前分数,确定表明每个所述事件的预期演变的预计分数,基于所述事件的当前分数而对所述事件进行排名,基于所述事件的预计分数而预测所述事件的排名,以及响应于从所述社交媒体流中检测到的关于所述事件的新输入,更新所预测的排名。在一个方面,所述当前分数根据所述事件的特性计算,所述特性包括社会影响评估、用户的动态位置、人类感知和社交网络特征中的一个或多个。在一个方面,所述当前分数基于事件的类型和演变是已知的类似事件中的一个、使用一个或多个扩散模型来计算。

    将数据匿名化的方法和系统

    公开(公告)号:CN104732154B

    公开(公告)日:2018-01-12

    申请号:CN201410680565.9

    申请日:2014-11-24

    CPC classification number: G06F21/6227 G06F21/6254

    Abstract: 本公开提供了将数据匿名化的方法和系统。所述方法包括:接收包括数据集的输入,所述数据集具有关系数据部分和序列数据部分两者;从数据集中识别与实体相对应的直接标识符属性;屏蔽或抑制所识别的直接标识符属性值;基于关于定义的成本函数F的相似性对记录排序;选择并迭代地将使用成本函数F而排序的至少前k个记录的每个组匿名化,至少k个记录的每个组构成一个群,将属性值匿名化是沿着关系部分和序列部分两者进行的,其中k是指定的k‑匿名化参数;以及重复选择并迭代地将连续的群中的至少k个记录的每个连续组匿名化的步骤,将属性值匿名化是沿着所述组中的记录的关系部分和序列部分两者进行的,其中匿名化的表格表示是由匿名化产生的。

    用于从社交媒体中识别、监控和排名事件的系统

    公开(公告)号:CN104750768A

    公开(公告)日:2015-07-01

    申请号:CN201410641037.2

    申请日:2014-11-13

    Abstract: 一种用于从社交媒体流中检测、监控并对事件排名的方法和系统包括:从社交媒体流中检测一个或多个事件,并持续地监控所述一个或多个事件,计算每一个所述事件的当前分数,确定表明每个所述事件的预期演变的预计分数,基于所述事件的当前分数而对所述事件进行排名,基于所述事件的预计分数而预测所述事件的排名,以及响应于从所述社交媒体流中检测到的关于所述事件的新输入,更新所预测的排名。在一个方面,所述当前分数根据所述事件的特性计算,所述特性包括社会影响评估、用户的动态位置、人类感知和社交网络特征中的一个或多个。在一个方面,所述当前分数基于事件的类型和演变是已知的类似事件中的一个、使用一个或多个扩散模型来计算。

Patent Agency Ranking