一种非稳态多臂老虎机和概率夏普利值的联邦学习方法

    公开(公告)号:CN118445845A

    公开(公告)日:2024-08-06

    申请号:CN202410594687.X

    申请日:2024-05-14

    Applicant: 浙江大学

    Abstract: 本发明公开了一种非稳态多臂老虎机和概率夏普利值的联邦学习方法,该方法中,服务端根据当前超臂的概率分布,利用非稳态多臂老虎机模型抽取一个超臂;服务端利用截断蒙特卡洛算法,计算所选超臂中所有客户端的概率夏普利值并进行求和与归一化;服务端对受影响的每个超臂更新损失估计,并更新所有超臂的累积损失和概率;所选超臂中的每个客户端进行本地模型训练并将模型参数的变化上传至服务端;服务端基于收到的客户端模型参数的变化,结合所选超臂中所有客户端的概率夏普利值,计算全局模型参数的变化,从而更新全局模型参数并下发至各客户端;重复上述步骤,直至全局模型参数达到预定要求。

    实现隐私控制的多源分散数据的三方合作产品化方法

    公开(公告)号:CN117828664A

    公开(公告)日:2024-04-05

    申请号:CN202311847894.3

    申请日:2023-12-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种实现隐私控制的多源分散数据的三方合作产品化方法,基于产品使用者、数据聚合者和数据提供者的策略构建三阶段的斯塔克尔伯格‑纳什博弈模型,进而求解产品使用者、数据聚合者和数据提供者的最优策略;根据博弈得到的数据提供者的最优策略,每个数据提供者计算自身要提供的数据数量、隐私程度和补偿值并将隐私保护后的数据提供至数据聚合者,以换取相应补偿;数据聚合者利用数据提供者提供的数据来制造数据产品,同时更新数据提供者数据权重。基于此,三方的理性目标均得以实现,达到了均衡状态而非只有部分参与者最大化的非均衡态。使得生产出的数据产品质量得到优化并且提供了数据提供者的隐私保护,参与三方的效用实现最大化。

    一种多模态数据合规分析与智能评估方法及装置

    公开(公告)号:CN116402334A

    公开(公告)日:2023-07-07

    申请号:CN202211741479.5

    申请日:2022-12-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种多模态数据合规分析与智能评估方法及装置,该方法包括:获取不同类型、不同存储方式的多模态数据;识别标记出多模态数据中的敏感信息;基于数据生命周期模块化拆分合规问卷表单,生成全周期数据合规表单,将合规表单发送至用户并获取用户填写的合规表单;将敏感数据和用户填写的合规表单作为输入,送入预训练的合规风险识别模型进行合规分析,识别出违规数据项和风险点,并给出合规指数得分;基于风险点,送入预训练的智能推荐合规建议模型进行分析,从而智能推荐合规建议,自动给出合规风险评估并生成合规报告;针对违规数据,进行一键自动合规处理;运用区块链技术,将数据合规处理的记录保存上链,以防止篡改丢失。

    一种基于SAM 2的视频概念解释方法

    公开(公告)号:CN119478796A

    公开(公告)日:2025-02-18

    申请号:CN202510061884.X

    申请日:2025-01-15

    Applicant: 浙江大学

    Abstract: 本发明公开一种基于SAM 2的视频概念解释方法,该方法主要包括如下步骤:针对所要进行的目标任务,定义若干语义类别,并获取各语义类别相应的语义分割数据集及提示符,利用每个语义类别对应的提示符和语义分割数据集训练提示生成模型;利用训练后的提示生成模型为待解释视频中的每帧图像生成相应提示符,逐帧提取待解释视频的特征,将每帧图像的提示符和特征一并输入至SAM 2模型,得到时空概念集;将每个时空概念视为博弈中的参与者,利用视频分类模型对待解释视频进行分类,并基于待解释模型的预测类别,计算每个时空概念的夏普利值,从而生成对视频数据的最优时空概念解释,对3D神经网络模型的预测结果进行高质量的概念解释。

    一种适用于大数据的函数依赖近似发现方法

    公开(公告)号:CN116701351A

    公开(公告)日:2023-09-05

    申请号:CN202310599347.1

    申请日:2023-05-25

    Abstract: 本发明公开了一种适用于大数据的函数依赖近似发现方法,包括:依据属性对原数据集中元组进行聚类分区,并以分区中簇序号来替换原数据集中所有属性值,得到新数据集;以聚类簇为单元为新数据集创建优先级队列,对优先级队列中元组对进行采样,通过比较元组对在属性值的差异来生成非函数依赖,并添加到非函数依赖集合中,以集合的增长率为判断标准来控制采样过程的终止;对非函数依赖集合中进行结构化精简;利用非函数依赖集合验证当前后续函数依赖集合的合法性,删去不成立的函数依赖,并在函数依赖的左部添加新的属性能够得到新候选函数依赖,重新添加到函数依赖结果集中,以结果集的增长率为判断标准来控制流程的走向。该方法计算开销小。

    一种数据合规分析方法
    6.
    发明公开

    公开(公告)号:CN116401343A

    公开(公告)日:2023-07-07

    申请号:CN202211741455.X

    申请日:2022-12-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种数据合规分析方法,包括:设置法律知识库、合规问卷库和智能建议库;在所述法律知识库中选择目标法律,自动识别其中与数据合规相关的法律条文并进行标注;在所述合规问卷中选择目标模块,以使得用户得到自定义合规问卷表单并进行选答;在智能建议库中输入案例描述、数据和选答后的合规问卷,分析数据风险并推荐出违规概率最高的若干个法条;对于选答后的合规问卷进行表单真实性验证、违规项风险评级以及各数据维度评分,得到数据合规评分。

    一种中文隐私政策自动标注及摘要提取方法和装置

    公开(公告)号:CN116361453A

    公开(公告)日:2023-06-30

    申请号:CN202310117105.4

    申请日:2023-02-15

    Abstract: 本发明公开了一种中文隐私政策自动标注及摘要提取方法和装置,包括将隐私政策文本划分为条款句子,依据隐私政策标注准则对每个条款句子进行类别标签、重要条款标签以及潜在风险条款标签的标注后,进行数据增强和分词处理以构建训练样本;利用训练样本及对应的标签分别对类别识别模型、关键句识别模型以及风险识别模型进行有监督学习训练;将待标注的隐私政策文本处理成测试样本后,利用训练好的三个模型中的至少一个模型对测试样本进行标签预测,并依据标签预测结果对隐私政策文本中每个条款句子进行标签标注;依据标签标注结果从隐私政策文本中提取满足需求的条款句子组成摘要文本。该方法和装置标注质量高、通用性强、使用简便。

    一种基于大数据的高可信度学习资源安全共享方法及装置

    公开(公告)号:CN118568754B

    公开(公告)日:2024-11-26

    申请号:CN202411038288.1

    申请日:2024-07-31

    Applicant: 浙江大学

    Abstract: 本发明涉及一种基于大数据的高可信度学习资源安全共享方法及装置,包括:获取学习资源数据,根据学习资源数据的敏感程度设置加密等级并加密,存储至分布式的存储节点中,并监测学习资源数据的篡改情况;获取不同用户对于学习资源数据的反馈评价信息数据,对该学习资源数据的可信度进行评估,从而动态调整学习资源数据的加密等级;根据请求共享的用户类型及其权限,对请求共享的学习资源数据进行解密并共享,其中,用户通过主动搜索或被动推荐获取请求共享的学习资源数据,通过用户之间对同一类学习资源数据的相似度为用户进行学习资源数据的推荐。通过上述方式,实现提高学习资料的可信度,确保用户能够获取高质量的学习资源。

    一种基于大数据的高可信度学习资源安全共享方法及装置

    公开(公告)号:CN118568754A

    公开(公告)日:2024-08-30

    申请号:CN202411038288.1

    申请日:2024-07-31

    Applicant: 浙江大学

    Abstract: 本发明涉及一种基于大数据的高可信度学习资源安全共享方法及装置,包括:获取学习资源数据,根据学习资源数据的敏感程度设置加密等级并加密,存储至分布式的存储节点中,并监测学习资源数据的篡改情况;获取不同用户对于学习资源数据的反馈评价信息数据,对该学习资源数据的可信度进行评估,从而动态调整学习资源数据的加密等级;根据请求共享的用户类型及其权限,对请求共享的学习资源数据进行解密并共享,其中,用户通过主动搜索或被动推荐获取请求共享的学习资源数据,通过用户之间对同一类学习资源数据的相似度为用户进行学习资源数据的推荐。通过上述方式,实现提高学习资料的可信度,确保用户能够获取高质量的学习资源。

    一种基于代表性天际线点选取的数据查询方法

    公开(公告)号:CN119377491B

    公开(公告)日:2025-05-06

    申请号:CN202411976069.8

    申请日:2024-12-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于代表性天际线点选取的数据查询方法,包括:获取待查询的产品数据集,对其进行天际线查询得到若干天际线点,计算每个天际线点的主导点数及天际线点对间的相似度,进一步计算所有天际线点对其余天际线点的偏好值,得到每个天际线点对其余天际线点的偏好序列;基于单一可转移投票方法,将所有天际线点均作为投票者和被投票者,根据每个天际线点对其余天际线点的偏好序列进行一轮投票,得到该投票轮次中的第一参与者或第二参与者,将第一参与者或第二参与者移出被投票者并进行对应选票转移,重复选出第一参与者或第二参与者以及选票转移的过程,直至得到预定数量个第一参与者,即得到产品推荐的数据查询结果。

Patent Agency Ranking