可视化用户分类方法、服务方法、系统、装置及存储介质

    公开(公告)号:CN113553369B

    公开(公告)日:2024-06-25

    申请号:CN202010339657.6

    申请日:2020-04-26

    Applicant: 清华大学

    Abstract: 本申请的可视化用户分类方法、服务方法、系统、装置及存储介质,获取根据输入信息、及用户群体的用户群体数据得到的可视化数据;其中,输入信息用于设定处理用户群体数据的欺诈检测算法、算法参数、及至少一种用户行为特征集;其中,可视化数据用于显示包括:反映用户群体基于在至少一种用户行为特征集中一或多个用户行为特征上的行为相似度所形成的分布视图;用户间的行为相似度的高低负相关于它们在分布视图中的映射间距的大小,以进行可视化输出。本申请的方案可以实现根据不同用户行为的行为相似度而直观且准确地展现出用户在不同行为上的同步,有助于快速准确地进行欺诈行为的分析或评估欺诈检测的质量。

    一种语种训练数据获得方法及装置

    公开(公告)号:CN109741731A

    公开(公告)日:2019-05-10

    申请号:CN201910015434.1

    申请日:2019-01-08

    Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。

    一种异构网络可交互可视化方法

    公开(公告)号:CN104090957A

    公开(公告)日:2014-10-08

    申请号:CN201410327034.1

    申请日:2014-07-10

    Inventor: 时磊 赵月 林闯

    CPC classification number: G06F17/30994 G06K9/6218

    Abstract: 本发明公开了一种异构网络可交互可视化方法。本方法为:1)对异构网络中的节点按照节点属性的取值进行聚类,并生成相应的聚类网络可视化图;2)对所选聚类结果中的每一节点,计算该节点的邻居节点集合;然后按照邻居节点集合节点属性值对所选聚类结果中的每一节点进行聚类;并生成聚类可视化图作为下一级可视图;3)选取步骤2)的若干聚类结果,对所选聚类结果中的每一节点根据其邻居节点集合进行聚类,将具有相同邻居节点集合的节点划分到同一聚类中;然后将此次聚类结果生成聚类可视化图并将其作为步骤2)所生成聚类网络可视化图的下一级可视图。本发明结合了拓扑和属性信息,使用户能够用更细的粒度进行更低层级的查看。

    可视化用户分类方法、服务方法、系统、装置及存储介质

    公开(公告)号:CN113553369A

    公开(公告)日:2021-10-26

    申请号:CN202010339657.6

    申请日:2020-04-26

    Applicant: 清华大学

    Abstract: 本申请的可视化用户分类方法、服务方法、系统、装置及存储介质,获取根据输入信息、及用户群体的用户群体数据得到的可视化数据;其中,输入信息用于设定处理用户群体数据的欺诈检测算法、算法参数、及至少一种用户行为特征集;其中,可视化数据用于显示包括:反映用户群体基于在至少一种用户行为特征集中一或多个用户行为特征上的行为相似度所形成的分布视图;用户间的行为相似度的高低负相关于它们在分布视图中的映射间距的大小,以进行可视化输出。本申请的方案可以实现根据不同用户行为的行为相似度而直观且准确地展现出用户在不同行为上的同步,有助于快速准确地进行欺诈行为的分析或评估欺诈检测的质量。

    一种语种训练数据获得方法及装置

    公开(公告)号:CN109741731B

    公开(公告)日:2020-12-29

    申请号:CN201910015434.1

    申请日:2019-01-08

    Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。

Patent Agency Ranking