-
公开(公告)号:CN111598059A
公开(公告)日:2020-08-28
申请号:CN202010601748.2
申请日:2020-06-28
Applicant: 中国人民公安大学
Abstract: 本发明提供了一种犯罪预测模型的训练方法、装置及电子设备,涉及犯罪预测技术领域,包括获取目标区域在预设时间段内的历史犯罪数据;将该历史犯罪数据转化为视频流;对于视频流中的每一图像帧,提取该图像帧的时空特征信息;以该视频流中各图像帧的时空特征信息为训练集合,训练预设的神经网络,直至满足预设的训练结束条件,得到训练好的犯罪预测模型。本发明实施例通过提取历史犯罪数据在不同时间深度的时间特征,以及通过多层卷积捕捉不同距离的空间依赖得到对应的空间特征,并对二者加以融合得到时空特征信息,基于该时空特征信息对神经网络进行训练得到的犯罪预测模型,可以在更细粒度的时间和空间上进行犯罪预测,提高犯罪预测的准确性。
-
公开(公告)号:CN108846422B
公开(公告)日:2021-08-31
申请号:CN201810525837.6
申请日:2018-05-28
Applicant: 中国人民公安大学
Abstract: 一种跨社交网络的账号关联方法及系统,包括获取装置:用于分别获取不同社交网络平台处的账号以及每个账号对应的多维度属性信息;计算装置用于将位于不同社交网络平台处两个账号的多维度属性信息分别进行多维度的相似性计算,并生成计算结果,计算结果为关联结果或不关联结果中的任意一个;输出装置用于将若计算结果为关联结果,则将位于不同社交网络平台处的两个账号关联;若计算结果为不关联结果,则将位于不同社交网络平台处两个账号不关联。本发明设计了基于关联同一自然人在不同社交网络平台账号的应用场景,设计了如从用户名、地理位置、个人描述和头像等维度的相似度计算的特征获取及计算方法,提高了不同社交网络平台账号关联的准确率。
-
公开(公告)号:CN108829799A
公开(公告)日:2018-11-16
申请号:CN201810571074.9
申请日:2018-06-05
Applicant: 中国人民公安大学
IPC: G06F17/30
Abstract: 一种基于改进LDA主题模型的文本相似度计算方法及系统,在WMF_LDA主题模型中获取若干文本集;通过word2vec词向量模型对预处理词语集中的词语进行相似度计算并生成若干词语相似度值;按照其词语之间相似度生成领域主题词语集;并将进行过词语语义合并的文档通过LDA主题模型得出其在不同主题上的概率分布;确定任意两个文本之间主题分布相似度得到本发明相似度。先进行筛选减少主题词语集中词语的数量,并将同义词、近义词、同领域词进行统一化映射,再通过建模获得文本的概率分布并进一步判断文本之间的相似程度,使得在计算两个文本的相似度的过程中,使得计算时维度小、减少浪费空间并且解决了过多集中于词语层面、未能充分挖掘和利用不同类型文本的问题。
-
公开(公告)号:CN110222250B
公开(公告)日:2021-07-27
申请号:CN201910411868.3
申请日:2019-05-16
Applicant: 中国人民公安大学
IPC: G06F16/951 , G06F16/9536 , G06F16/35 , G06F40/30 , G06F40/211
Abstract: 本发明提出一种面向微博的突发事件触发词识别方法,将待分析的微博数据构成预料库的预料,其包括如下步骤:1)对突发事件语料库进行原始触发词统计,记录统计特征;2)对所述语料进行分词、分句等数据预处理,对所述分句后的语料数据按照分句进行依存句法分析,整理凝练出词对间依存关系,建立模式匹配规则;3)对所述预处理后的文本数据逐一进行模式规则匹配和潜在语义分析,进一步抽取分句语义信息,选取同时满足二者条件的词作为候选触发词,得到候选触发词集;4)计算所述候选触发词集与基于扩展触发词表的触发词识别出触发词进行相似度分析,将满足相似度要求的触发词确定为微博突发事件触发词。本发明避免了传统模式识别中效率偏低的缺点,同时遵循了机器学习中模型训练快速简单的优点。
-
公开(公告)号:CN110222250A
公开(公告)日:2019-09-10
申请号:CN201910411868.3
申请日:2019-05-16
Applicant: 中国人民公安大学
IPC: G06F16/951 , G06F16/9536 , G06F16/35 , G06F17/27
Abstract: 本发明提出一种面向微博的突发事件触发词识别方法,将待分析的微博数据构成预料库的预料,其包括如下步骤:1)对突发事件语料库进行原始触发词统计,记录统计特征;2)对所述语料进行分词、分句等数据预处理,对所述分句后的语料数据按照分句进行依存句法分析,整理凝练出词对间依存关系,建立模式匹配规则;3)对所述预处理后的文本数据逐一进行模式规则匹配和潜在语义分析,进一步抽取分句语义信息,选取同时满足二者条件的词作为候选触发词,得到候选触发词集;4)计算所述候选触发词集与基于扩展触发词表的触发词识别出触发词进行相似度分析,将满足相似度要求的触发词确定为微博突发事件触发词。本发明避免了传统模式识别中效率偏低的缺点,同时遵循了机器学习中模型训练快速简单的优点。
-
公开(公告)号:CN108846422A
公开(公告)日:2018-11-20
申请号:CN201810525837.6
申请日:2018-05-28
Applicant: 中国人民公安大学
Abstract: 一种跨社交网络的账号关联方法及系统,包括获取装置:用于分别获取不同社交网络平台处的账号以及每个账号对应的多维度属性信息;计算装置用于将位于不同社交网络平台处两个账号的多维度属性信息分别进行多维度的相似性计算,并生成计算结果,计算结果为关联结果或不关联结果中的任意一个;输出装置用于将若计算结果为关联结果,则将位于不同社交网络平台处的两个账号关联;若计算结果为不关联结果,则将位于不同社交网络平台处两个账号不关联。本发明设计了基于关联同一自然人在不同社交网络平台账号的应用场景,设计了如从用户名、地理位置、个人描述和头像等维度的相似度计算的特征获取及计算方法,提高了不同社交网络平台账号关联的准确率。
-
公开(公告)号:CN110909253B
公开(公告)日:2022-08-19
申请号:CN201911039609.9
申请日:2019-10-29
Applicant: 中国人民公安大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明提出了一种基于特定用户的群体关系挖掘与分析方法,包括如下步骤:选取一定数量的具有相同特征或共同行为的用户作为特定用户;利用改进的最短路径图聚类算法去挖掘关联所述特定用户之间的关系,形成初级群体;对节点进行属性特征分析,将所述初级群体中的所述用户节点属性特征标签构造成初级群体属性比对集合;获得候选扩展用户及其属性集合,计算所述候选扩展用户的属性与所述初级群体比对集合属性间的相似度,选取相似度大于阈值的候选扩展用户加入到所述初级群体中。本发明结合群体关系结构的内聚性以及个体在特定属性子集的相似性的来挖掘群体,聚类效果良好。
-
公开(公告)号:CN110909253A
公开(公告)日:2020-03-24
申请号:CN201911039609.9
申请日:2019-10-29
Applicant: 中国人民公安大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明提出了一种基于特定用户的群体关系挖掘与分析方法,包括如下步骤:选取一定数量的具有相同特征或共同行为的用户作为特定用户;利用改进的最短路径图聚类算法去挖掘关联所述特定用户之间的关系,形成初级群体;对节点进行属性特征分析,将所述初级群体中的所述用户节点属性特征标签构造成初级群体属性比对集合;获得候选扩展用户及其属性集合,计算所述候选扩展用户的属性与所述初级群体比对集合属性间的相似度,选取相似度大于阈值的候选扩展用户加入到所述初级群体中。本发明结合群体关系结构的内聚性以及个体在特定属性子集的相似性的来挖掘群体,聚类效果良好。
-
公开(公告)号:CN107273747A
公开(公告)日:2017-10-20
申请号:CN201710365035.9
申请日:2017-05-22
Applicant: 中国人民公安大学
CPC classification number: G06F21/566 , G06F21/53 , H04L63/145
Abstract: 一种勒索软件检测的方法,所述勒索软件检测的方法分为先后顺序执行的两个部分,勒索软件的检测模型训练:首先,需要确定训练勒索软件检测模型的训练集,训练集分为2个子集:①勒索软件样本集合;②正常样本集合;利用分布式沙箱对训练集合中样本进行动态分析,提取沙箱分析后的报告;2)勒索软件的检测模型的测试;根据特征构造算法建立特征集,采用五折交叉法进行模型的训练与测试,使用准确率这样的指标衡量模型性能。有效避免了现有技术中难以检测勒索软件、对不同类型的勒索软件的特征研究不深入、检测的结果受到的干扰越严重以及构建的算法维度与复杂度高的缺陷。
-
-
-
-
-
-
-
-