电信网络诈骗事件的剧本提取方法以及装置

    公开(公告)号:CN111858925B

    公开(公告)日:2023-08-18

    申请号:CN202010501138.5

    申请日:2020-06-04

    Abstract: 本发明公开了电信网络诈骗事件的剧本提取方法、装置、电子设备以及存储介质。该方法包括:获取已知主题类别的电信网络诈骗事件文本;对文本进行分句操作;提取文本中各单句的关键词;利用预先建立的BERT模型提取已知主题类别的电信网络诈骗事件文本中各单句的关键词向量;基于任意两个具有相邻句序的单句的关键词向量的均值向量之间的空间距离,对两个具有相邻句序的单句进行剧情阶段的划分;获取各阶段所包含的单句的关键词作为所属的主题类别下电信网络诈骗事件中各阶段的情节特征的表示。本发明实现了对于电信网络诈骗事件剧情阶段的划分,提取出有助于识别电信网络诈骗事件的特征,从而达到精准提取电信网络诈骗事件剧本的目的。

    一种VoIP网络流量所属平台的识别方法

    公开(公告)号:CN111641599B

    公开(公告)日:2022-04-15

    申请号:CN202010394712.1

    申请日:2020-05-11

    Abstract: 一种VoIP网络流量所属平台的识别方法,包括:根据流量特征从流量数据中过滤出VoIP流量,并根据五元组信息对VoIP流量进行拆分,生成新的流量文件;识别每个流量文件中的上下行流量,提取和计算上行、下行、合并流量的特征指标,并构成每个流量文件的特征向量;使用随机森林模型进行建模,构建VoIP平台识别模型,输入是由多个流量文件的特征向量构成的特征向量矩阵,输出是多个流量文件分别对应的VoIP平台标签;将待识别的多个流量文件的特征向量构成的特征向量矩阵输入至VoIP平台识别模型,并获得每个待识别的流量文件分别对应的VoIP平台标签。本发明属于信息技术领域,能有效识别加密后的VoIP流量及其平台归属。

    分类精度评价方法、装置、计算机设备和存储介质

    公开(公告)号:CN113052270A

    公开(公告)日:2021-06-29

    申请号:CN202110503779.9

    申请日:2021-05-10

    Abstract: 本申请涉及一种分类精度评价方法、装置、计算机设备和存储介质。所述方法包括:获取有害语音样本集;将有害语音样本集中的每个有害语音样本输入待评价的有害语音分类模型中进行分类,得到预测类别标签;在预设的分类层级中,确定与预测类别标签和有害语音样本的样本类别标签对应的目标分类;根据目标分类计算待评价的有害语音分类模型的分类精确程度。本方案中,对有害语音样本进行了多层次的分类(即分类层级),然后在分类层级中确定预测类别标签和样本类别标签共同所属的目标分类,目标分类可以反映预测类别标签和样本类别标签的匹配度,进而根据目标分类确定分类模型的分类精确程度,能够有效的提高分类模型评价的准确度。

    电信网络诈骗事件的剧本提取方法以及装置

    公开(公告)号:CN111858925A

    公开(公告)日:2020-10-30

    申请号:CN202010501138.5

    申请日:2020-06-04

    Abstract: 本发明公开了电信网络诈骗事件的剧本提取方法、装置、电子设备以及存储介质。该方法包括:获取已知主题类别的电信网络诈骗事件文本;对文本进行分句操作;提取文本中各单句的关键词;利用预先建立的BERT模型提取已知主题类别的电信网络诈骗事件文本中各单句的关键词向量;基于任意两个具有相邻句序的单句的关键词向量的均值向量之间的空间距离,对两个具有相邻句序的单句进行剧情阶段的划分;获取各阶段所包含的单句的关键词作为所属的主题类别下电信网络诈骗事件中各阶段的情节特征的表示。本发明实现了对于电信网络诈骗事件剧情阶段的划分,提取出有助于识别电信网络诈骗事件的特征,从而达到精准提取电信网络诈骗事件剧本的目的。

Patent Agency Ranking