一种语音情感识别系统及识别方法

    公开(公告)号:CN109243492A

    公开(公告)日:2019-01-18

    申请号:CN201811263371.3

    申请日:2018-10-28

    Abstract: 本发明公开一种语音情感识别系统,包括语音预处理模块、情感特征提取模块、情感分析模块,所述语音预处理模块的输入端接语音数据,所述语音预处理模块的输出端与所述情感特征提取模块的输入端相联接,所述情感特征提取模块的输出端与所述情感分析模块的输入端相联接,所述情感分析模块的输出端输出分析识别结果;所述语音预处理模块通过对语音数据进行处理获得语音信号,并传递到所述情感特征提取模块对所述语音信号中与情感关联紧密的声学参数进行提取,最后送入所述情感分析模块完成情感的判断。本发明还提出一种语音情感识别方法,增加了电话诈骗系统的检出手段,对于语音数据可进行多维度分析,系统的检出准确率提高了5%。

    一种大规模数据流中电信欺诈风险识别方法

    公开(公告)号:CN109274836B

    公开(公告)日:2021-06-15

    申请号:CN201811287123.2

    申请日:2018-10-31

    Abstract: 本发明公开了一种大规模数据流中电信欺诈风险识别方法,属于数据挖掘与机器学习和商务智能等领域。从呼叫记录数据库中筛选高风险被叫用户和主叫用户作为分析对象,构建欺诈被叫索引数据库,提取各个索引对应的显著特征;采用二级级联分类模型,得到每个被叫号码的攻击风险值;保留每个高风险被叫号码最近的滑动窗口异常得分的最大值,作为各自的序列风险值;构造被叫号码与主叫号码的通联关系二部图,计算每个被叫号码的通联风险值;借助逻辑回归模型,对每个被叫号码的攻击风险、序列风险和通联风险进行融合,得出每个被叫号码各自的综合风险值。本发明最终的综合风险值具有较高的稳定性和可解释性,实现较高的分类和检测效率。

    基于无监督学习的诈骗呼叫序列检测方法

    公开(公告)号:CN110059889B

    公开(公告)日:2021-05-28

    申请号:CN201910344174.2

    申请日:2019-04-26

    Abstract: 本发明提供了基于无监督学习的诈骗呼叫序列检测方法,包括:构造主叫呼叫序列和呼叫二部图;在呼叫二部图中进行随机游走过程,推断各主叫号码对应节点的低维嵌入表示向量;获取各被叫号码的唯一标识,以主叫号码对应节点的低维嵌入表示向量以及第M个被叫号码对应的唯一标识为神经网络的输入,以第M+1个被叫号码对应的唯一标识为输出,训练获得神经网络预测模型;获取待检测主叫呼叫序列中主叫号码对应节点的低维嵌入表示向量以及各被叫号码对应的唯一标识,并输入所述神经网络预测模型,若得到的预测唯一标识与实际唯一标识的误差大于设定阈值,则判断主叫号码为诈骗号码。本发明中提出的方法容易实现并行化计算,可以实现较高的检测效率。

    基于无监督学习的诈骗呼叫序列检测方法

    公开(公告)号:CN110059889A

    公开(公告)日:2019-07-26

    申请号:CN201910344174.2

    申请日:2019-04-26

    Abstract: 本发明提供了基于无监督学习的诈骗呼叫序列检测方法,包括:构造主叫呼叫序列和呼叫二部图;在呼叫二部图中进行随机游走过程,推断各主叫号码对应节点的低维嵌入表示向量;获取各被叫号码的唯一标识,以主叫号码对应节点的低维嵌入表示向量以及第M个被叫号码对应的唯一标识为神经网络的输入,以第M+1个被叫号码对应的唯一标识为输出,训练获得神经网络预测模型;获取待检测主叫呼叫序列中主叫号码对应节点的低维嵌入表示向量以及各被叫号码对应的唯一标识,并输入所述神经网络预测模型,若得到的预测唯一标识与实际唯一标识的误差大于设定阈值,则判断主叫号码为诈骗号码。本发明中提出的方法容易实现并行化计算,可以实现较高的检测效率。

    电信网络诈骗事件的剧本提取方法以及装置

    公开(公告)号:CN111858925B

    公开(公告)日:2023-08-18

    申请号:CN202010501138.5

    申请日:2020-06-04

    Abstract: 本发明公开了电信网络诈骗事件的剧本提取方法、装置、电子设备以及存储介质。该方法包括:获取已知主题类别的电信网络诈骗事件文本;对文本进行分句操作;提取文本中各单句的关键词;利用预先建立的BERT模型提取已知主题类别的电信网络诈骗事件文本中各单句的关键词向量;基于任意两个具有相邻句序的单句的关键词向量的均值向量之间的空间距离,对两个具有相邻句序的单句进行剧情阶段的划分;获取各阶段所包含的单句的关键词作为所属的主题类别下电信网络诈骗事件中各阶段的情节特征的表示。本发明实现了对于电信网络诈骗事件剧情阶段的划分,提取出有助于识别电信网络诈骗事件的特征,从而达到精准提取电信网络诈骗事件剧本的目的。

    一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法

    公开(公告)号:CN109587350A

    公开(公告)日:2019-04-05

    申请号:CN201811373658.1

    申请日:2018-11-16

    Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K-Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K-Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。

    一种大规模数据流中电信欺诈风险识别方法

    公开(公告)号:CN109274836A

    公开(公告)日:2019-01-25

    申请号:CN201811287123.2

    申请日:2018-10-31

    Abstract: 本发明公开了一种大规模数据流中电信欺诈风险识别方法,属于数据挖掘与机器学习和商务智能等领域。从呼叫记录数据库中筛选高风险被叫用户和主叫用户作为分析对象,构建欺诈被叫索引数据库,提取各个索引对应的显著特征;采用二级级联分类模型,得到每个被叫号码的攻击风险值;保留每个高风险被叫号码最近的滑动窗口异常得分的最大值,作为各自的序列风险值;构造被叫号码与主叫号码的通联关系二部图,计算每个被叫号码的通联风险值;借助逻辑回归模型,对每个被叫号码的攻击风险、序列风险和通联风险进行融合,得出每个被叫号码各自的综合风险值。本发明最终的综合风险值具有较高的稳定性和可解释性,实现较高的分类和检测效率。

    一种基于分解聚合的电信诈骗电话的分类检测方法

    公开(公告)号:CN107451192A

    公开(公告)日:2017-12-08

    申请号:CN201710508428.0

    申请日:2017-06-28

    CPC classification number: G06F17/3071 G06K9/6267

    Abstract: 本发明公开了一种基于分解聚合的电信诈骗电话的分类检测方法,属于数据挖掘、机器学习和商务智能等领域。首先对原始CDR数据进行不同正负类比例的横向划分与采样,针对某训练样本,随机抽取特定比例的特征属性用于构造基础分类器;对任一训练样本,根据基础分类器的输出结果构造分类矩阵,对各相同比例中的分类结果进行聚合,并通过最大投票法确定各类别比例下的投票结果。将各个比例分类器中的分类结果作为新的分类特征构造二级分类器,确定各正负比例的基分类器对于测试结果的权重。本发明适用于各种大数据场景下的不平衡分类,避免了不同正负类样本比例下模型精度的波动性,分类结果具有较强的稳定性和鲁棒性,可以实现较高的分类和检测效率。

    一种基于改进的主动学习技术的电信欺诈分类检测方法

    公开(公告)号:CN109492026A

    公开(公告)日:2019-03-19

    申请号:CN201811301410.4

    申请日:2018-11-02

    Abstract: 本发明公开了一种基于改进的主动学习技术的电信欺诈分类检测方法,涉及一种基于改进的主动学习技术的电信欺诈分类检测方法。抽取数量为X的数据划分训练集和测试集。从训练集中抽取样本作为初始训练集,其余为未标记样本。若当前训练集中正类与负类样本数量的比值不小于阈值e,训练有监督分类器f并构造强组合分类器F;将未标记样本逐个放入有监督分类器f中进行类别评分,得到类别评分结果,输入主动学习采样算法,得到信息量大小的评分。选取信息量最大的前D个进行标注,并加入训练集中;当前训练集样本数量大于等于X1,或者迭代次数大于等于C时结束,输出训练好的分类器f。本发明具有较强的稳定性和鲁棒性,实现较高的分类和检测效率。

Patent Agency Ranking