有害短信分析方法、装置和存储介质

    公开(公告)号:CN115455977A

    公开(公告)日:2022-12-09

    申请号:CN202210926234.3

    申请日:2022-08-03

    Abstract: 本申请公开了有害短信分析方法、装置和存储介质,包括对中文语料进行预处理,获得不同的所述中文语料对应的不同序列;使用盘古模型提取每个序列的词嵌入向量;采用LSTM对所述词嵌入向量进行深层特征提取,获得每一个序列对应的文本深层语义特征;将所述文本深层语义特征经过全连接层和Softmax分类器,进行模型的训练和测试。本申请通过盘古大模型和迁移学习技术,减少所需的有标签的有害短信数据量,训练所需要的时间和计算资源也大大减少,具有更好的适应性,能在短时间内生成可靠的有害短信检测分析模型,提高了通信网有害短信的分析效率。

    多模态数据集成管理方法、装置及介质

    公开(公告)号:CN116150320A

    公开(公告)日:2023-05-23

    申请号:CN202310026624.X

    申请日:2023-01-09

    Abstract: 本发明提供一种多模态数据集成管理方法、装置及介质,该多模态数据集成管理方法包括:对接入的第一多模态数据执行临时存储;对第一多模态数据执行预处理,得到第二多模态数据;对第二多模态数据执行提取,得到包括有数据特征、数据来源及存储位置的元数据;采用对应的数据存储方式对元数据执行存储。使用可定制算法来实现文本、声音及视觉数据的统一集成,通过使用本体模型/元模型的方式统一提取文本、声音和视觉数据的元数据,并通过对象存储辅以结构化存储方式,来实现多模态的统一存储,借助元数据和对象存储技术,实现多模态数据的高可靠、高性能访问的统一管理,使得多模态数据分析效率和准确性大大提升。

    一种多模态数据的融合方法、系统及存储介质

    公开(公告)号:CN115545093A

    公开(公告)日:2022-12-30

    申请号:CN202211107885.6

    申请日:2022-09-13

    Abstract: 本发明公开了一种多模态数据的融合方法、系统及存储介质,方法包括:获取多模态原始数据;对文本数据进行分词编码操作,结合卷积神经网络提取得到预设维度的文本特征;对语音数据进行端点检测,结合语音特征提取工具包提取得到预设维度的语音特征;对视频数据进行序列化处理,结合循环神经网络提取得到预设维度的视频特征;对文本特征、语音特征和视频特征进行对齐拼接处理,得到预设通道的特征向量;根据特征向量,通过多核分类模型进行线性连接,得到多模态特征分类结果。本发明能够实现对文本、语音和视觉的多模态数据的统一特征提取和融合,从而促进从单模态数据到多模态数据的分析和应用,可广泛应用于数据处理技术领域。

    一种互联网有害网址检测分析处理方法、装置和存储介质

    公开(公告)号:CN115544494A

    公开(公告)日:2022-12-30

    申请号:CN202211190151.9

    申请日:2022-09-28

    Abstract: 本申请公开了一种互联网有害网址检测分析处理方法、装置和存储介质,其中方法包括获取网址图片和视频;对所述网址图片和视频进行细化处理,所述细化处理包括数据标准化、数据清洗、数据标注、数据分化和数据规模调整;利用视觉大模型对所述网址图片和视频进行特征提取;结合所述网址图片和视频的特征数据集训练所述视觉大模型,并调整所述视觉大模型的参数;使用CSP‑Darknet骨干模型网络对待分析网址进行特征提取并回归出目标位置;对回归到的目标图像进行类别分类,输出有害网址的图像判定结果。本申请能够实现图片与视频数据的统一特征提取,并通过CNN网络构建视觉深度模型,从而大大提升互联网有害内容准确率和适用范围。

Patent Agency Ranking