一种基于机器学习的文本数据检测方法、装置和设备

    公开(公告)号:CN113761523B

    公开(公告)日:2025-02-18

    申请号:CN202111025439.6

    申请日:2021-09-02

    Abstract: 本发明公开了一种基于机器学习的文本数据检测方法、装置和设备。一种基于机器学习的文本数据检测方法,包括:对用于训练的文本数据进行特征提取;基于特征提取结果训练检测算法模型;基于特征提取结果和检测算法模型训练解释算法模型;基于训练得到的检测算法模型对待检测的文本数据进行检测,得到检测结果;基于训练得到的解释算法模型对待检测的文本数据进行解释,得到解释结果;对所述检测结果和解释结果进行汇总输出。本实施例的技术方案,解决了文本数据的检测内容容易被攻击者绕过,且难以自动扩展检测范围,需要维护大量规则的问题,达到了精确地对文本数据进行检测,并且可以对检测结果进行解释说明的效果。

    一种应用程序识别方法、装置、电子设备及存储介质

    公开(公告)号:CN114637684B

    公开(公告)日:2025-02-11

    申请号:CN202210302251.X

    申请日:2022-03-24

    Abstract: 本发明实施例公开了一种应用程序识别方法、装置、电子设备及存储介质。该方法包括:获取待识别应用程序的下载链接数据,并确定下载链接数据对应的下载链接IP数据;根据下载链接IP数据提取下载链接数据的IP数据特征;在确定IP数据特征未包括在IP备案白名单数据库中,且未包括在IP黑名单数据库中的情况下,根据下载链接数据确定待识别应用程序的应用程序安装包数据;根据应用程序安装包数据提取待识别应用程序的静态特征,并在确定待识别应用程序的静态特征满足异常静态特征库比对条件的情况下,确定待识别应用程序为异常应用程序。本发明实施例的技术方案能够快速且准确的识别异常应用程序,提高异常应用程序的识别效率和识别准确率。

    异常短信的检测方法、装置、计算机设备及存储介质

    公开(公告)号:CN115146619B

    公开(公告)日:2024-10-01

    申请号:CN202210518148.9

    申请日:2022-05-12

    Abstract: 本发明公开了一种异常短信的检测方法、装置、计算机设备及存储介质。所述方法包括:获取待测短信,并提取所述待测短信中包括的多项短信描述特征;其中,所述短信描述特征中包括下述至少一项:所述待测短信在至少一个文本粒度下的各粒度词语的TF‑IDF、所述待测短信的拼音特征、以及对所述待测短信中各异常项的异常标注特征;将所述多项短信描述信息,输入至预先训练的异常短信识别模型中,获取所述待测短信为异常短信的置信度;如果所述置信度大于或者等于预设的置信度门限,则将所述待测短信识别为异常短信。通过采用上述技术方案,能够提高异常短信检测的覆盖率和准确率。

    网络流量的识别方法、装置、设备及存储介质

    公开(公告)号:CN114039928B

    公开(公告)日:2024-07-02

    申请号:CN202111289011.2

    申请日:2021-11-02

    Abstract: 本发明实施例公开了一种网络流量的识别方法、装置、设备及存储介质,该方法包括:获取目标网际协议IP地址的网络流量,并对网络流量进行解析,获取对应的报文数据;当报文数据与目标状态机的起始状态检测内容成功匹配时,将目标状态机配置为起始状态,并将报文数据依次与目标状态机的各其他状态检测内容进行匹配;在预设时间阈值内,若检测到目标状态机的最终状态,则确定网络流量由目标状态机对应的目标应用产生。本发明实施例的技术方案,提出了一种利用状态机实现网络流量识别的新方式,可以实现对加密网络流量的准确识别,可以提升网络流量识别的准确度。

    多源跨平台融合的反诈预警方法、装置、设备和介质

    公开(公告)号:CN113923669B

    公开(公告)日:2024-05-17

    申请号:CN202111325958.4

    申请日:2021-11-10

    Abstract: 本发明实施例公开了一种多源跨平台融合的反诈预警方法、装置、设备和介质。该方法包括获取目标涉诈类型的目标检测短信,并识别目标检测短信的接收方号码;在预设监控时间范围内,对接收方号码所属目标用户进行电话通话和互联网访问的监测;每当到达监控时间范围内的融合子区间时,根据融合子区间内监测到的电话通话和/或互联网访问记录,形成针对目标用户的,目标涉诈类型的预警条目;将针对监控时间范围生成的各融合预警条目,发送至目标用户所在地理位置区域内的目标干预平台,以指示目标干预平台对目标用户进行反诈干预。本发明的技术方案实现有效整合各反诈平台数据资源,精准定位预警,避免重复预警导致预警置信度低的效果。

Patent Agency Ranking