一种基于互补语料的短文本观点挖掘方法

    公开(公告)号:CN106227768B

    公开(公告)日:2019-09-03

    申请号:CN201610559782.1

    申请日:2016-07-15

    Abstract: 本发明公开了一种基于互补语料的短文本观点挖掘方法,是基于属性的观点挖掘;具体为:首先,从某段微博语料中选取训练语料,进行分词处理,词性标注和筛选;根据观点词将训练语料进行属性词的标注;并使用词性标注做为特征训练最大熵模型;然后,针对某个事件的微博语料和新闻语料,构建跨语料的话题模型,并结合最大熵模型,分析该事件所属的话题并提取相应的属性词分布和观点词分布;最后,针对某个具体共享话题的所有观点词或者某个具体独享话题中的所有观点词,利用情感分类器进行极性分析。本发明适用于对舆情事件的属性分析及观点挖掘,具有高效性、鲁棒性和易用性的特点,在观点挖掘、舆情监控等领域具有重要的应用价值。

    基于NFS的动态文件快速精准的还原处理方法

    公开(公告)号:CN113900997B

    公开(公告)日:2024-12-13

    申请号:CN202110995686.2

    申请日:2021-08-27

    Abstract: 本发明属于数据处理技术领域,且公开了基于NFS的动态文件快速精准的还原处理方法,具体操作步骤如下:第一步,将需要处理的数据集中输入到待处理数据库;第二步,随后将待处理数据库中的数据系统分配到各个分级处理程序中。本发明通过预先对文件数据进行块状化处理,随后设定对应的限定值,采用阶段式文件处理的手段,有效的规避了传统的集中处理情况,本专利实现了NFS协议基于流的文件还原流程,不需要缓存大量文件,预先还设置有多个对接设备,将庞大的数据文件一分为多,同步加快其工作效率,最终在设置对应的汇总程序,预先处理好的部分文件会被拼接在一起,最终输出则是一个完整有效的还原文件。

    一种任务驱动的海量网络日志高效筛选分发方法及装置

    公开(公告)号:CN119106014A

    公开(公告)日:2024-12-10

    申请号:CN202411006526.0

    申请日:2024-07-25

    Abstract: 本发明是有关于一种任务驱动的海量网络日志高效筛选分发方法及装置,针对超大规模网络日志数据筛选分发存在的性能瓶颈问题,提出了一种多任务高效并行筛选和分发的创新方案。该方案聚焦于网络日志数据的智能化筛选与灵活分发,旨在整合共性计算需求、消除重复运算、优化资源配置、提升任务并发处理能力。具体实施中,本发明通过分解与合并跨任务日志筛选逻辑,结合常驻实时数据筛选与周期性离线筛选任务,系统性地完成了数据的精细化按需筛选、字段富化、数据分级和历史数据预存储,从而能够根据上层业务的实际需求,为不同任务动态且精准地分发合适的数据,为网络威胁监测、流量行为分析等应用提供数据支撑。

    一种数据异常监测方法、装置、电子设备及存储介质

    公开(公告)号:CN117879969A

    公开(公告)日:2024-04-12

    申请号:CN202410168702.4

    申请日:2024-02-06

    Abstract: 本申请公开了一种数据异常监测方法、装置、电子设备及存储介质,所述方法,包括:获取当前时间周期内当前时间窗口的指定源IP与目的IP对应的网络流量日志;根据网络流量日志统计在当前时间窗口源IP向目的IP发送的流量大小值,以及源IP接收的目的IP发送的流量大小值;根据源IP向目的IP发送的流量大小值、源IP接收的目的IP发送的流量大小值、流量基线与流量告警阈值,判断源IP与目的IP之间传输的流量是否异常;若确定源IP与目的IP之间传输的流量异常,则生成源IP与目的IP在当前时间窗口对应的异常告警日志;对源IP与目的IP产生的异常告警日志进行联合分析,得到分析结果,从而,提高了对风险事件检测的准确性。

Patent Agency Ranking