一种基于编码和机器学习的多语种识别方法

    公开(公告)号:CN106528535A

    公开(公告)日:2017-03-22

    申请号:CN201611001398.6

    申请日:2016-11-14

    CPC classification number: G06F17/275

    Abstract: 本发明提供了一种基于编码和机器学习的多语种识别方法,是计算机对自然语言的处理技术。本方法分别通过机器学习单元和编码识别单元对文本进行语种识别,编码识别时还统计各语种的单词量,当机器学习单元的识别结果在编码识别单元的判定区间内,且二者识别的语言一致时,输出单一识别语言,当编码识别单元识别到多种语言时,进行混合语言规则判断,若第二语言在文本中的单词量比例达到设定比例,则判定文本为混合语言。本发明对长文本可先作随机采样再判定,以提高识别效率。本发明能够准确、高效地实现中文简繁体、日、法、英等99种语言的语种识别,同时支持混合语种文本识别,在海量数据分析以及舆情监控中具有广泛的应用前景。

    一种基于分布式多芯片解码的高通量视频实时分析处理方法及装置

    公开(公告)号:CN116847104A

    公开(公告)日:2023-10-03

    申请号:CN202310930006.8

    申请日:2023-07-27

    Abstract: 本发明公开了一种基于分布式多芯片解码的高通量视频实时分析处理方法及装置,涉及音视频处理技术领域。该视频实时分析处理装置包括CPU单元、解码单元和分析单元;CPU单元包括资源初始化模块、视频数据预处理模块和调度处理模块,解码单元上承载解码处理模块,分析单元承载分析处理模块。视频数据预处理模块对原始视频数据进行格式过滤,传输给调度处理模块,调度处理模块给视频数据分配固定的解码处理模块;解码处理模块对视频数据进行解码,并筛选关键帧,最后通过基于PCIE总线的视频数据直接传输技术传送给分析处理模块;分析处理模块对视频数据进行计算处理,输出最终视频分析结果。本发明有效降低了CPU的资源消耗,达到高并发高通量的效果。

    一种基于多个匹配引擎的结果加权的HTTPS流量应用分类方法

    公开(公告)号:CN112769713A

    公开(公告)日:2021-05-07

    申请号:CN202011628563.7

    申请日:2020-12-31

    Abstract: 本发明提供了一种基于多个匹配引擎的结果加权的HTTPS流量应用分类方法,属于网络数据识别处理技术领域。本发明方法构建规则文件层、识别引擎层和结果聚合和比对层,依据输入的五元组规则文件、正则规则文件、固定位置规则文件、负载长度规则文件、SNI规则文件、客户端证书规则文件和服务端证书规则文件构建相应的匹配引擎,对捕获的HTTPS流量调用各匹配引擎进行识别,根据识别结果数目计算各匹配引擎的命中概率和最终应用分类命中概率,从而获得相应的应用类别。本发明以多维度对HTTPS流量进行分类识别,对分类结果加权求和已获得最终应用分类结果,能实现对企业内网、互联网流量的HTTPS流量的精准分类的要求。

    一种基于多个匹配引擎的结果加权的HTTPS流量应用分类方法

    公开(公告)号:CN112769713B

    公开(公告)日:2021-11-09

    申请号:CN202011628563.7

    申请日:2020-12-31

    Abstract: 本发明提供了一种基于多个匹配引擎的结果加权的HTTPS流量应用分类方法,属于网络数据识别处理技术领域。本发明方法构建规则文件层、识别引擎层和结果聚合和比对层,依据输入的五元组规则文件、正则规则文件、固定位置规则文件、负载长度规则文件、SNI规则文件、客户端证书规则文件和服务端证书规则文件构建相应的匹配引擎,对捕获的HTTPS流量调用各匹配引擎进行识别,根据识别结果数目计算各匹配引擎的命中概率和最终应用分类命中概率,从而获得相应的应用类别。本发明以多维度对HTTPS流量进行分类识别,对分类结果加权求和已获得最终应用分类结果,能实现对企业内网、互联网流量的HTTPS流量的精准分类的要求。

Patent Agency Ranking