Telegram系列应用数据解析方法、终端设备及存储介质

    公开(公告)号:CN114443568B

    公开(公告)日:2024-11-19

    申请号:CN202111577850.4

    申请日:2021-12-22

    Abstract: 本发明涉及Telegram系列应用数据解析方法、终端设备及存储介质,该方法中包括:S1:判断待解析应用的数据包的包名中是否包含表征Telegram应用特征的关键字段,如果包含,进入S3;否则,进入S2;S2:判断包名目录下的子目录中是否包含Telegram应用的特征文件,如果包含,进入S3;否则,结束;S3:将待解析应用包含的不符合Telegram标准的包名和特征文件按照Telegram标准进行映射;S4:将待解析应用的附件目录按照Telegram标准进行映射;S5:基于应用映射后的包名、附件目录和特征文件,按照Telegram应用的解析方法对待解析应用进行解析。本发明可以很方便实现目标应用的快速分析,提高各个平台的数据解析能力。

    一种中文词向量压缩方法、系统和存储介质

    公开(公告)号:CN114970456B

    公开(公告)日:2024-09-24

    申请号:CN202210582102.3

    申请日:2022-05-26

    Abstract: 本发明提出一种端到端的大规模中文词向量压缩方法,包括:S1,根据原始的词向量的词性分布,构建词性到编码长度的映射表;S2,对原始的词向量特征进行压缩生成压缩编码,通过所述压缩编码和编码书重构词向量,获得重构的词向量特征,其中编码书为压缩编码矩阵。上述方案利用中文词性保留了语义信息,属于同一词性的压缩编码共用同一本码书,实现相同词性间的语义信息共享,保持模型语义分析性能的同时进一步缩减了大规模词表的压缩编码,提高模型的压缩率,实现了对大规模中文词向量模型的有效压缩。本发明还提出了对应的中文词向量压缩系统和存储介质。

    一种安卓设备USB及WiFi多通道数据提取加速的方法及系统

    公开(公告)号:CN116634604A

    公开(公告)日:2023-08-22

    申请号:CN202310555360.7

    申请日:2023-05-17

    Abstract: 本发明给出了一种一种安卓设备USB及WiFi多通道数据提取加速的方法和系统,包括:S1:使设备端与目标手机通过USB连接,所述设备端启动USB提取服务;S2:数据提取APP响应于所述设备端发起的无线热点局域网,使所述目标手机与所述设备端建立局域网连接;S3:所述设备端响应于所述数据提取APP发出的数据提取服务,向所述数据提取APP推送提取配置;S4:通过建立的USBADB和TCP/IP连接,所述设备端与所述目标手机之间建立至少2个数据通道,并通过所述数据通道并行提取数据。实现了通过USB及Wi‑Fi多通路并发对手机进行数据提取。跟USB有线提取方式相比,无新增操作,且手机数据获取能力范围与原USBADB方式无差异,同时极大提升提取效率。

    一种微博短文本情感极性识别的方法、装置及存储介质

    公开(公告)号:CN109815485B

    公开(公告)日:2023-01-24

    申请号:CN201811583268.7

    申请日:2018-12-24

    Abstract: 本发明提供了一种微博短文本情感极性识别的方法、装置及存储介质。该方法包括:抽取微博文本中的表情符号、重复标点符号和英文大写单词数量作为微博上下文情感特征tc;计算每一条微博T的先验极性特征值SenScore(t);使用深度卷积神经网络生成微博T的固定长度向量y′;基于所述微博上下文情感特征tc、先验极性特征值SenScore(t)和固定长度向量y′确定微博短文本的情感极性。本发明解决了微博向量表示维数爆炸和数据稀疏的问题,组合了不同层次的情感特征向量表示,能够更加全面和多样的描述微博文本的情感语义特征,从而提高微博短文情感极性识别的性能。

    一种文本预处理方法、装置及存储介质

    公开(公告)号:CN111090992B

    公开(公告)日:2022-12-06

    申请号:CN201911289718.6

    申请日:2019-12-13

    Abstract: 本发明公开了一种文本预处理方法和装置,通过构造特征信息表,通过特征信息表对用户自定义分词字典进行更新,通过加密算法对特征信息表和更新后的用户自定义分词字典进行加密;输入文本数据,通过特征信息表对文本数据进行匹配,保留文本数据在特征信息表中出现的特征信息,对文本数据中的非法序列信息进行删除得到新的字符串;以及对加密后的用户自定义分词字典进行解密和加载,并通过用户自定义分词字典对新的字符串进行分词。通过特征信息表可以自动更新用户自定义分词字典特征信息词频,减化人工繁琐的配置过程。对用户自定义词典进行加密,修改Jieba中字典读取加载方式,实现对加密用户自定义分词字典的读取,增强用户自定义分词字典的安全性。

Patent Agency Ranking