一种文本预处理方法、装置及存储介质

    公开(公告)号:CN111090992A

    公开(公告)日:2020-05-01

    申请号:CN201911289718.6

    申请日:2019-12-13

    Abstract: 本发明公开了一种文本预处理方法和装置,通过构造特征信息表,通过特征信息表对用户自定义分词字典进行更新,通过加密算法对特征信息表和更新后的用户自定义分词字典进行加密;输入文本数据,通过特征信息表对文本数据进行匹配,保留文本数据在特征信息表中出现的特征信息,对文本数据中的非法序列信息进行删除得到新的字符串;以及对加密后的用户自定义分词字典进行解密和加载,并通过用户自定义分词字典对新的字符串进行分词。通过特征信息表可以自动更新用户自定义分词字典特征信息词频,减化人工繁琐的配置过程。对用户自定义词典进行加密,修改Jieba中字典读取加载方式,实现对加密用户自定义分词字典的读取,增强用户自定义分词字典的安全性。

    一种文本预处理方法、装置及存储介质

    公开(公告)号:CN111090992B

    公开(公告)日:2022-12-06

    申请号:CN201911289718.6

    申请日:2019-12-13

    Abstract: 本发明公开了一种文本预处理方法和装置,通过构造特征信息表,通过特征信息表对用户自定义分词字典进行更新,通过加密算法对特征信息表和更新后的用户自定义分词字典进行加密;输入文本数据,通过特征信息表对文本数据进行匹配,保留文本数据在特征信息表中出现的特征信息,对文本数据中的非法序列信息进行删除得到新的字符串;以及对加密后的用户自定义分词字典进行解密和加载,并通过用户自定义分词字典对新的字符串进行分词。通过特征信息表可以自动更新用户自定义分词字典特征信息词频,减化人工繁琐的配置过程。对用户自定义词典进行加密,修改Jieba中字典读取加载方式,实现对加密用户自定义分词字典的读取,增强用户自定义分词字典的安全性。

    一种网页应用程序的开发及加载方法、装置、终端和介质

    公开(公告)号:CN107943478A

    公开(公告)日:2018-04-20

    申请号:CN201711227874.0

    申请日:2017-11-29

    CPC classification number: G06F8/38 G06F9/44521

    Abstract: 本发明公开了一种网页应用程序的开发及加载方法、装置、终端和介质,在该方法中,使用HTML5+CSS3+webview设计移动页面,可以节省嵌入式设备上产品流程开发所需要投入的开发时间,同时随着目前市场上设备量屏幕的差异化,可以做到更好的适配兼容。当启动应用程序时,加载根模块,并加载对应的入口程序及全局层叠样式表文件;当页面跳转的时候,加载子模块,此时才按需加载入子模块配置的各组件层叠样式表文件,因此当页面量大的时候,无需加载全部的资源文件,而是按需加载相应的子模块,节省了应用程序初次启动的初始化时间。

Patent Agency Ranking