-
公开(公告)号:CN110059181B
公开(公告)日:2021-06-25
申请号:CN201910202727.0
申请日:2019-03-18
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明属于文本分类领域,具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置,旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括:获取待分类的第一短文本信息集合,并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合;基于规则的分类方法、有监督的神经网络分类方法,对第二短文本信息集合进行二分类后进行短文本过滤,并基于同样的分类方法进行各短文本的第一、二级分类标签,基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。
-
公开(公告)号:CN110059181A
公开(公告)日:2019-07-26
申请号:CN201910202727.0
申请日:2019-03-18
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明属于文本分类领域,具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置,旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括:获取待分类的第一短文本信息集合,并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合;基于规则的分类方法、有监督的神经网络分类方法,对第二短文本信息集合进行二分类后进行短文本过滤,并基于同样的分类方法进行各短文本的第一、二级分类标签,基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。
-
公开(公告)号:CN104850947A
公开(公告)日:2015-08-19
申请号:CN201510229723.3
申请日:2015-05-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/06
Abstract: 本发明公开了一种网格化多业务流程统一管理方法及装置,包括:基于待处理的业务建立相应的业务处理流程,并通过业务处理流程触发与多个业务系统进行信息交互,实现业务处理流程自动与外部系统交互,从而在业务流程管理中实现与多个业务系统的自动化交互操作。
-
公开(公告)号:CN117633543A
公开(公告)日:2024-03-01
申请号:CN202311359555.0
申请日:2023-10-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06F18/25 , G06F40/30 , G06F40/289 , G06F40/216
Abstract: 一种基于融合向量的短文本相似度计算方法,主要包括以下步骤:根据短文本所在的业务场景,积累相关的业务语料;基于业务语料,得到短文本所在语境的主题、各主题的主题词和主题词的权重信息,构造词汇权重关系模型;基于该模型对短文本中包含的词汇进行权重计算;利用短文本词汇的权重信息和使用word2vec生成的词汇语义信息,构造基于权重的文本语义向量;根据短文本语义向量的余弦相似度进行短文本相似度比较。该方法充分考虑了每个词对相似度贡献的区别,从基于权重的文本语义融合向量化表示的角度,定义了一种新的短文本相似度的计算方法。
-
公开(公告)号:CN105117340B
公开(公告)日:2017-12-19
申请号:CN201510546738.2
申请日:2015-08-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种用于iOS浏览器应用质量评估的URL检测方法和装置。所述URL检测方法,包括:测试脚本生成步骤:基于iSO的键盘布局信息和URL,生成测试脚本;测试步骤:根据测试脚本对iOS浏览器应用进行自动化模拟点击动作,同时进行测试,并且在测试完成后截取浏览器应用的实时画面;验证步骤:比对所述实时画面和浏览器响应失败图片,得出验证结果;结果输出步骤:输出包括验证结果的质量评估报告,有效提高了iOS浏览器应用测试的简便性和测试结果的准确度。
-
公开(公告)号:CN108305616B
公开(公告)日:2021-03-16
申请号:CN201810039421.3
申请日:2018-01-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明涉及一种基于长短时特征提取的音频场景识别方法及装置,该方法包括,对输入待识别音频信号进行预处理;对经过预处理后的所述待识别音频信号,进行短时音频特征提取,再进行长时音频特征提取,将所述待识别音频信号的所述长、短时音频特征联合,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签。本发明在常规短时特征提取的基础之上,进一步联合音频场景长时特征,可以表征复杂的音频场景信息,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签,其鲁棒性更强、区分性更好,且能够在更大程度上表征场景数据的整体特性,识别效率高、稳定性强。
-
公开(公告)号:CN105117340A
公开(公告)日:2015-12-02
申请号:CN201510546738.2
申请日:2015-08-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种用于iOS浏览器应用质量评估的URL检测方法和装置。所述URL检测方法,包括:测试脚本生成步骤:基于iSO的键盘布局信息和URL,生成测试脚本;测试步骤:根据测试脚本对iOS浏览器应用进行自动化模拟点击动作,同时进行测试,并且在测试完成后截取浏览器应用的实时画面;验证步骤:比对所述实时画面和浏览器响应失败图片,得出验证结果;结果输出步骤:输出包括验证结果的质量评估报告,有效提高了iOS浏览器应用测试的简便性和测试结果的准确度。
-
公开(公告)号:CN108305616A
公开(公告)日:2018-07-20
申请号:CN201810039421.3
申请日:2018-01-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明涉及一种基于长短时特征提取的音频场景识别方法及装置,该方法包括,对输入待识别音频信号进行预处理;对经过预处理后的所述待识别音频信号,进行短时音频特征提取,再进行长时音频特征提取,将所述待识别音频信号的所述长、短时音频特征联合,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签。本发明在常规短时特征提取的基础之上,进一步联合音频场景长时特征,可以表征复杂的音频场景信息,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签,其鲁棒性更强、区分性更好,且能够在更大程度上表征场景数据的整体特性,识别效率高、稳定性强。
-
-
-
-
-
-
-