-
公开(公告)号:CN114564964A
公开(公告)日:2022-05-31
申请号:CN202210172989.9
申请日:2022-02-24
Applicant: 杭州中软安人网络通信股份有限公司 , 复旦大学 , 杭州文图思锐云技术有限公司
Abstract: 本发明提供一种基于k近邻对比学习的未知意图检测方法,其特征在于,包括以下步骤:步骤S1,利用已知意图的语料构建经验风险损失;步骤S2,构建语义表示模型,采用k近邻对比学习与经验风险损失对所述语义表示模型进行训练;步骤S3,将待测文本输入至训练后的语义表示模型,以获取所述待测文本的语义表示;步骤S4,采用下游检测算法检测所述语义表示是否为未知意图,并输出为已知意图的语义表示的类别。该基于k近邻对比学习的未知意图检测方法在语义表示学习阶段和未知检测阶段都不依赖于语义分布的任何假设,而且检测精度高、设计简单且应用场景广泛,解决了现有意图检测方法在现实场景应用受限的缺陷。
-
公开(公告)号:CN112448972A
公开(公告)日:2021-03-05
申请号:CN201910811118.5
申请日:2019-08-29
Applicant: 杭州中软安人网络通信股份有限公司
Abstract: 本发明提供一种数据交换与共享平台,所述数据交换与共享平台包括数据交换子系统以及各个部门的数据交换网关,其中,每个部门都拥有自己的线下业务数据库或临时库和自己的线上租户空间,各部门作为租户将自己的公开数据放在租用空间中,在通过一系列审批授权过程后在交换空间中与其他部门数据进行数据碰撞并获取碰撞结果;所述数据交换子系统用于提供数据目录和数据交换服务;所述各个部门的数据交换网关用于进行数据转发服务,提供数据源管理、转换管理、数据传输加密、作业管理和用户数据访问API鉴权功能。本发明能够减少数据源间的数据搬运,实现数据的交换与共享。
-
公开(公告)号:CN112131463A
公开(公告)日:2020-12-25
申请号:CN202010950134.5
申请日:2020-09-10
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F16/9535 , G06F40/30 , G06K9/62
Abstract: 本发明提供了一种热点提取方法、存储介质及服务器,该热点提取方法包括:获取待提取热点的语料数据;根据语料数据对通用领域的roberta模型进行预训练,得到专业领域的roberta模型;根据专业领域的roberta模型,提取多条文本中每条文本的特征向量;根据多条文本中每条文本的特征向量,构造孪生网络的训练样本;根据训练样本,通过孪生网络的方式调节专业领域的roberta模型的参数,得到目标的roberta模型;根据目标的roberta模型,提取多条文本中每条文本的特征向量;利用聚类算法对语料数据的多条文本进行聚类,得到多个类别;根据目标的roberta模型及多个类别提取语料数据的热点。更好地捕捉到语料数据中的独有信息;减少语料数据中字的unk(unknown)的情况;提高聚类及提取热点准确性。
-
公开(公告)号:CN112448972B
公开(公告)日:2022-09-20
申请号:CN201910811118.5
申请日:2019-08-29
Applicant: 杭州中软安人网络通信股份有限公司
IPC: H04L67/567 , H04L67/1097 , H04L9/40 , H04L12/66
Abstract: 本发明提供一种数据交换与共享平台,所述数据交换与共享平台包括数据交换子系统以及各个部门的数据交换网关,其中,每个部门都拥有自己的线下业务数据库或临时库和自己的线上租户空间,各部门作为租户将自己的公开数据放在租用空间中,在通过一系列审批授权过程后在交换空间中与其他部门数据进行数据碰撞并获取碰撞结果;所述数据交换子系统用于提供数据目录和数据交换服务;所述各个部门的数据交换网关用于进行数据转发服务,提供数据源管理、转换管理、数据传输加密、作业管理和用户数据访问API鉴权功能。本发明能够减少数据源间的数据搬运,实现数据的交换与共享。
-
公开(公告)号:CN112102817A
公开(公告)日:2020-12-18
申请号:CN201910527672.0
申请日:2019-06-18
Applicant: 杭州中软安人网络通信股份有限公司
Abstract: 本发明提供一种语音识别系统。所述系统包括:前端模块,用于对来自外部应用程序的音频信号输入进行处理以便输出特征流;解码器模块,用于根据来自于所述前端模块的特征流和来自于语言专家模块的搜索图,输出结果对象的实例;语言专家模块,用于为所述解码器模块提供所需的各种层次的知识组成的搜索图。本发明能够实现基于神经网络的语音识别,提高语音识别的准确度。
-
公开(公告)号:CN112131463B
公开(公告)日:2024-12-03
申请号:CN202010950134.5
申请日:2020-09-10
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F16/9535 , G06F40/30 , G06F16/35 , G06F18/22
Abstract: 本发明提供了一种热点提取方法、存储介质及服务器,该热点提取方法包括:获取待提取热点的语料数据;根据语料数据对通用领域的roberta模型进行预训练,得到专业领域的roberta模型;根据专业领域的roberta模型,提取多条文本中每条文本的特征向量;根据多条文本中每条文本的特征向量,构造孪生网络的训练样本;根据训练样本,通过孪生网络的方式调节专业领域的roberta模型的参数,得到目标的roberta模型;根据目标的roberta模型,提取多条文本中每条文本的特征向量;利用聚类算法对语料数据的多条文本进行聚类,得到多个类别;根据目标的roberta模型及多个类别提取语料数据的热点。更好地捕捉到语料数据中的独有信息;减少语料数据中字的unk(unknown)的情况;提高聚类及提取热点准确性。
-
公开(公告)号:CN114564964B
公开(公告)日:2023-05-26
申请号:CN202210172989.9
申请日:2022-02-24
Applicant: 杭州中软安人网络通信股份有限公司 , 复旦大学 , 杭州文图思锐云技术有限公司
IPC: G06F40/30 , G06F16/35 , G06F18/2413
Abstract: 本发明提供一种基于k近邻对比学习的未知意图检测方法,其特征在于,包括以下步骤:步骤S1,利用已知意图的语料构建经验风险损失;步骤S2,构建语义表示模型,采用k近邻对比学习与经验风险损失对所述语义表示模型进行训练;步骤S3,将待测文本输入至训练后的语义表示模型,以获取所述待测文本的语义表示;步骤S4,采用下游检测算法检测所述语义表示是否为未知意图,并输出为已知意图的语义表示的类别。该基于k近邻对比学习的未知意图检测方法在语义表示学习阶段和未知检测阶段都不依赖于语义分布的任何假设,而且检测精度高、设计简单且应用场景广泛,解决了现有意图检测方法在现实场景应用受限的缺陷。
-
公开(公告)号:CN112445954A
公开(公告)日:2021-03-05
申请号:CN201910810983.8
申请日:2019-08-29
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F16/951 , G06F16/958
Abstract: 本发明提供一种自动提取网页的方法及装置,所述方法包括:根据用户输入获得URL任务列表,将所述URL任务列表保存在临界区中;根据所述临界区中的URL任务列表,按照广度搜索运算法搜索提取网页,并提取URL返回到临界区中;通过判断主题相关度算法判断所提取的网页的相关度,清除不相关网页。本发明能够从用户想要访问的互联网上自动下载用户需要的网页。
-
公开(公告)号:CN112306997A
公开(公告)日:2021-02-02
申请号:CN201910665324.X
申请日:2019-07-23
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F16/215 , G06F16/22 , G06F16/25 , G06F16/24
Abstract: 本发明提供一种数据质量管理系统。所述系统包括数据质量定义模块,用于通过对质量维度、检核类别、度量规则以及检核方法的定义和管理为检核任务调度模块提供必要的输入;检核任务调度模块,用于通过执行检核方法生成相应的检核结果问题数据文件;检核结果采集模块,用于将所述检核结果问题数据文件采集入库,并在采集过程中对检核结果数据进行汇总操作,并将明细数据和汇总数据分别存入结果明细表和汇总表;问题数据分析模块,用于对问题数据进行检索和分析,启动问题治理流程。本发明能够实现统一的数据质量检核和数据质量监控,提升管理效能和实施效率,规范质量管理流程。
-
公开(公告)号:CN110705712A
公开(公告)日:2020-01-17
申请号:CN201811581190.5
申请日:2018-12-24
Applicant: 杭州中软安人网络通信股份有限公司
Abstract: 本发明提供一种面向第三方社会服务的人工智能基础资源与技术开放平台,包括:基础设施层,提供网络与超大规模计算集群开放平台基础设施;基础数据资源层,通过对原始数据的组织和智能化标签,形成人工智能训练集、人工智能基准库和各类平台管理数据;智能分析层,通过机器学习方法,实现对语音、视频、图像、地理信息数据的识别;能力开放层,配备识别、交互、还原、分析和协作有关的智能技术基础组件;对外服务层,为需求单位和个人提供各类服务;安全体系,包含安全策略、安全评估和安全管理;运维体系,参照有关国家标准、地方标准和行业标准的有关要求,制定平台的制度规范;标准体系,参照有关国家标准和行业标准的要求制定各类标准。
-
-
-
-
-
-
-
-
-