-
公开(公告)号:CN112149386B
公开(公告)日:2025-02-11
申请号:CN202011028849.1
申请日:2020-09-25
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F40/117 , G06F18/214 , G06F16/35 , G06F40/284 , G06F40/151
Abstract: 本发明提供了一种事件抽取方法、存储介质及服务器,该事件抽取方法包括:获取待抽取的文本语料;对通用领域的roberta模型进行预训练,得到专业领域的roberta模型;对文本语料中的每条文本进行人工标注;将专业领域的roberta模型、触发词识别模块、事件类型识别模块及事件论元识别模块组成一个事件抽取模型;根据经过人工标注的文本语料对事件抽取模型进行监督训练;将文本语料中的每条文本输入事件抽取模型,由事件抽取模型提取每条文本中的事件触发词、每个事件触发词对应的事件论元及每条文本的事件类型;整合所得到的事件触发词、每个事件触发词对应的事件论元及每条文本的事件类型,得到事件抽取结果。提升事件抽取模型提取事件的精度和效率。
-
公开(公告)号:CN117349421A
公开(公告)日:2024-01-05
申请号:CN202311410566.7
申请日:2023-10-25
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F16/332 , G06F16/335 , G06N5/04 , G06N20/00
Abstract: 本发明实施例公开了一种基于多算法组合的问答方法、系统、电子设备及存储介质,该方法包括:选取若干机器学习模型算法,并对若干机器学习模型算法进行训练,得到对应的若干问答逻辑模型;选取若干问答逻辑模型中的其中一种作为主算法,将其他若干问答逻辑模型作为辅助算法;将目标问题输入主算法,得到多个答案,选取多个答案中置信度最高的一个作为目标答案;基于目标问题确定目标答案在辅助算法中的置信度;计算目标答案的置信度评分;根据置信度评分确定推送的最终答案。本发明实施例通过各多种算法的比较推荐,提升了推荐置信度,并对一些算法异常推送进行规避,使用多种算法模型的并行匹配机制,可择优选择,大大提升了答复的准确度。
-
公开(公告)号:CN112446029B
公开(公告)日:2024-11-22
申请号:CN201910811116.6
申请日:2019-08-29
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F21/57
Abstract: 本发明提供一种可信计算平台,包括可信芯片、可信操作系统、可信软件基和可信管理中心,所述可信芯片用于存储支撑可信度量、可信存储、可信报告的密钥和关键信息;所述可信软件基用于利用所述可信芯片的特性,为应用和系统软件的运行建立可信的计算和互联环境,并将可信计算功能的接口提供给应用和操作系统使用;所述可信操作系统用于通过调用所述可信软件基提供的可信支撑接口,实现对自身功能的可信增强;所述可信管理中心用于对系统内各计算节点的统一管理和可信互联进行控制,以及进行策略统一制定下发、资源统一管理和审计信息统一收集分析。本发明能够建立基于可信计算的主动防御安全防护体系,从源头上解决信息系统所面临的安全风险。
-
公开(公告)号:CN113961669A
公开(公告)日:2022-01-21
申请号:CN202111251502.8
申请日:2021-10-26
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本发明提供了一种预训练语言模型的训练方法、存储介质及服务器,该训练方法通过利用特定场景的文本语料对通用领域的语言模型进行预训练,所得到的专业领域的预训练语言模型可以更好地捕捉到特定场景下文本语料中的独有信息。通过分词工具分词,使得整体的词语作为是否被遮蔽的目标,能够加大语言模型的训练难度,提升语言模型的语义理解能力,进而提升经过训练所获得的预训练语言模型的准确性。增加的每条文本的类别标签信息也富有丰富的语义信息,通过加入类别标签信息,能够更好的让预训练语言模型理解整体的语言效果。改善采用预训练语言模型处理下游的自然语言处理任务过程中的准确性及效率。
-
公开(公告)号:CN111353353A
公开(公告)日:2020-06-30
申请号:CN201811582007.3
申请日:2018-12-24
Applicant: 杭州中软安人网络通信股份有限公司
Abstract: 本发明提供一种跨姿态的人脸识别方法及装置。所述方法包括:通过对不同姿态图像之间的映射关系或公共特征表示建模,进行姿态鲁棒的特征提取;利用3D模型或者2D学习的方式生成非正面人脸图像的虚拟正面人脸图像。本发明能够提高人脸识别率。
-
公开(公告)号:CN110705712A
公开(公告)日:2020-01-17
申请号:CN201811581190.5
申请日:2018-12-24
Applicant: 杭州中软安人网络通信股份有限公司
Abstract: 本发明提供一种面向第三方社会服务的人工智能基础资源与技术开放平台,包括:基础设施层,提供网络与超大规模计算集群开放平台基础设施;基础数据资源层,通过对原始数据的组织和智能化标签,形成人工智能训练集、人工智能基准库和各类平台管理数据;智能分析层,通过机器学习方法,实现对语音、视频、图像、地理信息数据的识别;能力开放层,配备识别、交互、还原、分析和协作有关的智能技术基础组件;对外服务层,为需求单位和个人提供各类服务;安全体系,包含安全策略、安全评估和安全管理;运维体系,参照有关国家标准、地方标准和行业标准的有关要求,制定平台的制度规范;标准体系,参照有关国家标准和行业标准的要求制定各类标准。
-
公开(公告)号:CN119623484A
公开(公告)日:2025-03-14
申请号:CN202510148148.8
申请日:2025-02-11
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F40/35 , G06F40/151 , G06N3/0464 , G06N3/0455 , G06N3/08 , G06F18/213 , G06F18/25
Abstract: 本发明公开一种基于大模型的客服平台情感分析方法,涉及语言智能数据处理技术领域,其技术方案要点是:使用svm模型和Transformer模型结合形成svm‑transformer模型作为基础的情感分析模型进行分析,并使用带有标签的情感数据集对svm‑transformer模型进行微调训练,从而提高模型的准确性,通过交叉验证等方法对模型的性能进行评估,确保模型能够在新的数据上保持良好的泛化能力,本发明能够更准确地识别用户当前的情感状态,如满意或者不满意,避免传统方法中检测效率低、成本高、准确性差、难以监督等问题,进而为客服平台提供更精准的内容推荐、用户行为分析等功能。
-
公开(公告)号:CN114564964A
公开(公告)日:2022-05-31
申请号:CN202210172989.9
申请日:2022-02-24
Applicant: 杭州中软安人网络通信股份有限公司 , 复旦大学 , 杭州文图思锐云技术有限公司
Abstract: 本发明提供一种基于k近邻对比学习的未知意图检测方法,其特征在于,包括以下步骤:步骤S1,利用已知意图的语料构建经验风险损失;步骤S2,构建语义表示模型,采用k近邻对比学习与经验风险损失对所述语义表示模型进行训练;步骤S3,将待测文本输入至训练后的语义表示模型,以获取所述待测文本的语义表示;步骤S4,采用下游检测算法检测所述语义表示是否为未知意图,并输出为已知意图的语义表示的类别。该基于k近邻对比学习的未知意图检测方法在语义表示学习阶段和未知检测阶段都不依赖于语义分布的任何假设,而且检测精度高、设计简单且应用场景广泛,解决了现有意图检测方法在现实场景应用受限的缺陷。
-
公开(公告)号:CN112446029A
公开(公告)日:2021-03-05
申请号:CN201910811116.6
申请日:2019-08-29
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F21/57
Abstract: 本发明提供一种可信计算平台,包括可信芯片、可信操作系统、可信软件基和可信管理中心,所述可信芯片用于存储支撑可信度量、可信存储、可信报告的密钥和关键信息;所述可信软件基用于利用所述可信芯片的特性,为应用和系统软件的运行建立可信的计算和互联环境,并将可信计算功能的接口提供给应用和操作系统使用;所述可信操作系统用于通过调用所述可信软件基提供的可信支撑接口,实现对自身功能的可信增强;所述可信管理中心用于对系统内各计算节点的统一管理和可信互联进行控制,以及进行策略统一制定下发、资源统一管理和审计信息统一收集分析。本发明能够建立基于可信计算的主动防御安全防护体系,从源头上解决信息系统所面临的安全风险。
-
公开(公告)号:CN112131463A
公开(公告)日:2020-12-25
申请号:CN202010950134.5
申请日:2020-09-10
Applicant: 杭州中软安人网络通信股份有限公司
IPC: G06F16/9535 , G06F40/30 , G06K9/62
Abstract: 本发明提供了一种热点提取方法、存储介质及服务器,该热点提取方法包括:获取待提取热点的语料数据;根据语料数据对通用领域的roberta模型进行预训练,得到专业领域的roberta模型;根据专业领域的roberta模型,提取多条文本中每条文本的特征向量;根据多条文本中每条文本的特征向量,构造孪生网络的训练样本;根据训练样本,通过孪生网络的方式调节专业领域的roberta模型的参数,得到目标的roberta模型;根据目标的roberta模型,提取多条文本中每条文本的特征向量;利用聚类算法对语料数据的多条文本进行聚类,得到多个类别;根据目标的roberta模型及多个类别提取语料数据的热点。更好地捕捉到语料数据中的独有信息;减少语料数据中字的unk(unknown)的情况;提高聚类及提取热点准确性。
-
-
-
-
-
-
-
-
-