-
公开(公告)号:CN116611433A
公开(公告)日:2023-08-18
申请号:CN202310478295.2
申请日:2023-04-28
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06Q10/0639 , G06F18/24 , G06N3/0464 , G06N20/00
Abstract: 本发明实施例涉及一种情感识别方法及系统,所述方法包括:获取目标文本对应的初始数据,所述初始数据是由所述目标文本经过预处理得到的;设定所述初始数据的细粒度规则,得到所述初始数据对应不同长度的类别文本;根据所述细粒度规则和所述类别文本,确定不同长度的所述类别文本对应的不同类别的情感识别模型;将所述类别文本输入到对应的所述情感识别模型中进行识别处理,得到所述目标文本的情感识别结果。通过对获得到初始数据按照设定的细粒度规则进行设定分类,确定情感识别模型,通过识别处理得到情感识别结果,由此,可以更加准确地表达和识别用户的情感倾向和理解用户情感,更好地支持情感分析应用,更好地支持舆情分析,实现对短文本的情感识别处理的技术效果。
-
公开(公告)号:CN119091861B
公开(公告)日:2025-05-13
申请号:CN202411149307.8
申请日:2024-08-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/183 , G10L15/26 , G10L21/0232 , G10L19/26
Abstract: 本发明涉及语音转写领域,尤其涉及基于人工智能的语音转写加速方法,包括以下步骤:(S1)获取原始语音数据,对获取的原始语音数据先预处理再增强处理,对增强后的语音数据进行特征提取,得到语音特征,基于语音特征进行语音识别,得到识别结果;(S2)根据识别结果生成初步转写文本,通过自适应动态文本优化算法对初步撰写文本进行优化,得到优化后的转写文本,同时在转写过程中通过优化加速算法优化转写效率。本发明公开的基于人工智能的语音转写加速方法,减少了背景噪声和其他干扰,提高了最终撰写文本的准确性和速度。
-
公开(公告)号:CN119559964A
公开(公告)日:2025-03-04
申请号:CN202310496296.X
申请日:2023-05-05
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本申请提供了一种伪造语音检测方法,包括:训练阶段,训练阶段包括:采集用于训练第一语音信号;确定第一语音信号中的静音帧和语音帧;对第一语音信号的静音帧进行零值掩蔽;获取掩蔽后的第一语音信号的特征;将特征输入伪造语音检测模型进行训练,得到训练好的伪造语音检测模型;推理阶段,推理阶段包括:采集目标语音,获取目标语音的特征;对所述目标语音进行零值掩蔽,获取掩蔽后的所述目标语音的特征;将目标语音的特征输入训练好伪造语音检测模型,输出目标语音的检测结果,检测结果包括目标语音为伪造语音或目标语音为真语音。
-
公开(公告)号:CN119249308A
公开(公告)日:2025-01-03
申请号:CN202411100861.7
申请日:2024-08-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2433 , G06F18/10 , G06F18/214 , G06Q10/047 , G06N3/0895 , G06N3/09 , G01C21/20
Abstract: 本发明设计了一种基于多维度历史行为轨迹数据的用户位置预测方法,涉及时空数据挖掘技术领域。本方法该方法首先从用户使用基于位置的APP历史行为日志中读取用户的位置信息、网络行为信息和社交关系信息,针对其数据特点对其预处理并获得数据集;设计了轨迹剪切、轨迹遮蔽、停留点简化、停留点位置偏移、行为变换、行为遮盖这6种数据增强方法,之后通过一种自监督对比学习训练模型完成训练,从而更全面的提取用户行为特征,从在此基础上实现用户位置预测。本发明方法充分利用了位置信息、网络行为信息和社交关系信息多种维度特征,提升了模型的预测精度。
-
公开(公告)号:CN119249307A
公开(公告)日:2025-01-03
申请号:CN202411100860.2
申请日:2024-08-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2433 , G06F18/10 , G06Q10/047 , G01C21/20
Abstract: 本发明设计了一种基于时空网格化编码挖掘热点区域和热点路线的方法,以跑步APP为例,通过分析跑步APP内的用户运动记录数据,来挖掘并推荐城市内的热点运动地区和热点跑步路线。该方法首先对用户运动记录数据进行预处理和层次化数据处理,以准确还原用户的真实运动轨迹。采用一种时空网格化编码方法,以对用户轨迹数据进行高效压缩和表示。最后,利用数据分析算法处理时空网格化编码,实现对城市内热点运动地区和热门跑步路线的挖掘,从而提升跑步爱好者的使用体验。本发明通过综合考虑静态地理信息和动态环境因素,为跑步爱好者提供既安全又舒适的运动地区和跑步路线推荐,具有广阔的应用前景。
-
公开(公告)号:CN119091861A
公开(公告)日:2024-12-06
申请号:CN202411149307.8
申请日:2024-08-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/183 , G10L15/26 , G10L21/0232 , G10L19/26
Abstract: 本发明涉及语音转写领域,尤其涉及基于人工智能的语音转写加速方法,包括以下步骤:(S1)获取原始语音数据,对获取的原始语音数据先预处理再增强处理,对增强后的语音数据进行特征提取,得到语音特征,基于语音特征进行语音识别,得到识别结果;(S2)根据识别结果生成初步转写文本,通过自适应动态文本优化算法对初步撰写文本进行优化,得到优化后的转写文本,同时在转写过程中通过优化加速算法优化转写效率。本发明公开的基于人工智能的语音转写加速方法,减少了背景噪声和其他干扰,提高了最终撰写文本的准确性和速度。
-
公开(公告)号:CN119046775A
公开(公告)日:2024-11-29
申请号:CN202411131128.1
申请日:2024-08-17
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2411 , G06F18/213 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及信息技术领域,具体公开了一种基于图神经网络的异常用户分类方法,包括:S1、数据预处理与图构建,S2、节点表示分解,S3、生成基于同配度矩阵的伪标签,S4、信号聚合,S5、模型设计,S6、损失函数设计和S7、节点分类方法;本发明使用Weisfeiler‑Lehman同构测试和同配度矩阵的伪标签生成方法,能够有效地减少训练时间和计算资源,高效的信号聚合方法也使得推理过程更加快速;通过分解节点表示和伪标签生成的方法,使得模型在做出决策时更加透明,可以理解模型是如何利用同配性和异配性信息进行判断的,从而增加了模型的可解释性和精度。
-
公开(公告)号:CN118349883A
公开(公告)日:2024-07-16
申请号:CN202410345245.1
申请日:2024-03-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/241 , G06F18/214 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06F21/60
Abstract: 本申请提供一种重要数据的识别方法、装置和电子设备,涉及数据处理技术领域和人工智能技术领域。该方法包括:在识别重要数据时,可以先获取待识别数据集,待识别数据集中包括多个数据和各数据的重要度指标;针对各数据,将数据和数据的重要度指标输入至预设的重要数据识别模型中,得到数据对应的重要度得分;再基于各数据对应的重要度得分,从多个数据中识别重要数据,这样基于重要数据识别模型识别重要数据,与现有技术中基于预设重要度规则识别重要数据相比,不仅可以有效地提高重要数据的识别效率,而且提高了识别结果的准确度。
-
公开(公告)号:CN117312864A
公开(公告)日:2023-12-29
申请号:CN202311618449.X
申请日:2023-11-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/214 , G06F18/10 , G06F18/25 , G06F40/284 , G06N3/08 , G06N3/0455 , G06N3/0475
Abstract: 本发明提供一种基于多模态信息的变形词生成模型的训练方法及装置,涉及语言生成技术领域,方法包括:获取变形词语料库,变形词语料库包括的不同初始样本由多模态信息组成;对变形词语料库中不同初始样本的不同类型的语料信息,采用对应类型的预处理方式分别进行预处理,生成大规模语料库;大规模语料库中每个语料样本包括多个语料信息的权重及特征向量,不同的语料信息的权重用于表征不同的语料信息在对应样本中不同的贡献程度;基于大规模语料库中预设数量的语料样本包括的多个语料信息的权重及特征向量,对初始模型进行训练,得到基于多模态信息的变形词生成模型。本发明能够提高变形词生成的精度和准确率。
-
公开(公告)号:CN116561512A
公开(公告)日:2023-08-08
申请号:CN202310431305.7
申请日:2023-04-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/10 , G06F18/27 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
Abstract: 本发明提出了一种基于COX回归的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;基于COX回归算法,利用当前数据信息,构建COX回归识别模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的COX回归识别模型,对再次获取的表征一主题的数据信息进行识别处理。本发明可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
-
-
-
-
-
-
-
-