-
公开(公告)号:CN114880496A
公开(公告)日:2022-08-09
申请号:CN202210471183.X
申请日:2022-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/432 , G06F16/435 , G06F16/483 , G06F40/279 , G06F40/30 , G06V40/16 , G06V20/40 , G06V20/62 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06N7/00 , G10L15/22
Abstract: 本公开涉及一种多媒体信息话题分析方法、装置、设备及计算机可读存储介质,本公开通过音频数据得到语音识别文本、通过视频数据的关键帧得到字幕文本;针对上述语音识别文本及字幕文本从实体、关键词、语义标签三方面提取话题信息,实现了基于文本数据的全方面、多粒度的文本话题提取;针对视频数据的关键帧,从人脸标签及图片标签两方面提取话题信息,实现了基于图像数据的视觉话题提取;本公开实施例充分考虑了视频数据的多模态特征,全面的分析视频话题,提高了话题分析的准确性;进一步的,通过准确的话题分析,可以使受众快速有效的获取视频的主要信息,提升了工作效率,并可以广泛应用于视频个性化推荐、视频内容检索等场景。
-
公开(公告)号:CN112613324B
公开(公告)日:2024-11-12
申请号:CN202011596697.5
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
Abstract: 本申请涉及一种语义情绪识别方法、装置、设备及存储介质,所述方法包括:获取待识别文本,然后对待识别文本的全局语义信息进行提取,得到第一语义向量,再利用预训练的词向量模型确定待识别文本的词向量矩阵,之后根据词向量矩阵确定第二语义向量,根据词向量矩阵计算待识别文本中每个词的词向量与预设情绪词语的词向量的相似度,并将计算得到的所有相似度确定为第三语义向量,最后根据第一语义向量、第二语义向量和第三语义向量确定待识别文本所属的情绪类别,如此,便可以根据待识别文本的全局语义信息以及待识别文本的词向量矩阵确定待识别文本的情绪类别,考虑了待识别文本的词语义、词组语义以及句子语义信息,提高了情绪识别的准确性。
-
公开(公告)号:CN112329470B
公开(公告)日:2024-05-28
申请号:CN202011241374.4
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
IPC: G06F40/295 , G06F40/226 , G06N3/08
Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。
-
公开(公告)号:CN114461953A
公开(公告)日:2022-05-10
申请号:CN202011243214.3
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
IPC: G06F16/958 , G06F16/955
Abstract: 本发明实施例涉及一种网站监管方法、装置、电子设备及存储介质,包括:从目标网站的网页源码中提取重定向统一资源定位符URL;获取所述重定向URL所指向的网页;将所述重定向URL进行向量化表示得到第一向量,以及将所述网页进行向量化表示得到第二向量;根据所述第一向量和所述第二向量确定所述目标网站是否为违法违规网站。由此,可以实现在网站内嵌的情况下也能够有效地识别出违法违规网站,提升了违法违规网站识别的准确率。
-
公开(公告)号:CN112364641B
公开(公告)日:2024-10-22
申请号:CN202011259475.4
申请日:2020-11-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
IPC: G06F40/284 , G06F40/166
Abstract: 本申请涉及一种面向文本审核的中文对抗样本生成方法及装置,其中方法包括:获取待处理语句信息;对待处理语句信息进行分词,得到多个词语;确定词语的第一重要性信息;获取各个词语对应的扰动词语;根据第一重要性信息,依次得到将待处理语句信息中各个词语替换为对应的扰动词语后的扰动语句信息;在确定扰动语句信息满足预设条件时,根据扰动语句信息得到对待处理语句信息攻击成功后的对抗样本。通过本实施例中的方法可以实现对待处理语句进行词语替换的方式得到对抗样本,进而可以增加用于对预测模型进行训练的样本的多样性,同时可以通过自动生成对抗样本,提升训练数据获取的便利性,提升模型训练的效率。
-
公开(公告)号:CN112685204B
公开(公告)日:2024-03-05
申请号:CN202011593204.2
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本申请涉及一种基于异常检测的社交机器人检测方法及装置,其中方法包括:在目标数据源中,筛选得到满足预设数量要求,且对应于目标类别的待检测信息;通过确定发布各个所述待检测信息的账户,得到每个所述账户对应的待检测信息集;根据所述待检测信息集,确定所述账户对应的行为特征信息;采用预设异常检测算法对所述行为特征信息进行异常检测,确定所有行为特征信息中的异常行为特征信息;基于异常行为特征信息确定所有账户中的社交机器人账户。通过本实施例中的方法,只依赖于筛选得到的待检测信息即可快速确定社交机器人账户,相对于人工筛选,可以有效提高处理效率以及准确率。
-
公开(公告)号:CN114692601A
公开(公告)日:2022-07-01
申请号:CN202011572938.2
申请日:2020-12-25
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
IPC: G06F40/211 , G06F40/279 , G06F16/31 , G06F16/33 , G06F16/35
Abstract: 本发明实施例涉及一种信息抽取方法、装置、电子设备及存储介质,包括:利用预设规则从至少一个信息通道中获取目标事件的相关文本;对所述相关文本进行分割,得到多个句子;对每一所述句子进行句法分析,根据句法分析结果得到所述句子中的目标专家实体和目标发言指示词;根据所述目标专家实体和目标发言指示词从所述句子中抽取目标专家职称和目标专家观点。由此,可以实现从互联网的海量信息中抽取出专家对于特定事件的观点。
-
公开(公告)号:CN119849624A
公开(公告)日:2025-04-18
申请号:CN202411916261.8
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N5/04 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/0475
Abstract: 本申请涉及一种基于多模态情感的大模型对话方法、装置、设备及介质,尤其涉及自然语言处理技术领域。包括:接收用户的多模态输入,并对多模态输入进行多模态情感分析得到多模态情感表征;将多模态情感表征和当前对话上下文输入情感生成网络,得到情感生成网络输出的当前情感倾向;基于当前情感倾向对历史情感倾向进行更新,得到目标情感倾向;将目标情感倾向和当前对话上下文输入解码器,得到解码器输出的情感回复内容。本申请实施例提升了情感理解的准确性,适应于用户情感波动,能够生成连贯且一致的情感回复内容。
-
公开(公告)号:CN119848168A
公开(公告)日:2025-04-18
申请号:CN202411916262.2
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/31 , G06F16/3329 , G06F16/36 , G06F16/3332 , G06F16/334 , G06F16/901 , G06N5/022
Abstract: 本申请实施例公开了一种基于大语言模型和知识图谱的检索生成方法及装置,可解决检索语义关联性弱、召回数据缺乏全局性知识的问题。该方法包括:对预设的多个领域文档进行向量解析,构建向量数据库;根据多个领域文档中提取出的实体描述信息和关系描述信息,构建知识图谱,并将知识图谱存储到图数据库中;对用户输入的目标问题进行特征提取,得到目标问题对应的多维度关键词;通过预设搜索引擎、向量数据库以及图数据库,对多维度关键词进行检索,得到目标检索结果;根据目标检索结果,确定目标输入信息,并将目标输入信息输入到目标语言模型中,得到目标输出响应信息。
-
公开(公告)号:CN119761336A
公开(公告)日:2025-04-04
申请号:CN202411820053.8
申请日:2024-12-11
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06F40/16 , G06N5/04 , G06N3/045 , G06N3/0475 , G06F18/25
Abstract: 本发明提供了一种图表问答模型的综合评测方法、设备及介质,涉及数据处理技术领域,方法根据预设图表问答任务类型列表和目标图表类型列表,获取初始图表数据列表集合的总集,根据初始图表数据、初始图表数据对应的预设图表问答任务类型的定义文本和目标多模态大模型,获取初始图表数据对应的问题文本列表和问题文本对应的标准答案文本,根据多线程处理方式、预设配置文件和图表问答模型,并行获取问题文本对应的目标答案文本,根据问题文本对应的标准答案文本和目标答案文本,获取图表问答模型对应的人工评分和自动评分,用于评测图表问答模型,能够评估多种图表问答任务类型的情况下图表问答模型的输出结果的准确性,可以满足用户的多样化需求。
-
-
-
-
-
-
-
-
-