-
公开(公告)号:CN114297357B
公开(公告)日:2022-08-19
申请号:CN202111616638.4
申请日:2021-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F40/289 , G06F40/242 , G06N10/20
Abstract: 本申请实施例提供一种基于量子计算的问答模型构建方法、装置、电子设备及存储介质,其中,该方法包括:获取查询词汇向量集合和答案语句向量集合;根据查询词汇向量集合获得查询词汇向量集合中每个查询词汇向量的查询词汇向量密度矩阵,作为查询词汇向量密度矩阵集合;根据答案语句向量集合获得答案语句向量集合中每个答案语句向量的答案语句向量密度矩阵,作为答案语句向量密度矩阵集合;根据查询词汇向量密度矩阵集合和答案语句向量密度矩阵集合获得答案语句向量密度矩阵集合中全部答案语句向量密度矩阵的相关性分值和状态演化矩阵;根据相关性分值和状态演化矩阵构建问答模型。实施本申请实施例,提高了智能问答模型的准确率,方便使用。
-
公开(公告)号:CN114462425B
公开(公告)日:2022-08-02
申请号:CN202210380446.6
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F16/35
Abstract: 本公开涉及一种社交媒体文本处理方法、装置、设备及存储介质。本公开通过对社交媒体文本进行分词处理,得到多个词项;针对任一词项,基于该词项在不同应用场景上下文中的语义,确定该词项的词向量,由于词向量包含了该词项在不同应用场景上下文中的语义,因此,利用词向量,可以提高文本上下文特征提取能力和隐式情感的推断能力;进而,基于多个词项各自的词向量,确定社交媒体文本的全局语义向量;并基于多个词项各自的词向量和多个词项各自在社交媒体文本的权重,确定社交媒体文本的局部语义向量;基于全局语义向量和局部语义向量,确定社交媒体文本对应的情感类型,从而提高了社交媒体文本的情感类型的预测准确性。
-
公开(公告)号:CN114724218A
公开(公告)日:2022-07-08
申请号:CN202210369060.5
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种视频检测方法、装置、设备及介质。其中,视频检测方法包括:获取待检测的图像序列,图像序列包含同一视频中的至少两个视频帧;针对图像序列中的每个图像,对图像的脸部特征进行非线性变换处理,得到图像对应的脸部多个区域的注意力特征;基于各个图像对应的脸部多个区域的注意力特征,构建图像序列对应的脸部多个区域之间的时序关系特征;基于时序关系特征,计算视频为伪造脸部的视频的概率。根据本公开实施例,能够使得概率的计算结果的准确率更高、泛化能力更强,进而提高伪造脸部视频检测的精确度。
-
公开(公告)号:CN114462425A
公开(公告)日:2022-05-10
申请号:CN202210380446.6
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F16/35
Abstract: 本公开涉及一种社交媒体文本处理方法、装置、设备及存储介质。本公开通过对社交媒体文本进行分词处理,得到多个词项;针对任一词项,基于该词项在不同应用场景上下文中的语义,确定该词项的词向量,由于词向量包含了该词项在不同应用场景上下文中的语义,因此,利用词向量,可以提高文本上下文特征提取能力和隐式情感的推断能力;进而,基于多个词项各自的词向量,确定社交媒体文本的全局语义向量;并基于多个词项各自的词向量和多个词项各自在社交媒体文本的权重,确定社交媒体文本的局部语义向量;基于全局语义向量和局部语义向量,确定社交媒体文本对应的情感类型,从而提高了社交媒体文本的情感类型的预测准确性。
-
公开(公告)号:CN114461953A
公开(公告)日:2022-05-10
申请号:CN202011243214.3
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
IPC: G06F16/958 , G06F16/955
Abstract: 本发明实施例涉及一种网站监管方法、装置、电子设备及存储介质,包括:从目标网站的网页源码中提取重定向统一资源定位符URL;获取所述重定向URL所指向的网页;将所述重定向URL进行向量化表示得到第一向量,以及将所述网页进行向量化表示得到第二向量;根据所述第一向量和所述第二向量确定所述目标网站是否为违法违规网站。由此,可以实现在网站内嵌的情况下也能够有效地识别出违法违规网站,提升了违法违规网站识别的准确率。
-
公开(公告)号:CN114218381A
公开(公告)日:2022-03-22
申请号:CN202111493451.X
申请日:2021-12-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种立场识别方法、装置、设备及介质。其中,立场识别方法包括:获取待识别的目标文本;对目标文本进行语义识别处理,得到目标文本的整体语义向量;基于预先定义的话题分类模板,对目标文本进行话题识别处理,得到目标文本的话题表示向量;基于整体语义向量和话题表示向量,对目标文本进行立场分类,得到目标文本对应的目标立场类别。根据本公开实施例,能够准确地识别出目标文本所涉及的话题表示向量,从而可以结合文本语义与文本话题对目标文本进行更准确的立场识别。
-
公开(公告)号:CN114139547A
公开(公告)日:2022-03-04
申请号:CN202111416144.1
申请日:2021-11-25
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/295
Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中,知识融合法包括:基于第一实体数据中的第一实体名,获取第一实体数据对应的实体的至少一个实体别称,得到实体名称集;基于实体名称集,检测第一实体名和第二实体数据中的第二实体名是否匹配;在检测到第一实体名和第二实体名匹配时,将第一实体数据和第二实体数据进行融合,得到融合实体数据。根据本公开实施例,能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合,以减少计算量,提高融合效率,并且在两条实体数据中的实体名不匹配时,能够根据该两条实体数据的多维度相似度进行融合判别,以提高判别精度,进而实现多来源知识的融合,达到精准有效融合效果。
-
公开(公告)号:CN113971770A
公开(公告)日:2022-01-25
申请号:CN202010648949.8
申请日:2020-07-07
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。
-
公开(公告)号:CN113379169B
公开(公告)日:2021-11-23
申请号:CN202110924546.6
申请日:2021-08-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本公开涉及一种信息处理方法、装置、设备及介质。其中,信息处理方法包括:获取目标社会实体的目标社会实体信息;从目标社会实体信息中提取目标社会实体的与登记注册相关的目标特征向量;将目标特征向量输入预先训练好的梯度提升树模型,得到预先训练好的梯度提升树模型输出的目标社会实体的预测信用评分;若目标社会实体的预测信用评分符合预设的空壳实体检测条件,则确定目标社会实体为空壳实体。根据本公开实施例,能够提高对目标社会实体进行空壳实体检测的准确性,以满足税务稽查、风控预警等部门的实际业务需求。
-
公开(公告)号:CN113505221A
公开(公告)日:2021-10-15
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
-
-
-
-
-
-
-
-