-
公开(公告)号:CN116049414A
公开(公告)日:2023-05-02
申请号:CN202310346367.8
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
Abstract: 本发明提供了一种基于话题描述的文本聚类方法、电子设备和存储介质,方法包括:首先对待聚类的每个文本生成一个话题描述,然后将该话题描述输入话题描述特征生成模型,提取话题描述的特征,作为当前文本的话题描述特征,基于该特征,对文本进行聚类,相较于直接使用原始文本提取的特征进行聚类,使用生成的话题描述特征进行聚类,减少了文本内容形式多样导致的噪声干扰,提高了聚类准确性。聚类后,基于文本和话题的特征向量之间的相似度以及文本和话题的话题描述特征向量之间的相似度,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的话题描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN114265982B
公开(公告)日:2022-08-26
申请号:CN202111583634.0
申请日:2021-12-22
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/36 , G06F16/335 , G06F40/216 , G06N3/04
Abstract: 本发明涉及一种基于知识图谱的智能推荐方法,包括:A1、针对指定领域内待推荐信息的目标用户,获取目标用户的类型;A2、若目标用户的类型为活跃用户,则根据目标用户在第一预设时间段内的交互行为数据,基于知识图谱推荐内容方式和基于用户协同过滤推荐方式获取个性化的推荐结果;其中,知识图谱是预先构建的存储有指定领域内知识和实体之间关系的结构化的图谱信息;个性化的推荐结果包括:目标用户的最近邻用户对应的信息项和与目标用户的偏好实体匹配的信息项,本发明的方法可以有效解决现有推荐方法中存在的数据稀疏且关联性弱的问题,同时实现了快速精准推送文本信息,并做到千人千面的个性化推送。
-
公开(公告)号:CN114297357B
公开(公告)日:2022-08-19
申请号:CN202111616638.4
申请日:2021-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F40/289 , G06F40/242 , G06N10/20
Abstract: 本申请实施例提供一种基于量子计算的问答模型构建方法、装置、电子设备及存储介质,其中,该方法包括:获取查询词汇向量集合和答案语句向量集合;根据查询词汇向量集合获得查询词汇向量集合中每个查询词汇向量的查询词汇向量密度矩阵,作为查询词汇向量密度矩阵集合;根据答案语句向量集合获得答案语句向量集合中每个答案语句向量的答案语句向量密度矩阵,作为答案语句向量密度矩阵集合;根据查询词汇向量密度矩阵集合和答案语句向量密度矩阵集合获得答案语句向量密度矩阵集合中全部答案语句向量密度矩阵的相关性分值和状态演化矩阵;根据相关性分值和状态演化矩阵构建问答模型。实施本申请实施例,提高了智能问答模型的准确率,方便使用。
-
公开(公告)号:CN114462425B
公开(公告)日:2022-08-02
申请号:CN202210380446.6
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F16/35
Abstract: 本公开涉及一种社交媒体文本处理方法、装置、设备及存储介质。本公开通过对社交媒体文本进行分词处理,得到多个词项;针对任一词项,基于该词项在不同应用场景上下文中的语义,确定该词项的词向量,由于词向量包含了该词项在不同应用场景上下文中的语义,因此,利用词向量,可以提高文本上下文特征提取能力和隐式情感的推断能力;进而,基于多个词项各自的词向量,确定社交媒体文本的全局语义向量;并基于多个词项各自的词向量和多个词项各自在社交媒体文本的权重,确定社交媒体文本的局部语义向量;基于全局语义向量和局部语义向量,确定社交媒体文本对应的情感类型,从而提高了社交媒体文本的情感类型的预测准确性。
-
公开(公告)号:CN114724218A
公开(公告)日:2022-07-08
申请号:CN202210369060.5
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种视频检测方法、装置、设备及介质。其中,视频检测方法包括:获取待检测的图像序列,图像序列包含同一视频中的至少两个视频帧;针对图像序列中的每个图像,对图像的脸部特征进行非线性变换处理,得到图像对应的脸部多个区域的注意力特征;基于各个图像对应的脸部多个区域的注意力特征,构建图像序列对应的脸部多个区域之间的时序关系特征;基于时序关系特征,计算视频为伪造脸部的视频的概率。根据本公开实施例,能够使得概率的计算结果的准确率更高、泛化能力更强,进而提高伪造脸部视频检测的精确度。
-
公开(公告)号:CN114462425A
公开(公告)日:2022-05-10
申请号:CN202210380446.6
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F16/35
Abstract: 本公开涉及一种社交媒体文本处理方法、装置、设备及存储介质。本公开通过对社交媒体文本进行分词处理,得到多个词项;针对任一词项,基于该词项在不同应用场景上下文中的语义,确定该词项的词向量,由于词向量包含了该词项在不同应用场景上下文中的语义,因此,利用词向量,可以提高文本上下文特征提取能力和隐式情感的推断能力;进而,基于多个词项各自的词向量,确定社交媒体文本的全局语义向量;并基于多个词项各自的词向量和多个词项各自在社交媒体文本的权重,确定社交媒体文本的局部语义向量;基于全局语义向量和局部语义向量,确定社交媒体文本对应的情感类型,从而提高了社交媒体文本的情感类型的预测准确性。
-
公开(公告)号:CN114139547A
公开(公告)日:2022-03-04
申请号:CN202111416144.1
申请日:2021-11-25
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/295
Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中,知识融合法包括:基于第一实体数据中的第一实体名,获取第一实体数据对应的实体的至少一个实体别称,得到实体名称集;基于实体名称集,检测第一实体名和第二实体数据中的第二实体名是否匹配;在检测到第一实体名和第二实体名匹配时,将第一实体数据和第二实体数据进行融合,得到融合实体数据。根据本公开实施例,能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合,以减少计算量,提高融合效率,并且在两条实体数据中的实体名不匹配时,能够根据该两条实体数据的多维度相似度进行融合判别,以提高判别精度,进而实现多来源知识的融合,达到精准有效融合效果。
-
公开(公告)号:CN113971770A
公开(公告)日:2022-01-25
申请号:CN202010648949.8
申请日:2020-07-07
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。
-
公开(公告)号:CN113379169B
公开(公告)日:2021-11-23
申请号:CN202110924546.6
申请日:2021-08-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本公开涉及一种信息处理方法、装置、设备及介质。其中,信息处理方法包括:获取目标社会实体的目标社会实体信息;从目标社会实体信息中提取目标社会实体的与登记注册相关的目标特征向量;将目标特征向量输入预先训练好的梯度提升树模型,得到预先训练好的梯度提升树模型输出的目标社会实体的预测信用评分;若目标社会实体的预测信用评分符合预设的空壳实体检测条件,则确定目标社会实体为空壳实体。根据本公开实施例,能够提高对目标社会实体进行空壳实体检测的准确性,以满足税务稽查、风控预警等部门的实际业务需求。
-
公开(公告)号:CN113269125A
公开(公告)日:2021-08-17
申请号:CN202110646314.9
申请日:2021-06-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06K9/00 , G06K9/62 , G06F16/583
Abstract: 本发明实施例公开了一种人脸识别方法、装置、设备及存储介质。该方法包括:获取人脸识别图库,以及与待识别视频对应的视频人脸集合,人脸识别图库中包括至少一个人脸图像集合,人脸图像集合中各人脸图像具有相同身份标识号;根据视频人脸集合、人脸识别图库和预设识别条件,在视频人脸集合中确定至少一个候选视频人脸图像,并确定与各候选视频人脸图像对应的候选人脸图像集合;根据各候选人脸图像集合对应的身份标识号,在各候选视频人脸图像中确定目标视频人脸图像。本发明实施例的技术方案,解决了当人脸识别图库中具有多个相似人脸图像时,仅进行一次筛选在待识别视频中确定出的人脸图像识别结果准确性差的问题,提高了人脸图像识别的准确性。
-
-
-
-
-
-
-
-
-