-
公开(公告)号:CN116361470A
公开(公告)日:2023-06-30
申请号:CN202310347961.9
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种基于话题描述的文本聚类清洗和合并方法,首先对文本进行聚类,得到多个聚类结果,每个聚类结果相当于一个话题,然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN115952801A
公开(公告)日:2023-04-11
申请号:CN202211724914.3
申请日:2022-12-28
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F40/289 , G06F16/33
Abstract: 本发明提供了一种企业名称对齐方法,包括:获取目标文本信息中的企业代称,以及与所述企业代称相关的关联地域实体和关联人物实体;获取所述企业代称中的构成要素,并基于获取的构成要素获取所述企业代称对应的企业简称集合,所述构成要素包括商号、地域、行业和机构类型中的至少一个;基于所述企业代称和对应的企业简称集合,获取与所述企业代称相关的候选企业信息列表,所述候选企业信息列表中包括n个候选企业信息,所述候选企业信息至少包括对应候选企业的企业名称;基于所述n个候选企业信息,获取与所述企业代称相关的目标企业名称。本发明还提供一种电子设备和存储介质。本发明能够提高企业名称对齐的准确率。
-
公开(公告)号:CN115942046A
公开(公告)日:2023-04-07
申请号:CN202211572783.1
申请日:2022-12-08
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/4402 , H04N21/44
Abstract: 本发明提供了一种智能裁剪视频的方法及存储介质,其包括如下步骤:对待裁剪视频进行拆帧处理,获取待处理视频帧中的第一目标视频对象信息列表,按照预设规则划分目标区域,获取第一目标视频对象信息组合列表,获取每一第一目标视频对象信息组合的第一得分,当待处理视频帧中包含的所有第一目标视频对象对应的优先等级均为空时,获取第一得分列表中最高得分对应的目标区域进行裁剪,获取裁剪后视频帧,否则,获取包含该优先等级不为空的完整的第一目标视频对象信息的第二目标视频对象信息组合及其对应的第二得分列表,获取第二得分列表中最高的第二得分对应的目标区域进行裁剪,获取裁剪后视频帧,从而实现对视频的从横屏到竖屏的剪裁。
-
公开(公告)号:CN112866586B
公开(公告)日:2023-03-07
申请号:CN202110003232.2
申请日:2021-01-04
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N5/265 , G10L13/04 , G10L13/047 , G10L21/10 , G10L25/57
Abstract: 本发明实施例公开了一种视频合成方法、装置、设备及存储介质。获取的待合成文本可以是任意语种的文本,待合成视频可以是用户选择的包括任意主播形象的视频片段,根据获取的待合成文本自动生成音频流,基于待合成视频中的无音视频流生成视频特征和唇部特征,并根据音频流生成音频特征和口型特征,基于口型特征和唇部特征确定口唇映射关系,根据口唇映射关系生成口唇一致的视频序列,进一步地,根据融合后的视频序列,生成目标合成视频,使整个目标合成视频中的人脸和唇部动作保持一致,并使目标合成视频中的主播唇动保持自然一致,并生成符合用户意愿的目标合成视频,提高用户观看体验。
-
公开(公告)号:CN115688773A
公开(公告)日:2023-02-03
申请号:CN202110857375.X
申请日:2021-07-28
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295
Abstract: 本申请涉及一种实体关系抽取方法、装置及存储介质,所述方法包括:利用已训练的关系抽取模型从待抽取的目标语料中抽取目标关系;基于所述目标关系从所述目标语料中抽取目标实体对;利用所述目标关系和所述目标实体对构建所述目标语料对应的实体关系三元组。由此,可以实现先抽取目标语料中的目标关系,然后再基于目标关系抽取目标语料中的实体对,这相较于现有技术而言,可以避免在进行关系判断时,引入并无关系的实体对这一冗余信息,从而提高实体关系抽取结果的准确性。
-
公开(公告)号:CN114218923B
公开(公告)日:2022-08-30
申请号:CN202111564484.9
申请日:2021-12-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/211 , G06F40/295 , G06F40/258 , G06F40/30 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开实施例涉及一种文本摘要抽取方法、装置、设备及存储介质。本公开实施例通过对文本进行分句处理,获得文本中的语句和标题;提取语句中的实体,确定语句中的实体占文本中的实体的比例;基于该比例,确定语句的第一得分;基于语句与标题之间的语义相似度,确定语句的第二得分;基于第一得分和第二得分,确定用于形成摘要的语句。本公开实施例通过建模文本语句实体与文本实体,文本语句与文本标题的相关性,减少了文本摘要的冗余性,提高了文本摘要表达文本信息的准确性,提高了用户的阅读体验。
-
公开(公告)号:CN114880496A
公开(公告)日:2022-08-09
申请号:CN202210471183.X
申请日:2022-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/432 , G06F16/435 , G06F16/483 , G06F40/279 , G06F40/30 , G06V40/16 , G06V20/40 , G06V20/62 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06N7/00 , G10L15/22
Abstract: 本公开涉及一种多媒体信息话题分析方法、装置、设备及计算机可读存储介质,本公开通过音频数据得到语音识别文本、通过视频数据的关键帧得到字幕文本;针对上述语音识别文本及字幕文本从实体、关键词、语义标签三方面提取话题信息,实现了基于文本数据的全方面、多粒度的文本话题提取;针对视频数据的关键帧,从人脸标签及图片标签两方面提取话题信息,实现了基于图像数据的视觉话题提取;本公开实施例充分考虑了视频数据的多模态特征,全面的分析视频话题,提高了话题分析的准确性;进一步的,通过准确的话题分析,可以使受众快速有效的获取视频的主要信息,提升了工作效率,并可以广泛应用于视频个性化推荐、视频内容检索等场景。
-
公开(公告)号:CN114139541B
公开(公告)日:2022-08-02
申请号:CN202111389485.4
申请日:2021-11-22
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F16/35
Abstract: 本公开涉及一种命名实体识别方法、装置、设备及介质。其中,命名实体识别方法包括:获取待识别的目标文本;对目标文本进行语义特征编码,得到具有上下文信息的第一编码向量,以及对目标文本进行实体特征编码,得到具有上下文信息的第二编码向量;基于第一编码向量,提取实体片段对应的边界信息;基于第一编码向量、第二编码向量和边界信息,对目标文本进行实体分类,得到目标文本对应的目标实体类别。根据本公开实施例,能够快速地从非结构化文本中提取出实体类别信息,并且提高对非结构化文本进行实体类别分类的准确性。
-
公开(公告)号:CN114692601A
公开(公告)日:2022-07-01
申请号:CN202011572938.2
申请日:2020-12-25
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
IPC: G06F40/211 , G06F40/279 , G06F16/31 , G06F16/33 , G06F16/35
Abstract: 本发明实施例涉及一种信息抽取方法、装置、电子设备及存储介质,包括:利用预设规则从至少一个信息通道中获取目标事件的相关文本;对所述相关文本进行分割,得到多个句子;对每一所述句子进行句法分析,根据句法分析结果得到所述句子中的目标专家实体和目标发言指示词;根据所述目标专家实体和目标发言指示词从所述句子中抽取目标专家职称和目标专家观点。由此,可以实现从互联网的海量信息中抽取出专家对于特定事件的观点。
-
公开(公告)号:CN113656660B
公开(公告)日:2022-06-28
申请号:CN202111199634.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/903 , G06K9/62 , G06N3/08 , G06N3/04
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,进行相关性特征计算,得到待匹配数据与候选数据之间的相关性特征参数;在相关性特征参数满足预设匹配条件的情况下,确定待匹配数据与候选数据相互匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
-
-
-
-
-
-
-
-