-
公开(公告)号:CN113496118A
公开(公告)日:2021-10-12
申请号:CN202010266045.9
申请日:2020-04-07
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/242 , G06F40/279 , G06N20/10
Abstract: 本发明公开了一种新闻主体识别方法、设备和计算机可读存储介质。该方法包括:获取待识别新闻文本,并对新闻文本进行预处理;利用预设的分词词典,对预处理后的新闻文本执行带词性标注的分词处理,得到多个被标注词性的分词;在词性被标注为主体的分词中查询预设的目标主体,并在新闻文本中提取目标主体对应的多种主体特征;将目标主体对应的多种主体特征输入预先训练的主体识别模型中,获取主体识别模型输出的识别结果。在本发明中,将目标主体对应的多种主体特征作为主体识别模型的输入,使主体识别模型根据目标主体对应的多种主体特征识别新闻文本的主体是否为目标主体,弥补了新闻主体识别的技术空白。
-
公开(公告)号:CN113449101A
公开(公告)日:2021-09-28
申请号:CN202010226687.6
申请日:2020-03-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F16/335 , G06F16/36
Abstract: 本发明实施例涉及一种公共卫生安全事件检测及事件集合构建方法及系统,方法包括:确定多个第一文本数据对应的多个主题信息,以及每个主题信息对应的至少一个第一文本数据;对每个主题信息对应的至少一个第一文本数据进行事件检测,确定每个主题信息对应的至少一个目标事件;将全部主题信息以及每个主题信息对应的至少一个目标事件作为事件集合;从互联网新闻流数据中获取与事件集合中主题信息相匹配的第二文本数据;基于第二文本数据与事件集合中目标事件的归属度对事件集合进行更新,基于静态文本数据构建的事件集合可以实现对动态文本数据的检测,进而提高互联网新闻流数据的检测效率,形成特定主题下相关舆情分析数据。
-
公开(公告)号:CN113269125A
公开(公告)日:2021-08-17
申请号:CN202110646314.9
申请日:2021-06-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06K9/00 , G06K9/62 , G06F16/583
Abstract: 本发明实施例公开了一种人脸识别方法、装置、设备及存储介质。该方法包括:获取人脸识别图库,以及与待识别视频对应的视频人脸集合,人脸识别图库中包括至少一个人脸图像集合,人脸图像集合中各人脸图像具有相同身份标识号;根据视频人脸集合、人脸识别图库和预设识别条件,在视频人脸集合中确定至少一个候选视频人脸图像,并确定与各候选视频人脸图像对应的候选人脸图像集合;根据各候选人脸图像集合对应的身份标识号,在各候选视频人脸图像中确定目标视频人脸图像。本发明实施例的技术方案,解决了当人脸识别图库中具有多个相似人脸图像时,仅进行一次筛选在待识别视频中确定出的人脸图像识别结果准确性差的问题,提高了人脸图像识别的准确性。
-
公开(公告)号:CN113159874A
公开(公告)日:2021-07-23
申请号:CN202110570420.3
申请日:2021-05-25
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本发明提供了一种增值税发票的检测方法、装置和可读存储介质。增值税发票的检测方法,包括获取数据,对数据进行数据处理,得到清洁数据;基于清洁数据,获取第一特征向量集合;基于第一特征向量集合,采用第一风险量化模型进行检测,得到第一风险量化值;基于企业关联关系拓扑图,获取风险扩散变量;基于风险扩散变量和第一风险量化值,获取第二特征向量集合;基于第二特征向量集合,采用第二风险量化模型进行检测,获取第二风险量化值。本发明提出了洗票风险扩散机制,对洗票风险在企业之间的扩散过程进行建模,实现了企业间风险扩散行为的精确捕获与计算,同时清晰地区分了正常企业与洗票嫌疑企业。
-
公开(公告)号:CN113051918A
公开(公告)日:2021-06-29
申请号:CN201911368962.1
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06K9/62 , G06N20/20
Abstract: 本发明公开了一种基于集成学习的命名实体识别方法、装置、设备和介质。该方法包括:将待识别的文本序列输入预先集成训练的命名实体识别模型;在命名实体识别模型中集成有多个基学习器并且每个基学习器对应一个权重;通过多个基学习器分别对输入的文本序列执行命名实体识别,得到每个基学习器输出的初始识别结果;根据每个基学习器输出的初始识别结果以及每个基学习器对应的权重,确定并输出文本序列的最终识别结果。本发明在命名实体识别模型中集成多个基学习器,并且集成训练多个基学习器,这使得命名实体识别模型的复杂度较低,降低了命名实体识别的耗时,提升了命名实体识别的时效性,也使得模型的训练过程简单易行。
-
公开(公告)号:CN112613293A
公开(公告)日:2021-04-06
申请号:CN202011593291.1
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06K9/62
Abstract: 本发明实施例公开了一种摘要生成方法、装置、电子设备及存储介质,所述方法包括:获取摘要文本信息;分别确定预设图像集中至少一个图像与所述摘要文本信息的图文相似度;分别提取所述至少一个图像中的图像文本信息,并确定各所述图像的图像文本信息与所述摘要文本信息的文本相似度;基于各所述图像的图文相似度和文本相似度确定与所述摘要文本信息相匹配的摘要图像;基于所述摘要图像和所述摘要文本信息形成目标摘要。本发明实施例的技术方案实现了当用户阅读初始文本时,可以通过摘要图像直观的了解文本的大致内容,通过阅读摘要文本信息获知文本主旨内容,提高用户的阅读体验感。
-
公开(公告)号:CN112579824A
公开(公告)日:2021-03-30
申请号:CN202011486751.0
申请日:2020-12-16
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/75 , G06F16/783 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种视频数据分类方法、装置、电子设备及存储介质,所述方法包括:获取视频数据分别在RGB模态、光流场模态和动态图模态下的图像帧序列;对所述RGB模态、所述光流场模态和所述动态图模态下的图像帧序列分别进行分类处理,确定各模态下的分类分数;基于所述各模态下的分类分数确定所述视频数据的目标分类结果。本发明实施例的技术方案对三种模态下的图像帧序列分别进行分类处理,并根据各自的分类分数综合确定视频数据的目标分类结果,使得分类结果更加准确,视频数据的分类效率更高。
-
公开(公告)号:CN108596360B
公开(公告)日:2021-03-12
申请号:CN201810218371.5
申请日:2018-03-16
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06Q10/04 , G06F40/284 , G06F16/332 , G06Q50/18 , G06N20/00
Abstract: 本发明涉及一种基于机器学习的判决预测方法及系统,该预测方法包括:得到判决文书的第一候选关键词;将第一预测权重值与实际权重值的偏离程度小于第一预设阈值,且第一预测权重值大于第二预设阈值的第一候选关键词作为关键词;将判决文书与相应的关键词进行训练得到判决模型;通过判决模型和待判决文书得到判决建议文书,根据判决建议文书得到判决建议。本发明实施例通过对已有的判决文书进行处理得到其中的关键词,并利用判决和关键词的对应关系进行训练得到相应的判决模型,在需要进行审判时,将待判决文件输入所述判决模型,进而得到符合条件的判决文件,从而为法官提供判决建议,保证案件的审判无差错,量刑适中,做到同案同判和司法公正。
-
公开(公告)号:CN111026866B
公开(公告)日:2020-10-23
申请号:CN201911019149.3
申请日:2019-10-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F40/289
Abstract: 本发明公开了一种面向领域的文本信息抽取聚类方法、设备和存储介质。该方法包括:获取文本信息集合;所述文本信息集合包括:目标领域内的多个文本信息和目标领域外的多个文本信息;将所述文本信息集合输入预先训练的抽取聚类模型;通过所述抽取聚类模型对所述文本信息集合执行抽取和聚类处理,得到所述目标领域内每个主题对应的代表性信息。本发明将抽取和聚类融合在一起,使得抽取和聚类相互支撑,在抽取聚类过程中,人工干预少且抽取和聚类高效。
-
公开(公告)号:CN108960280B
公开(公告)日:2020-07-24
申请号:CN201810488427.9
申请日:2018-05-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06K9/62
Abstract: 本发明涉及一种图片相似度检测方法及系统,该检测方法包括:分别筛选出互联网图片和参考图片中的互联网图片特征点和参考图片特征点;根据所有互联网图片特征点和所有参考图片特征点得到互联网图片和参考图片中的匹配特征点;当匹配特征点的个数大于或等于预设阈值时,互联网图片和参考图片相似。本发明实施例通过获取进行对比的两个图片的特征点,获取得到互联网图片和参考图片的特征点是否相匹配,并统计相匹配的特征点的数量,当匹配的特征点的数量超过预设阈值时,即可确认互联网图片和参考图片相似,本发明实施例计算数据量少,抗噪能力强,实现了快速识别检验图片之间是否相似。
-
-
-
-
-
-
-
-
-