-
公开(公告)号:CN113971770B
公开(公告)日:2024-10-29
申请号:CN202010648949.8
申请日:2020-07-07
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。
-
公开(公告)号:CN115796389A
公开(公告)日:2023-03-14
申请号:CN202310045255.9
申请日:2023-01-30
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种税收预测方法、装置、设备及计算机可读存储介质,该方法包括:获取目标税收主体的税收样本数据以及所述税收样本数据的演化模式标注结果;基于所述税收样本数据以及所述演化模式标注结果进行模型训练,得到训练好的税收演化模式匹配模型;将目标税收主体的历史税收数据输入所述税收演化模式匹配模型,得到所述目标税收主体的税收演化模式预测结果;基于所述税收演化模式预测结果,生成所述目标税收主体的衍生特征向量;将所述目标税收主体的衍生特征向量输入预先训练好的多模式税收预测模型,得到所述目标税收主体的税收预测结果。本公开通过为目标税收主体匹配最佳的税收演化模式,显著提升了预测的精准性。
-
公开(公告)号:CN115660796A
公开(公告)日:2023-01-31
申请号:CN202211577616.6
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种迁出风险企业的税源管理方法、装置、设备及存储介质,涉及数据分析技术领域,迁出风险企业的税源管理方法包括:获取目标企业的经营数据;对经营数据进行特征提取处理,得到目标企业与企业迁出行为相关的特征;将特征输入预设的企业迁出风险监控模型,基于企业迁出风险监控模型,对目标企业进行迁出风险检测。本公开实施例可以通过预设的企业迁出风险监控模型对存在迁出风险的企业进行精准稳定地的识别与预警,无需依靠人为经验,缩短企业迁出风险税前监控的时间,提高对重点税源流失预警响应的时效性和准确性。
-
公开(公告)号:CN114722836A
公开(公告)日:2022-07-08
申请号:CN202210516005.4
申请日:2022-05-12
Applicant: 北京中科闻歌科技股份有限公司
Inventor: 赵菲菲
IPC: G06F40/30 , G06F40/44 , G06K9/62 , G06F40/289 , G06F40/268
Abstract: 本公开涉及一种摘要生成方法、装置、设备及介质,在获取多个目标文本后,能够从与语义距离相关的多个视角提取每个目标文本的文本特征;并基于文本特征,对多个目标文本进行议题聚类,得到多个第一文本集合,进而针对各个第一文本集合分别进行议题摘要的抽取,由于用于对目标文本进行议题聚类的文本特征具有与语义距离相关的多个视角类型,使得进行议题聚类时所参考的信息特征比较丰富,能够从多个视角综合的对多个目标文本进行议题聚类,提高了议题聚类的准确性,进而使得抽取到的议题摘要也更加准确、有效。
-
公开(公告)号:CN113971770A
公开(公告)日:2022-01-25
申请号:CN202010648949.8
申请日:2020-07-07
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。
-
公开(公告)号:CN113379169B
公开(公告)日:2021-11-23
申请号:CN202110924546.6
申请日:2021-08-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本公开涉及一种信息处理方法、装置、设备及介质。其中,信息处理方法包括:获取目标社会实体的目标社会实体信息;从目标社会实体信息中提取目标社会实体的与登记注册相关的目标特征向量;将目标特征向量输入预先训练好的梯度提升树模型,得到预先训练好的梯度提升树模型输出的目标社会实体的预测信用评分;若目标社会实体的预测信用评分符合预设的空壳实体检测条件,则确定目标社会实体为空壳实体。根据本公开实施例,能够提高对目标社会实体进行空壳实体检测的准确性,以满足税务稽查、风控预警等部门的实际业务需求。
-
公开(公告)号:CN113505221A
公开(公告)日:2021-10-15
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN113449101A
公开(公告)日:2021-09-28
申请号:CN202010226687.6
申请日:2020-03-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F16/335 , G06F16/36
Abstract: 本发明实施例涉及一种公共卫生安全事件检测及事件集合构建方法及系统,方法包括:确定多个第一文本数据对应的多个主题信息,以及每个主题信息对应的至少一个第一文本数据;对每个主题信息对应的至少一个第一文本数据进行事件检测,确定每个主题信息对应的至少一个目标事件;将全部主题信息以及每个主题信息对应的至少一个目标事件作为事件集合;从互联网新闻流数据中获取与事件集合中主题信息相匹配的第二文本数据;基于第二文本数据与事件集合中目标事件的归属度对事件集合进行更新,基于静态文本数据构建的事件集合可以实现对动态文本数据的检测,进而提高互联网新闻流数据的检测效率,形成特定主题下相关舆情分析数据。
-
公开(公告)号:CN113051918A
公开(公告)日:2021-06-29
申请号:CN201911368962.1
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06K9/62 , G06N20/20
Abstract: 本发明公开了一种基于集成学习的命名实体识别方法、装置、设备和介质。该方法包括:将待识别的文本序列输入预先集成训练的命名实体识别模型;在命名实体识别模型中集成有多个基学习器并且每个基学习器对应一个权重;通过多个基学习器分别对输入的文本序列执行命名实体识别,得到每个基学习器输出的初始识别结果;根据每个基学习器输出的初始识别结果以及每个基学习器对应的权重,确定并输出文本序列的最终识别结果。本发明在命名实体识别模型中集成多个基学习器,并且集成训练多个基学习器,这使得命名实体识别模型的复杂度较低,降低了命名实体识别的耗时,提升了命名实体识别的时效性,也使得模型的训练过程简单易行。
-
公开(公告)号:CN108960280B
公开(公告)日:2020-07-24
申请号:CN201810488427.9
申请日:2018-05-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06K9/62
Abstract: 本发明涉及一种图片相似度检测方法及系统,该检测方法包括:分别筛选出互联网图片和参考图片中的互联网图片特征点和参考图片特征点;根据所有互联网图片特征点和所有参考图片特征点得到互联网图片和参考图片中的匹配特征点;当匹配特征点的个数大于或等于预设阈值时,互联网图片和参考图片相似。本发明实施例通过获取进行对比的两个图片的特征点,获取得到互联网图片和参考图片的特征点是否相匹配,并统计相匹配的特征点的数量,当匹配的特征点的数量超过预设阈值时,即可确认互联网图片和参考图片相似,本发明实施例计算数据量少,抗噪能力强,实现了快速识别检验图片之间是否相似。
-
-
-
-
-
-
-
-
-