-
公开(公告)号:CN119782464A
公开(公告)日:2025-04-08
申请号:CN202411840115.1
申请日:2024-12-13
Applicant: 北京中科闻歌科技股份有限公司 , 中国科学院自动化研究所 , 航空工业信息中心
IPC: G06F16/3329 , G06F16/34 , G06F40/211 , G06F40/253 , G06F40/30 , G06N3/045
Abstract: 本发明提供了一种多文档摘要生成质量评估方法,方法包括:构建问答对的方式,针对每个文档生成问题及其对应的答案作为答案参考;接着,基于当前需要评估的摘要对问题进行答案生成;然后,基于能否回答问题、回答问题的准确性以及对摘要中是否包含异常句子获取当前需要评估的摘要的生成状态值。本发明能够不依赖于参考标准对多文档摘要的生成质量进行分析。
-
公开(公告)号:CN112613324B
公开(公告)日:2024-11-12
申请号:CN202011596697.5
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
Abstract: 本申请涉及一种语义情绪识别方法、装置、设备及存储介质,所述方法包括:获取待识别文本,然后对待识别文本的全局语义信息进行提取,得到第一语义向量,再利用预训练的词向量模型确定待识别文本的词向量矩阵,之后根据词向量矩阵确定第二语义向量,根据词向量矩阵计算待识别文本中每个词的词向量与预设情绪词语的词向量的相似度,并将计算得到的所有相似度确定为第三语义向量,最后根据第一语义向量、第二语义向量和第三语义向量确定待识别文本所属的情绪类别,如此,便可以根据待识别文本的全局语义信息以及待识别文本的词向量矩阵确定待识别文本的情绪类别,考虑了待识别文本的词语义、词组语义以及句子语义信息,提高了情绪识别的准确性。
-
公开(公告)号:CN113553839B
公开(公告)日:2024-05-10
申请号:CN202010340711.9
申请日:2020-04-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/279 , G06F40/194
Abstract: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。
-
公开(公告)号:CN115526338A
公开(公告)日:2022-12-27
申请号:CN202211287916.0
申请日:2022-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N20/00 , G06F16/33 , G06F16/338
Abstract: 本申请涉及信息检索领域,特别是涉及一种用于信息检索的强化学习模型构建方法,所述方法包括:S100,获取查询信息Q的特征编码q和候选文档集合中各候选文档的特征编码;S200,构建MDP模型,其中:MDP模型的初始状态s0=[0,q],MDP模型的智能体在初始状态下选择动作a0的概率分布为π(a0|s0;w);S300,根据长期奖励对MDP模型进行模型训练。本发明提高了信息检索时文档排序的精确性。
-
公开(公告)号:CN113051984A
公开(公告)日:2021-06-29
申请号:CN201911389790.6
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06K9/00 , G06F16/783 , G06F16/71
Abstract: 本申请提供了一种视频拷贝检测方法和装置、存储介质和电子装置,其中,该方法包括:抽取查询视频的第一目标关键帧;提取所述第一目标关键帧的第一视频特征;获取参考视频的第二目标关键帧的第二视频特征;在根据所述第一视频特征和第二视频特征确定出所述查询视频与所述参考视频匹配的情况下,抽取所述查询视频与所述参考视频中相似的视频片段。通过本发明,解决了相关技术中的视频拷贝检测方法中存在的视频拷贝检测效率低,视频拷贝检测准确度差的问题,进而达到了提高视频拷贝检测效率,提升视频拷贝检测准确度的效果。
-
公开(公告)号:CN118394748A
公开(公告)日:2024-07-26
申请号:CN202410514210.6
申请日:2024-04-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/215 , G06F16/22
Abstract: 本发明提供了一种数据监测系统,系统包括处理器、存储器和数据库,存储器中存储有计算机程序,数据库中存储有监测规则参考表,处理器用于:获取用户输入的监测任务信息集M;对于M中的Mr,如果当前时间为Tr对应的监测时间,则利用DRr对Mr对应的当前需要处理的数据集DCr进行监测,得到对应的监测结果RSr;如果RSr为表征DCr的质量不满足预设要求的结果,输出对应的提示信息。本发明能够多维度对数据质量进行自动监测,能够提高监测效率和监测准确率。
-
公开(公告)号:CN118227262A
公开(公告)日:2024-06-21
申请号:CN202410364624.5
申请日:2024-03-28
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请实施例提供了一种针对流式数据处理的弹性扩缩容方法及装置,涉及云原生技术领域,部署于Kubernetes平台中,通过监控指标参数集合中的各个指标,获取所述指标参数集合中各个指标对应的参数值;所述指标参数集合中包括至少一个关于流式数据任务的自定义指标;基于所述各个指标对应的参数值,结合预设告警规则生成告警消息;响应于所述告警消息,对所述各个指标对应的参数值进行分析,以生成目标资源的配置信息;所述目标资源为基于自定义资源定义CRD创建的自定义资源;基于所述目标资源的配置信息,对所述目标资源对应的Deployment进行扩缩容。本申请实施例用于在Kubernetes平台中处理流式数据业务时,提高业务处理的效率。
-
公开(公告)号:CN117033449B
公开(公告)日:2023-12-15
申请号:CN202311296035.X
申请日:2023-10-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/2455 , G06F16/28 , G06F16/22
Abstract: 本发明提供了一种基于kafka流的数据处理方法、电子设备和存储介质,包括:获取通过kafka流获取的m个用户的数据需求信息;将获取的m个数据需求信息通过消息组件发送给数据预处理节点,得到具有设定格式的目标数据需求信息;获取当前时刻t对应的原始数据集Dt;从Dt中获取DSti,并基于Ir对应的目标数据需求信息,确定DSti是否为Ir对应的关联数据,如果是,则将Dti标记为Ir对应的关联数据;基于Irfs,从MDrw中获取对应的字段作为Ir对应的目标数据。本发明能够从海量的数据中及时且准确的获取到多个用户所需求的数据。
-
公开(公告)号:CN115688773A
公开(公告)日:2023-02-03
申请号:CN202110857375.X
申请日:2021-07-28
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295
Abstract: 本申请涉及一种实体关系抽取方法、装置及存储介质,所述方法包括:利用已训练的关系抽取模型从待抽取的目标语料中抽取目标关系;基于所述目标关系从所述目标语料中抽取目标实体对;利用所述目标关系和所述目标实体对构建所述目标语料对应的实体关系三元组。由此,可以实现先抽取目标语料中的目标关系,然后再基于目标关系抽取目标语料中的实体对,这相较于现有技术而言,可以避免在进行关系判断时,引入并无关系的实体对这一冗余信息,从而提高实体关系抽取结果的准确性。
-
公开(公告)号:CN113515648A
公开(公告)日:2021-10-19
申请号:CN202111070507.0
申请日:2021-09-13
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/45
Abstract: 本公开涉及一种内容聚类方法及系统。该方法包括:获取待聚类的多媒体内容集,待聚类的多媒体内容集包括第一多媒体内容集和第二多媒体内容集,根据第一多媒体内容集中第一多媒体内容的多媒体特征生成第一聚类簇,多媒体特征包括语义特征、实体特征以及词语特征中的至少两种,以第一聚类簇中的簇中心为聚类中心,对第二多媒体内容集中第二多媒体内容进行聚类,得到目标聚类簇。通过上述技术方案,实现了准确且快速的对多媒体内容进行聚类,以满足自然语言处理场景的实际聚类需求。
-
-
-
-
-
-
-
-
-