-
公开(公告)号:CN115934752B
公开(公告)日:2023-07-14
申请号:CN202211585614.1
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明提供了一种构建检索模型的方法、电子设备和存储介质,包括:获取目标文本的目标文本词向量,获取目标文本对应的候选代表词集合和候选随机词集合,将目标文本词集合与候选代表词集合和候选随机词集合分别进行拼接,输入到量子概率注意力值模型,获取对应的注意力值,将注意力值分别输入多层感知机,获取候选代表词为代表词的概率和候选随机词为代表词的概率,基于候选代表词为代表词的概率和候选随机词为代表词的概率,最小化两者的损失函数,获取目标检索模型;从而取得更好的检索效果。
-
公开(公告)号:CN116361470A
公开(公告)日:2023-06-30
申请号:CN202310347961.9
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种基于话题描述的文本聚类清洗和合并方法,首先对文本进行聚类,得到多个聚类结果,每个聚类结果相当于一个话题,然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN113656660B
公开(公告)日:2022-06-28
申请号:CN202111199634.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/903 , G06K9/62 , G06N3/08 , G06N3/04
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,进行相关性特征计算,得到待匹配数据与候选数据之间的相关性特征参数;在相关性特征参数满足预设匹配条件的情况下,确定待匹配数据与候选数据相互匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
公开(公告)号:CN114297357A
公开(公告)日:2022-04-08
申请号:CN202111616638.4
申请日:2021-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F40/289 , G06F40/242 , G06N10/20
Abstract: 本申请实施例提供一种基于量子计算的问答模型构建方法、装置、电子设备及存储介质,其中,该方法包括:获取查询词汇向量集合和答案语句向量集合;根据查询词汇向量集合获得查询词汇向量集合中每个查询词汇向量的查询词汇向量密度矩阵,作为查询词汇向量密度矩阵集合;根据答案语句向量集合获得答案语句向量集合中每个答案语句向量的答案语句向量密度矩阵,作为答案语句向量密度矩阵集合;根据查询词汇向量密度矩阵集合和答案语句向量密度矩阵集合获得答案语句向量密度矩阵集合中全部答案语句向量密度矩阵的相关性分值和状态演化矩阵;根据相关性分值和状态演化矩阵构建问答模型。实施本申请实施例,提高了智能问答模型的准确率,方便使用。
-
公开(公告)号:CN113515648A
公开(公告)日:2021-10-19
申请号:CN202111070507.0
申请日:2021-09-13
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/45
Abstract: 本公开涉及一种内容聚类方法及系统。该方法包括:获取待聚类的多媒体内容集,待聚类的多媒体内容集包括第一多媒体内容集和第二多媒体内容集,根据第一多媒体内容集中第一多媒体内容的多媒体特征生成第一聚类簇,多媒体特征包括语义特征、实体特征以及词语特征中的至少两种,以第一聚类簇中的簇中心为聚类中心,对第二多媒体内容集中第二多媒体内容进行聚类,得到目标聚类簇。通过上述技术方案,实现了准确且快速的对多媒体内容进行聚类,以满足自然语言处理场景的实际聚类需求。
-
公开(公告)号:CN112329470A
公开(公告)日:2021-02-05
申请号:CN202011241374.4
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 北京中科闻歌智安科技有限公司
IPC: G06F40/295 , G06F40/226 , G06N3/08
Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。
-
公开(公告)号:CN119782520A
公开(公告)日:2025-04-08
申请号:CN202411840116.6
申请日:2024-12-13
Applicant: 北京中科闻歌科技股份有限公司 , 中国科学院自动化研究所 , 航空工业信息中心
IPC: G06F16/34 , G06F16/355 , G06F16/3329 , G06F40/30 , G06N3/045 , G06F18/22
Abstract: 本发明提供了一种基于大语言模型的事件脉络生成方法、设备和介质,包括:事件信息输入及相关数据获取,数据清洗及相关性判断,大模型事件脉络生成,事件脉络清洗及梳理,事件脉络溯源信息溯源。本发明通过大语言模型生成及梳理事件脉络,可保障脉络的逻辑性,使用户更加清晰的浏览事件发生的前因后果。此外,通过使用大语言模型的通用理解能力,无需针对各个领域进行适配性工作。
-
公开(公告)号:CN115797715B
公开(公告)日:2023-06-23
申请号:CN202211583636.4
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种量子视觉MLP处理系统及存储介质,所述系统包括n个量子视觉MLP处理模块、处理器和存储有一段计算机程序的存储器,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元,当所述处理器执行一段计算机程序时,实现如下步骤:获取目标图像对应的图像块初始特征向量,将图像块初始化特征向量输入量子视觉MLP处理模块,以获得该目标图像的最终图像聚合特征和最终图像块特征;本发明提出的量子视觉MLP处理系统,一方面使得图像块的特征充分考虑了其语义内容,更利于图像块的聚合,另一方面,其包含了较少的归纳偏差,具有较高的适应性。
-
公开(公告)号:CN115526338B
公开(公告)日:2023-06-23
申请号:CN202211287916.0
申请日:2022-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N20/00 , G06F16/33 , G06F16/338
Abstract: 本申请涉及信息检索领域,特别是涉及一种用于信息检索的强化学习模型构建方法,所述方法包括:S100,获取查询信息Q的特征编码q和候选文档集合中各候选文档的特征编码;S200,构建MDP模型,其中:MDP模型的初始状态s0=[0,q],MDP模型的智能体在初始状态下选择动作a0的概率分布为π(a0|s0;w);S300,根据长期奖励对MDP模型进行模型训练。本发明提高了信息检索时文档排序的精确性。
-
公开(公告)号:CN116049413B
公开(公告)日:2023-06-13
申请号:CN202310346366.3
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047
Abstract: 本发明提供了一种基于事件演化的用户观点和立场获取方法,首先对输入的多个文本例如新闻进行文本聚类,然后对聚类结果进行清洗和合并以得到事件,然后针对事件的演化过程,抽取事件对应的评论者、观点和立场,最后按照事件的演化时间顺序,输出对应的评论者、观点和立场,能够根据事件的演变,推断评论者的观点、立场的变化情况。
-
-
-
-
-
-
-
-
-