-
公开(公告)号:CN115797715A
公开(公告)日:2023-03-14
申请号:CN202211583636.4
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种量子视觉MLP处理系统及存储介质,所述系统包括n个量子视觉MLP处理模块、处理器和存储有一段计算机程序的存储器,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元,当所述处理器执行一段计算机程序时,实现如下步骤:获取目标图像对应的图像块初始特征向量,将图像块初始化特征向量输入量子视觉MLP处理模块,以获得该目标图像的最终图像聚合特征和最终图像块特征;本发明提出的量子视觉MLP处理系统,一方面使得图像块的特征充分考虑了其语义内容,更利于图像块的聚合,另一方面,其包含了较少的归纳偏差,具有较高的适应性。
-
公开(公告)号:CN114492420B
公开(公告)日:2022-07-29
申请号:CN202210340732.X
申请日:2022-04-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种文本分类方法、装置、设备及计算机可读存储介质,该方法包括:对待分类的文本进行分词处理,得到文本中包含的词汇;从预设的语义库中查找词汇对应的语义,以及语义在语义库中的位置,得到语义的位置向量;响应于词汇对应的语义有多个,基于词汇在所述文本中的上下文,确定词汇对应的每个语义的权重;基于词汇对应的每个语义的权重,对词汇对应的多个语义的位置向量进行加权叠加处理,得到词汇的特征向量;基于文本中包含的词汇的特征向量,确定文本的特征向量;基于文本的特征向量对文本进行分类。通过上述技术方案,将文本转化到量子领域进行处理,减少计算成本的同时,提升了文本的分类准确率,提升用户的使用体验。
-
公开(公告)号:CN114281944A
公开(公告)日:2022-04-05
申请号:CN202111619353.6
申请日:2021-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/33 , G06F40/289 , G06F16/242 , G06N3/08
Abstract: 本申请实施例提供一种文档匹配模型的构建方法、装置、电子设备及存储介质,其中,该方法包括:步骤一,获取查询词汇特征集合和文档特征集合;步骤二,获得查询词汇特征集合和文档特征集合的相关性特征值;步骤三,获得文档特征集合中每个文档特征与查询词汇特征集合的第一匹配值,选取第一匹配值最大的文档特征;步骤四,获得第二文档特征;步骤五,将候选文档特征集合作为新的候选文档特征集合,将第二文档特征作为新的第一文档特征,重复步骤四;步骤六,根据有序文档特征集合和文档特征集合获得损失函数,并根据损失函数构建匹配模型。实施本申请实施例,使得匹配模型可以引入认知层面的相关性特征,提高了匹配模型的准确率和检索性能。
-
公开(公告)号:CN116361470B
公开(公告)日:2024-05-14
申请号:CN202310347961.9
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种基于话题描述的文本聚类清洗和合并方法,首先对文本进行聚类,得到多个聚类结果,每个聚类结果相当于一个话题,然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN117113990A
公开(公告)日:2023-11-24
申请号:CN202311374453.6
申请日:2023-10-23
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F18/25
Abstract: 本发明涉及计算机技术应用领域,提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质,包括:获取待分词的文本,作为目标文本;对目标文本进行分词处理,得到对应的分词集S;基于预设词向量基准表T,获取每个词在每个嵌入矩阵的特征向量;基于预设滑动窗口长度d,将S划分为多个语句片段,得到对应的语句片段集SP;对每个语句片段的特征向量进行融合,得到对应的特征向量;得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中,将多个相邻的词组合视为一个词,能够使得分词的长度得到极大的压缩。此外,将不同词的特征向量通过张量积的方式组合成一个词的特征向量,可以极大的降低可训练参数量。
-
公开(公告)号:CN116049414B
公开(公告)日:2023-06-06
申请号:CN202310346367.8
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
Abstract: 本发明提供了一种基于话题描述的文本聚类方法、电子设备和存储介质,方法包括:首先对待聚类的每个文本生成一个话题描述,然后将该话题描述输入话题描述特征生成模型,提取话题描述的特征,作为当前文本的话题描述特征,基于该特征,对文本进行聚类,相较于直接使用原始文本提取的特征进行聚类,使用生成的话题描述特征进行聚类,减少了文本内容形式多样导致的噪声干扰,提高了聚类准确性。聚类后,基于文本和话题的特征向量之间的相似度以及文本和话题的话题描述特征向量之间的相似度,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的话题描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN116049414A
公开(公告)日:2023-05-02
申请号:CN202310346367.8
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
Abstract: 本发明提供了一种基于话题描述的文本聚类方法、电子设备和存储介质,方法包括:首先对待聚类的每个文本生成一个话题描述,然后将该话题描述输入话题描述特征生成模型,提取话题描述的特征,作为当前文本的话题描述特征,基于该特征,对文本进行聚类,相较于直接使用原始文本提取的特征进行聚类,使用生成的话题描述特征进行聚类,减少了文本内容形式多样导致的噪声干扰,提高了聚类准确性。聚类后,基于文本和话题的特征向量之间的相似度以及文本和话题的话题描述特征向量之间的相似度,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的话题描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN114297357B
公开(公告)日:2022-08-19
申请号:CN202111616638.4
申请日:2021-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F40/289 , G06F40/242 , G06N10/20
Abstract: 本申请实施例提供一种基于量子计算的问答模型构建方法、装置、电子设备及存储介质,其中,该方法包括:获取查询词汇向量集合和答案语句向量集合;根据查询词汇向量集合获得查询词汇向量集合中每个查询词汇向量的查询词汇向量密度矩阵,作为查询词汇向量密度矩阵集合;根据答案语句向量集合获得答案语句向量集合中每个答案语句向量的答案语句向量密度矩阵,作为答案语句向量密度矩阵集合;根据查询词汇向量密度矩阵集合和答案语句向量密度矩阵集合获得答案语句向量密度矩阵集合中全部答案语句向量密度矩阵的相关性分值和状态演化矩阵;根据相关性分值和状态演化矩阵构建问答模型。实施本申请实施例,提高了智能问答模型的准确率,方便使用。
-
公开(公告)号:CN114462425B
公开(公告)日:2022-08-02
申请号:CN202210380446.6
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F16/35
Abstract: 本公开涉及一种社交媒体文本处理方法、装置、设备及存储介质。本公开通过对社交媒体文本进行分词处理,得到多个词项;针对任一词项,基于该词项在不同应用场景上下文中的语义,确定该词项的词向量,由于词向量包含了该词项在不同应用场景上下文中的语义,因此,利用词向量,可以提高文本上下文特征提取能力和隐式情感的推断能力;进而,基于多个词项各自的词向量,确定社交媒体文本的全局语义向量;并基于多个词项各自的词向量和多个词项各自在社交媒体文本的权重,确定社交媒体文本的局部语义向量;基于全局语义向量和局部语义向量,确定社交媒体文本对应的情感类型,从而提高了社交媒体文本的情感类型的预测准确性。
-
公开(公告)号:CN114462425A
公开(公告)日:2022-05-10
申请号:CN202210380446.6
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F16/35
Abstract: 本公开涉及一种社交媒体文本处理方法、装置、设备及存储介质。本公开通过对社交媒体文本进行分词处理,得到多个词项;针对任一词项,基于该词项在不同应用场景上下文中的语义,确定该词项的词向量,由于词向量包含了该词项在不同应用场景上下文中的语义,因此,利用词向量,可以提高文本上下文特征提取能力和隐式情感的推断能力;进而,基于多个词项各自的词向量,确定社交媒体文本的全局语义向量;并基于多个词项各自的词向量和多个词项各自在社交媒体文本的权重,确定社交媒体文本的局部语义向量;基于全局语义向量和局部语义向量,确定社交媒体文本对应的情感类型,从而提高了社交媒体文本的情感类型的预测准确性。
-
-
-
-
-
-
-
-
-