-
公开(公告)号:CN114841353A
公开(公告)日:2022-08-02
申请号:CN202210460271.X
申请日:2022-04-28
Applicant: 天津大学 , 北京中科闻歌科技股份有限公司
IPC: G06N10/60 , G06F40/211 , G06F40/30
Abstract: 本发明公开了一种融合句法信息的量子语言模型建模方法,该方法从表示句子的量子系统入手,在模型中引入句法结构信息,以提高量子语言模型的建模能力,包括数据的预处理及句法结构生成模块、句法指导的单词表示模块、语义和语法信息融合的句子表达模块;所述数据的预处理及句法结构生成模块将句子处理成句法结构树的形式;句法指导的词向量表达模块利用每个句子的依存信息,训练单词的词向量表达;语义和语法信息融合的句子表达模块将上一步生成的词向量转换为密度矩阵,进一步得到句法指导的句子表达,以用于下游任务的训练;本发明基于句法结构树重构密度矩阵的生成与表达,利用依存关系建模了句子的词项依赖。
-
公开(公告)号:CN114691866A
公开(公告)日:2022-07-01
申请号:CN202210225366.3
申请日:2022-03-09
Applicant: 航空工业信息中心 , 北京中科闻歌科技股份有限公司 , 中国科学院自动化研究所
Abstract: 本公开实施例涉及一种面向多级标签的文本分类方法、装置、设备及存储介质。本公开实施例通过获取文本以及文本中关键词对应的标签;基于预设的面向多级标签的文本分类模型中的文本编码模型对文本进行编码处理,得到文本的特征向量,文本的特征向量对文本的关键词进行敏感表征,基于预设的面向多级标签的文本分类模型中的标签编码模型,对标签进行编码处理,得到标签的向量;分别计算文本的特征向量与每个标签的向量之间的余弦相似度;将余弦相似度大于预设阈值的标签确定为文本的标签。通过对文本和现有类别标签进行编码处理和余弦相似度计算处理,选择出文本内容相匹配的标签,可减轻对人工标注标签的依赖,降低人工标注和标签体系的维护成本,提高标签标注的准确率,使文本分类结果更准确。
-
公开(公告)号:CN114528417A
公开(公告)日:2022-05-24
申请号:CN202210377444.1
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/36 , G06F40/295 , G06F40/30
Abstract: 本公开涉及一种知识图谱本体构建方法、装置、设备及可读存储介质。本公开通过基于文本语料获取文本领域本体候选集,并基于图像数据获取图像领域本体候选集,基于文本领域本体候选集中文本领域本体的本体概念词,确定文本领域本体的层次结构,基于图像领域本体候选集中图像领域本体的图像语义标签,确定图像领域本体的层次结构。进而基于文本领域本体候选集、文本领域本体的层次结构、图像领域本体候选集和图像领域本体的层次结构,确定包含文本领域本体和图像领域本体的知识图谱本体,实现了对文本和图像等多模态数据的知识本体分类别、分层次的构建。
-
公开(公告)号:CN114492420A
公开(公告)日:2022-05-13
申请号:CN202210340732.X
申请日:2022-04-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种文本分类方法、装置、设备及计算机可读存储介质,该方法包括:对待分类的文本进行分词处理,得到文本中包含的词汇;从预设的语义库中查找词汇对应的语义,以及语义在语义库中的位置,得到语义的位置向量;响应于词汇对应的语义有多个,基于词汇在所述文本中的上下文,确定词汇对应的每个语义的权重;基于词汇对应的每个语义的权重,对词汇对应的多个语义的位置向量进行加权叠加处理,得到词汇的特征向量;基于文本中包含的词汇的特征向量,确定文本的特征向量;基于文本的特征向量对文本进行分类。通过上述技术方案,将文本转化到量子领域进行处理,减少计算成本的同时,提升了文本的分类准确率,提升用户的使用体验。
-
公开(公告)号:CN113672731A
公开(公告)日:2021-11-19
申请号:CN202110881327.4
申请日:2021-08-02
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开实施例涉及一种基于领域信息的情感分析方法,该方法包括:对待分析的文本信息进行预处理,并获取领域信息;将待分析的文本信息输入到预先融合有领域信息的情感分类模型中,获取文本信息的情感类别;融合有领域信息的情感分类模型包括:全局情感语义模型、每一个领域的局部情感语义模型和对应每一个领域的情感融合策略;其中,基于与领域信息匹配的局部情感语义模型,获取局部情感概率值;基于全局情感语义模型,获取全局情感概率值;基于与领域信息匹配的情感融合策略,对局部情感概率值和全局情感概率值进行融合,获得融合结果;基于融合结果获取情感类别。通过本方法进行文本情感分析,分类效果更好,大大提高了分析结果的准确率。
-
公开(公告)号:CN113536802A
公开(公告)日:2021-10-22
申请号:CN202010319243.7
申请日:2020-04-21
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种小语种文本数据的情感判别方法、装置、设备和存储介质。所述方法包括:获取文本数据;提取文本数据的多个文本特征;将文本特征输入支持向量机模型,得到文本数据的第一评价特征;将文本数据输入mBERT模型,得到文本数据的第二评价特征;输入第一评价特征和第二评价特征至情感判别器,输出文本数据的情感判别结果。支持向量机模型所采用的语言本身的特征进行判别时,可以提高对不同语言的情感判别准确度,采用mBERT学习不同语言深度语义向量进行的不同语言情感判别,可以很好的提升模型判别的泛化能力。
-
公开(公告)号:CN113536763A
公开(公告)日:2021-10-22
申请号:CN202110821206.0
申请日:2021-07-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06F16/335
Abstract: 本公开涉及一种信息处理方法、装置、设备及存储介质。其中,信息处理方法包括:获取待处理文本;确定待处理文本与已存储文本之间的文本相似度;基于待处理文本的发布时间和已存储文本的发布时间,对文本相似度进行修正,得到修正后的文本相似度;在修正后的文本相似度大于或等于预设相似度阈值的情况下,将已存储文本作为待处理文本的相似文本。根据本公开实施例,可以提高重复信息的查找精度和效率且节约设备资源,以进一步提高重复信息的处理效果和效率,降低文本内容的重复性,进而使得用户快速且准确的从网络平台中查找感兴趣信息的需求,提高用户查看信息的体验且节约设备资源。
-
公开(公告)号:CN113496780A
公开(公告)日:2021-10-12
申请号:CN202010197391.6
申请日:2020-03-19
Applicant: 北京中科闻歌科技股份有限公司
IPC: G16H50/80
Abstract: 本发明实施例提供了一种传染病确诊者数量预测方法、装置、服务器及存储介质,该方法包括:确定传染病预测天数、基本传染数、传染病潜伏周期,基于以下步骤进行迭代,直至传染病预测天数归零输出传染病第二累计确诊者数量:获取第一易感者数量、第一现存疑似者数量、第一累计确诊者数量、第一累计痊愈者数量;基于第一累计痊愈者数量、第一累计确诊者数量、基本传染数、传染病潜伏周期更新预设传染病预测模型中系数;基于第一易感者数量、第一现存疑似者数量、第一累计确诊者数量、第一累计痊愈者数量、经过更新的传染病预测模型,输出第二易感者数量、第二现存疑似者数量、第二累计确诊者数量、第二累计痊愈者数量;对传染病预测天数进行递减。
-
公开(公告)号:CN113379169A
公开(公告)日:2021-09-10
申请号:CN202110924546.6
申请日:2021-08-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本公开涉及一种信息处理方法、装置、设备及介质。其中,信息处理方法包括:获取目标社会实体的目标社会实体信息;从目标社会实体信息中提取目标社会实体的与登记注册相关的目标特征向量;将目标特征向量输入预先训练好的梯度提升树模型,得到预先训练好的梯度提升树模型输出的目标社会实体的预测信用评分;若目标社会实体的预测信用评分符合预设的空壳实体检测条件,则确定目标社会实体为空壳实体。根据本公开实施例,能够提高对目标社会实体进行空壳实体检测的准确性,以满足税务稽查、风控预警等部门的实际业务需求。
-
公开(公告)号:CN113220823A
公开(公告)日:2021-08-06
申请号:CN202010072425.9
申请日:2020-01-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/33 , G06F16/31 , G06F40/30 , G06F40/242 , G06F40/289 , G06F40/205 , G06Q50/00 , G06Q50/26
Abstract: 本申请涉及一种面向社交媒体公共言论的情感、话题及观点分析方法,该方法包括:获取与公共事件对应的媒体报道信息以及公众舆论内容;按照第一预设策略分析所述媒体报道信息得到第一分析结果,按照第二预设策略分析所述公众舆论内容得到第二分析结果;对比所述第一分析结果和第二分析结果确定所述媒体报道信息与所述公众舆论内容的差异程度;根据所述差异程度规划所述公共事件的报道议程。该技术方案通过对网络公共事件的媒体报道信息以及公众舆论进行对比分析,能够得到公众对公众事件的观点以及情感倾向,并根据公众的观点以及情感倾向规划公共事件的报道议程,以此不仅可以更好了解公众的意愿,还能促进社交媒体平台的健康发展。
-
-
-
-
-
-
-
-
-