-
公开(公告)号:CN116049413A
公开(公告)日:2023-05-02
申请号:CN202310346366.3
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047
Abstract: 本发明提供了一种基于事件演化的用户观点和立场获取方法,首先对输入的多个文本例如新闻进行文本聚类,然后对聚类结果进行清洗和合并以得到事件,然后针对事件的演化过程,抽取事件对应的评论者、观点和立场,最后按照事件的演化时间顺序,输出对应的评论者、观点和立场,能够根据事件的演变,推断评论者的观点、立场的变化情况。
-
公开(公告)号:CN116361468B
公开(公告)日:2024-05-03
申请号:CN202310347374.X
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种事件脉络生成方法、电子设备和存储介质,方法包括:首先对接收到的文本进行文本编码,然后进行文本聚类,并进行话题清洗与合并,得到所有话题,然后对每个话题,进行事件拆分,得到每个事件,并对相似事件进行合并,然后基于文本相似度进行事件脉络生成,能够更好地划分话题或事件,使得生成的话题或事件更加准确。此外,本发明不需要人工干预,可自动对多篇新闻进行数据预处理,生成话题库和事件库,并根据发布时间,输出事件的事件脉络。
-
公开(公告)号:CN116361509A
公开(公告)日:2023-06-30
申请号:CN202310217049.1
申请日:2023-03-02
Applicant: 新华融合媒体科技发展(北京)有限公司 , 北京中科闻歌科技股份有限公司
IPC: G06F16/75 , G06F16/735 , G06F16/783
Abstract: 本申请涉及视频分类技术领域,特别是涉及一种基于多模态特征的视频分类方法。所述方法包括以下步骤:S100,抽取目标视频vid的视频时序特征Fts;将Fts进行聚合得到Fv;S200,将vid转换为wav格式的音频数据aud;抽取aud的音频时序特征Fas;将Fas进行聚合得到Fa;S300,按照预设频次对vid进行视频帧图像抽取,得到视频帧图像集合img;提取img中的字幕文本信息textocr,并结合vid的文本标题texttitle获取vid的第三特征向量Ft;S400,将Fv、Fa和Ft输入到经训练的第一神经网络模型,得到对vid的一级标签分类结果。本发明实现了对短视频内容的准确分类。
-
公开(公告)号:CN116361468A
公开(公告)日:2023-06-30
申请号:CN202310347374.X
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种事件脉络生成方法、电子设备和存储介质,方法包括:首先对接收到的文本进行文本编码,然后进行文本聚类,并进行话题清洗与合并,得到所有话题,然后对每个话题,进行事件拆分,得到每个事件,并对相似事件进行合并,然后基于文本相似度进行事件脉络生成,能够更好地划分话题或事件,使得生成的话题或事件更加准确。此外,本发明不需要人工干预,可自动对多篇新闻进行数据预处理,生成话题库和事件库,并根据发布时间,输出事件的事件脉络。
-
公开(公告)号:CN116206295A
公开(公告)日:2023-06-02
申请号:CN202310196542.X
申请日:2023-03-02
Applicant: 新华融合媒体科技发展(北京)有限公司 , 北京中科闻歌科技股份有限公司
IPC: G06V20/60 , G06V10/22 , G06V10/426 , G06V10/74 , G06F16/583 , G06V10/776 , G06V10/82
Abstract: 本申请涉及计算机视觉技术领域,特别是涉及一种LOGO识别系统。该系统包括存储器,所述存储器存储有LOGO数据库,所述LOGO数据库由至少两个LOGO子数据库组成,不同LOGO子数据库对应的LOGO宽高比例范围不同;每个LOGO子数据库存储有对应LOGO的特征向量,每个LOGO子数据库中LOGO对应的特征向量的存储位置标号与对应的LOGO面积占比正相关或负相关;所述系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被处理器执行时,实现对应的LOGO识别方法。本发明能够快速识别出图像和视频数据中的LOGO。
-
公开(公告)号:CN116361470A
公开(公告)日:2023-06-30
申请号:CN202310347961.9
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种基于话题描述的文本聚类清洗和合并方法,首先对文本进行聚类,得到多个聚类结果,每个聚类结果相当于一个话题,然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN119849624A
公开(公告)日:2025-04-18
申请号:CN202411916261.8
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N5/04 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/0475
Abstract: 本申请涉及一种基于多模态情感的大模型对话方法、装置、设备及介质,尤其涉及自然语言处理技术领域。包括:接收用户的多模态输入,并对多模态输入进行多模态情感分析得到多模态情感表征;将多模态情感表征和当前对话上下文输入情感生成网络,得到情感生成网络输出的当前情感倾向;基于当前情感倾向对历史情感倾向进行更新,得到目标情感倾向;将目标情感倾向和当前对话上下文输入解码器,得到解码器输出的情感回复内容。本申请实施例提升了情感理解的准确性,适应于用户情感波动,能够生成连贯且一致的情感回复内容。
-
公开(公告)号:CN119848168A
公开(公告)日:2025-04-18
申请号:CN202411916262.2
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/31 , G06F16/3329 , G06F16/36 , G06F16/3332 , G06F16/334 , G06F16/901 , G06N5/022
Abstract: 本申请实施例公开了一种基于大语言模型和知识图谱的检索生成方法及装置,可解决检索语义关联性弱、召回数据缺乏全局性知识的问题。该方法包括:对预设的多个领域文档进行向量解析,构建向量数据库;根据多个领域文档中提取出的实体描述信息和关系描述信息,构建知识图谱,并将知识图谱存储到图数据库中;对用户输入的目标问题进行特征提取,得到目标问题对应的多维度关键词;通过预设搜索引擎、向量数据库以及图数据库,对多维度关键词进行检索,得到目标检索结果;根据目标检索结果,确定目标输入信息,并将目标输入信息输入到目标语言模型中,得到目标输出响应信息。
-
公开(公告)号:CN119761336A
公开(公告)日:2025-04-04
申请号:CN202411820053.8
申请日:2024-12-11
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06F40/16 , G06N5/04 , G06N3/045 , G06N3/0475 , G06F18/25
Abstract: 本发明提供了一种图表问答模型的综合评测方法、设备及介质,涉及数据处理技术领域,方法根据预设图表问答任务类型列表和目标图表类型列表,获取初始图表数据列表集合的总集,根据初始图表数据、初始图表数据对应的预设图表问答任务类型的定义文本和目标多模态大模型,获取初始图表数据对应的问题文本列表和问题文本对应的标准答案文本,根据多线程处理方式、预设配置文件和图表问答模型,并行获取问题文本对应的目标答案文本,根据问题文本对应的标准答案文本和目标答案文本,获取图表问答模型对应的人工评分和自动评分,用于评测图表问答模型,能够评估多种图表问答任务类型的情况下图表问答模型的输出结果的准确性,可以满足用户的多样化需求。
-
公开(公告)号:CN119761333A
公开(公告)日:2025-04-04
申请号:CN202411891714.6
申请日:2024-12-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/186 , G06F40/194 , G06F40/30 , G06F18/214
Abstract: 本公开涉及一种基于大语言模型的公平竞争审查方法、装置、设备及介质。其中,基于大语言模型的公平竞争审查方法包括:获取待审文档;基于所述待审文档确定参考案例,并获取目标审查条例;根据预设指令模板,对所述待审文档、所述参考案例和所述目标审查条例进行处理,生成目标模型指令;对所述目标模型指令进行审查处理,得到对应的审查结论。根据本公开实施例,能够提高处理文档的判断准确性和可靠性,提供更为全面和深刻的审查结果。
-
-
-
-
-
-
-
-
-