词向量模型的构建方法、关键词匹配方法及装置

    公开(公告)号:CN109614478B

    公开(公告)日:2020-12-08

    申请号:CN201811552104.8

    申请日:2018-12-18

    Abstract: 本申请实施例涉及一种词向量模型的构建方法、关键词匹配方法及装置,所述方法包括:选取目标关键词,以及与所述目标关键词对应的一个或多个目标文档数据;基于所述目标关键词从网络上获取与所述目标关键词关联的多个关联文档数据;将所述目标文档数据和符合训练条件的关联文档数据作为训练文本,采用Gensim的Word2vec API对所述训练文本进行训练,得到词向量模型,其中,所述符合训练条件的关联文档数据为:与所述目标文档数据的相似度大于第一阈值的所述关联文档数据。该模型在训练过程中,结合选定的目标文档数据,以及通过目标文档数据再选定关联文档数据中符合训练条件的文档数据,提高了该模型的准确性。

    一种新闻流行度预测方法、设备和存储介质

    公开(公告)号:CN110334275B

    公开(公告)日:2020-12-04

    申请号:CN201910471730.2

    申请日:2019-05-31

    Abstract: 本发明公开了一种新闻流行度预测方法、设备和存储介质。该方法包括:获取待预测信息;按照预先确定的流行度影响特征类别,提取所述待预测信息的流行度影响特征;将所述流行度影响特征输入预先训练的集成了多个预测模型的多模型预测器中,获得所述多模型预测器输出的所述待预测信息的流行度。本发明使用集成了多个预测模型的多模型预测器对待预测信息进行信息流行度预测,采用多模型预测器预测信息流行度不仅可以提高预测模型预测结果的稳定性,还可以显著提高预测模型的预测性能,使得流行度预测更加稳定,预测结果更加精准。

    一种品牌综合影响度评估方法、系统及存储介质

    公开(公告)号:CN109800960A

    公开(公告)日:2019-05-24

    申请号:CN201811602925.8

    申请日:2018-12-26

    Abstract: 本发明涉及一种品牌综合影响度评估方法、系统及存储介质。解决了现有的品牌综合影响度评估方法误差大,效率低的问题,本发明实施例包括获取品牌的传播力、影响力和转换力,并跟别获取传播力预设权重、影响力预设权重和转换力预设权重,根据所述品牌的传播力、影响力、转换力和传播力预设权重、影响力预设权重和转换力预设权重计算品牌综合影响度;本发明将网络舆情影响程度定量评价指标体系与品牌综合评价指标体系相结合,提出了一个新的品牌指数评估体系,使用方便,结合融媒体传播的时效性,灵活智能地运用品牌指数的统计算法,有效提升了评估的准确性和智能性,实现了融媒体平台品牌指数的智能性量化评估。

    一种基于多模态大模型的图表处理方法

    公开(公告)号:CN120088802A

    公开(公告)日:2025-06-03

    申请号:CN202510250211.9

    申请日:2025-03-04

    Abstract: 本申请涉及电数字数据处理技术领域,特别是涉及一种基于多模态大模型的图表处理方法。该方法包括:获取目标图表的上下文关键信息;根据用户输入的初始问题获取所述初始问题的问题类型;根据所述初始问题的问题类型和目标图表的类型从目标图表的上下文关键信息中筛选与所述初始问题的问题类型和目标图表的类型关联的信息;根据筛选得到的与所述初始问题的问题类型和目标图表的类型关联的信息和所述初始问题构建与所述初始问题对应的目标问题;将所述目标问题和目标图表输入多模态大模型,将多模态大模型的输出确定为所述初始问题对应的答案。本发明能够提高模型输出结果的准确性和效率。

    一种基于大模型的树形结构知识构建方法、设备及介质

    公开(公告)号:CN119886307A

    公开(公告)日:2025-04-25

    申请号:CN202510070907.3

    申请日:2025-01-16

    Abstract: 本发明提供了一种基于大模型的树形结构知识构建方法、设备及介质,涉及人工智能技术领域,所述方法包括:初始化栈,并创建栈的根节点,获取目标文章的第i行文本;若第i行文本是标题,获取目标文章的第i行文本的标题类型,按照从栈顶到栈底的顺序遍历栈中的子节点,若存在子节点与第i行文本的标题类型相同,将该子节点标记为相同类型节点,并将从栈顶到相同类型节点的全部节点出栈,若栈为空,将第i行文本作为根节点的子节点,并将第i行文本入栈;若栈不为空,获取栈的栈顶,将第i行文本作为栈顶的子节点,并将第i行文本入栈,直到目标文章的所有行遍历完成,生成目标文章的解析树;从而更加高效且准确的获取到目标文章的解析树。

    基于上下文的大语言模型对话处理方法、装置及电子设备

    公开(公告)号:CN119831045A

    公开(公告)日:2025-04-15

    申请号:CN202411915111.5

    申请日:2024-12-24

    Abstract: 本申请实施例公开了一种基于上下文的大语言模型对话处理方法、装置及电子设备,可解决如何提供一种基于上下文相似度分析与智能筛选的动态管理方法来优化大语言模型交互的问题。该方法包括:获取用户输入的当前文本信息;对当前文本信息和预存的多个历史对话信息分别进行编码,得到当前文本向量和多个历史对话向量;根据每个历史对话向量和当前文本向量之间的语义相似度,对多个历史对话向量进行筛选,得到筛选后的目标历史对话信息;将当前文本信息和筛选后的目标历史对话信息进行拼接,得到目标输入文本;将目标输入文本输入到目标语言模型中,得到目标输出响应信息,目标语言模型包括大语言模型。

    一种大模型问答的知识溯源方法、装置、介质和设备

    公开(公告)号:CN119829717A

    公开(公告)日:2025-04-15

    申请号:CN202411905240.6

    申请日:2024-12-23

    Abstract: 本申请涉及人工智能技术领域,特别是涉及一种大模型问答的知识溯源方法、装置、介质和设备。包括:获取大模型问答生成的待溯源文本;根据目标问题和目标任务模式对应的每一置信数据源,得到初始知识载体列表C;根据待溯源文本和C,得到关键知识载体列表M;根据待溯源文本和M,得到关键知识片段匹配度列表集DP;若MAX(DPj)<EP;则将Mj从M中删除;否则不删除,以更新M,得到目标知识载体列表G。本申请提高了知识溯源的准确性,减少了溯源的工作量。且节约了计算机资源,能够为待溯源文本提供较为准确的溯源知识载体,使得用户能够获取大模型问答输出结果的知识来源,辅助用户对于大模型问答输出结果的置信度的判断。

Patent Agency Ranking