政务领域大模型可信文本生成方法、装置及存储介质

    公开(公告)号:CN116911289A

    公开(公告)日:2023-10-20

    申请号:CN202311176752.9

    申请日:2023-09-13

    Abstract: 本申请公开了一种政务领域大模型可信文本生成方法、装置及存储介质。本申请方法包括:构建问题数据以及对应的知识数据;将问题数据以及知识数据构建成可控Prompt模板;将问题数据插入至预先配置的空白Prompt模板中,得到语义近似Prompt模板;将语义近似Prompt模板输入至目标大模型中,得到语义近似问题数据,语义近似问题数据与问题数据语义近似;将可控Prompt模板、问题数据、知识数据以及语义近似问题数据按照不同的组合方式构建映射数据集;以映射数据集作为目标大模型的输入,对目标大模型进行微调;在使用微调后的目标大模型时,将目标大模型输出的实时答案输入至预先构建的判别过滤器中执行负面判别,并将判别后的内容向用户输出。

    非结构化文本与知识图谱的语义匹配方法及装置

    公开(公告)号:CN116821712A

    公开(公告)日:2023-09-29

    申请号:CN202311076294.1

    申请日:2023-08-25

    Inventor: 蔡惠民

    Abstract: 本发明公开了一种非结构化文本与知识图谱的语义匹配方法及装置,该方法包括:获取非结构化文本;对非结构化文本进行实体和位置的协同抽取,得到各实体及所述实体在文本中的开始和结束位置;利用所述非结构化文本、所述实体及所述实体在文本中的开始和结束位置,确定所述实体的文本特征向量;依次将知识图谱中各实体作为候选实体,根据所述实体的文本特征向量依次计算所述实体与所述候选实体的匹配度;根据所述匹配度确定匹配实体。利用本发明方案,可以实现非结构化文本与知识图谱的语义融合需求,降低人工标注成本,并保证实体匹配准确率。

    文本摘要生成方法、装置、存储介质及电子设备

    公开(公告)号:CN116108165A

    公开(公告)日:2023-05-12

    申请号:CN202310347275.1

    申请日:2023-04-04

    Abstract: 本发明提供了一种文本摘要生成方法、装置、存储介质及电子设备,其中,该方法包括:提取目标文本中的关键词;基于具有关键词的原始词序列中的关键词的重要程度对相应的关键词进行数量扩展,得到目标句子的有效词序列;根据有效词序列确定目标句子与其他目标句子之间的相关度;根据该相关度确定目标句子的影响权重;基于影响权重最高的多个目标句子形成目标文本的文本摘要。本发明实施例提供的技术方案,先提取出关键词,进而确定关键词数量扩展后的有效词序列,基于该有效词序列可以更准确地表示在需要提取文本摘要时所需的目标句子之间的相关度,从而可以更准确地确定目标句子的影响权重,进而能够更准确地提取出文本摘要。

    一种基于特征向量匹配的数据识别方法、装置及存储介质

    公开(公告)号:CN119513674B

    公开(公告)日:2025-05-13

    申请号:CN202510089450.0

    申请日:2025-01-21

    Abstract: 本申请公开了一种基于特征向量匹配的数据识别方法、装置及存储介质。包括:获取待检测数据,分词生成特征向量;通过矩阵运算计算待匹配特征向量与预定义核心数据特征向量的欧氏距离,统计匹配数量;根据描述信息、表描述信息和字段描述信息的权重(分别为0.2、0.5、0.3),计算数据权重值;结合匹配结果和数据规模,通过加权计算得到待检测数据属于核心或重要数据的概率值;判断概率值是否超过阈值,若超过,则识别为核心或重要数据。本方法依托可信执行环境TEE实现特征向量的提取、匹配及计算,避免待检测数据和核心数据特征库暴露。确保计算过程的真实性和可信性。TEE相对其他隐私计算技术,具有额外计算少的优点,可以提升算法匹配效率。

    基于分块加密的数据安全共享方法、装置及系统

    公开(公告)号:CN119210902A

    公开(公告)日:2024-12-27

    申请号:CN202411707270.6

    申请日:2024-11-27

    Abstract: 本发明提供一种基于分块加密的数据安全共享方法、装置及系统,该方法包括:数据中心对数据信息进行分块,对每个数据块进行加密得到数据块密文,将数据块密文上传至云服务器进行存储,并在本地保存分块信息以及目录信息;接收到数据使用方发布的数据需求信息后,根据本地保存的分块信息以及目录信息确定满足需求的待共享数据;对数据使用方进行身份验证、并判断数据使用方的私钥是否合法以及请求数据是否合规;在验证及判断通过后向监管中心发送共享数据请求,以使监管中心利用自己的私钥生成数据共享令牌及签名,并发送给数据使用方。利用本发明方案,可以使数据得到安全可靠的共享。

    一种基于多智能体协同的事件抽取方法、系统及装置

    公开(公告)号:CN119005195B

    公开(公告)日:2024-12-20

    申请号:CN202411481454.5

    申请日:2024-10-23

    Abstract: 本申请公开了一种基于多智能体协同的事件抽取方法、系统及装置。该方法包括:接收非结构化数据,第一智能体调用至少一个第二智能体识别实体及其类型,并将结果存储至信息池中;调用至少一个第三智能体识别触发词及对应的事件类型,并存储至信息池中;解析触发词和事件类型,生成论元角色集合;第四智能体对论元角色进行识别,并将结果存储至信息池中;将非结构化数据切分为句子、段落和篇章等不同粒度的文本单元,生成对应的上下文提示信息Prompt;调用智能体对各粒度文本进行事件识别,融合不同粒度的事件信息,生成最终的事件抽取结果。通过多智能体协同工作,实现了更精确的事件识别与信息整合,提高了事件抽取的准确性和效率。

    一种基于多智能体协同的事件抽取方法、系统及装置

    公开(公告)号:CN119005195A

    公开(公告)日:2024-11-22

    申请号:CN202411481454.5

    申请日:2024-10-23

    Abstract: 本申请公开了一种基于多智能体协同的事件抽取方法、系统及装置。该方法包括:接收非结构化数据,第一智能体调用至少一个第二智能体识别实体及其类型,并将结果存储至信息池中;调用至少一个第三智能体识别触发词及对应的事件类型,并存储至信息池中;解析触发词和事件类型,生成伦元角色集合;第四智能体对伦元角色进行识别,并将结果存储至信息池中;将非结构化数据切分为句子、段落和篇章等不同粒度的文本单元,生成对应的上下文提示信息Prompt;调用智能体对各粒度文本进行事件识别,融合不同粒度的事件信息,生成最终的事件抽取结果。通过多智能体协同工作,实现了更精确的事件识别与信息整合,提高了事件抽取的准确性和效率。

Patent Agency Ranking