-
公开(公告)号:CN115470341B
公开(公告)日:2023-03-24
申请号:CN202211359667.1
申请日:2022-11-02
Applicant: 中国电子技术标准化研究院 , 北京中科凡语科技有限公司
IPC: G06F16/335 , G06F16/332 , G06F21/62 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种网络目标条款筛选方法、装置、电子设备及存储介质,涉及数据处理技术领域,网络目标条款筛选方法包括:基于目标条款对应的第一关键词、第二关键词和目标条件,对待筛选隐私政策文本进行信息筛选,获取包括目标条款的第一目标段落作为待筛选隐私政策文本的筛选结果;第一关键词的优先级高于第二关键词的优先级。本发明提供的网络目标条款筛选方法、装置、电子设备及存储介质,能更高效地、更准确地对待筛选隐私政策文本进行信息筛选,能更高效、更准确地确定待筛选隐私政策文本中是否包含可能损害用户利益的不合理条款,有助于用户在使用APP之前更高效、更准确地了解上述APP的隐私政策文本中的关键信息,能提高用户感知。
-
公开(公告)号:CN115757774A
公开(公告)日:2023-03-07
申请号:CN202211370948.7
申请日:2022-11-03
Applicant: 中国电子技术标准化研究院 , 北京中科凡语科技有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本发明提供一种行业领域识别方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,该方法包括:获取待识别应用软件的隐私政策文本;对隐私政策文本中的段落进行分类,根据段落分类结果,将隐私政策文本中目标类型的段落确定为目标段落;提取目标段落中的目标词汇;基于目标段落中的目标词汇,确定待识别应用软件所属的行业领域。本发明提供的行业领域识别方法、装置、电子设备及存储介质,能提高待识别应用软件的隐私政策文本的解析效率和解析准确率,能基于待识别应用软件的隐私政策文本更准确、更高效的识别待识别应用软件所属的行业领域,能提高用户感知。
-
公开(公告)号:CN117909451B
公开(公告)日:2024-06-28
申请号:CN202410303716.2
申请日:2024-03-18
Applicant: 中国电子技术标准化研究院
IPC: G06F16/33 , G06F16/335 , G06F16/332 , G06F16/36 , G06F40/284 , G06F40/194 , G06F16/31
Abstract: 本发明提供一种问答结果溯源方法、装置、设备、介质及程序产品,涉及智能问答技术领域,所述方法包括:获取与问答结果对应的问答语句相关的N个段落文档;N为大于等于1的正整数;将N个段落文档和问答结果输入到词袋模型中,得到问答结果对应的溯源文档。本发明极大地提升了问答结果溯源的准确率。
-
公开(公告)号:CN118349715A
公开(公告)日:2024-07-16
申请号:CN202410297809.9
申请日:2024-03-15
Applicant: 中国电子技术标准化研究院
IPC: G06F16/951 , G06F16/953 , G06F40/279 , G06F8/30
Abstract: 本发明提供一种提升大模型代码能力的方法、装置、设备及存储介质,涉及人工智能技术领域,其中方法包括:爬取并清洗代码语料,将清洗后的代码语料和所述清洗后的代码语料对应的文本数据存入搜索引擎检索库;构建用户问题对应的查询语句,通过所述搜索引擎检索库获取所述查询语句的查询结果;基于所述查询语句的查询结果、所述用户问题与人工标注的输出结果,对大模型进行微调。从而微调后的大模型可以输出与用户问题更加相关且准确的代码内容,提升大模型的代码生成能力。
-
公开(公告)号:CN118349643A
公开(公告)日:2024-07-16
申请号:CN202410287402.8
申请日:2024-03-13
Applicant: 中国电子技术标准化研究院
IPC: G06F16/332 , G06N3/0985 , G06N3/045 , G06F16/31 , G06N5/04
Abstract: 本申请提供一种提高模型安全性的方法、装置及存储介质。该提高模型安全性的方法涉及自然语言处理技术领域,包括:构建安全语料库;基于所述安全语料库对预训练大语言模型进行低秩适配器Lora微调训练,得到目标Lora权重;将所述目标Lora权重合并至待处理模型中;所述待处理模型指与所述预训练大语言模型同类型、同规模并且同参数量的待提高安全性的大语言模型。本申请提供的提高模型安全性的方法、装置及存储介质,不需要重复对大模型进行继续预训练和微调,而是直接将低秩适配器的权重合并到待处理模型,实现高效提高模型的安全性。
-
公开(公告)号:CN115470341A
公开(公告)日:2022-12-13
申请号:CN202211359667.1
申请日:2022-11-02
Applicant: 中国电子技术标准化研究院 , 北京中科凡语科技有限公司
IPC: G06F16/335 , G06F16/332 , G06F21/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种网络目标条款筛选方法、装置、电子设备及存储介质,涉及数据处理技术领域,网络目标条款筛选方法包括:基于目标条款对应的第一关键词、第二关键词和目标条件,对待筛选隐私政策文本进行信息筛选,获取包括目标条款的第一目标段落作为待筛选隐私政策文本的筛选结果;第一关键词的优先级高于第二关键词的优先级。本发明提供的网络目标条款筛选方法、装置、电子设备及存储介质,能更高效地、更准确地对待筛选隐私政策文本进行信息筛选,能更高效、更准确地确定待筛选隐私政策文本中是否包含可能损害用户利益的不合理条款,有助于用户在使用APP之前更高效、更准确地了解上述APP的隐私政策文本中的关键信息,能提高用户感知。
-
公开(公告)号:CN117891927A
公开(公告)日:2024-04-16
申请号:CN202410295644.1
申请日:2024-03-15
Applicant: 中国电子技术标准化研究院
IPC: G06F16/332 , G06F40/289 , G06F16/31
Abstract: 本发明提供一种基于大语言模型的问答方法、装置、电子设备及存储介质,属于自然语言处理技术领域,该方法包括:将待答复多模态提问信息中的非文本信息转化为对应的第二文本信息;分别从目标文本库中检索出与待答复多模态提问信息中的第一文本信息相匹配的第一文本结果,以及与第二文本信息相匹配的第二文本结果;目标文本库是基于第一文本信息和第二文本信息构建的;利用预设大语言模型,基于第一文本信息、第一文本结果和第二文本结果,确定待答复多模态提问信息对应的答复信息。本发明可以实现针对多模态提问信息的高效准确回答,不需要额外增加大语言模型的训练成本,有效缓解了大语言模型容易出现的事实性幻觉问题。
-
公开(公告)号:CN115757774B
公开(公告)日:2024-09-24
申请号:CN202211370948.7
申请日:2022-11-03
Applicant: 中国电子技术标准化研究院 , 北京中科凡语科技有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本发明提供一种行业领域识别方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,该方法包括:获取待识别应用软件的隐私政策文本;对隐私政策文本中的段落进行分类,根据段落分类结果,将隐私政策文本中目标类型的段落确定为目标段落;提取目标段落中的目标词汇;基于目标段落中的目标词汇,确定待识别应用软件所属的行业领域。本发明提供的行业领域识别方法、装置、电子设备及存储介质,能提高待识别应用软件的隐私政策文本的解析效率和解析准确率,能基于待识别应用软件的隐私政策文本更准确、更高效的识别待识别应用软件所属的行业领域,能提高用户感知。
-
公开(公告)号:CN117891927B
公开(公告)日:2024-06-28
申请号:CN202410295644.1
申请日:2024-03-15
Applicant: 中国电子技术标准化研究院
IPC: G06F16/332 , G06F40/289 , G06F16/31
Abstract: 本发明提供一种基于大语言模型的问答方法、装置、电子设备及存储介质,属于自然语言处理技术领域,该方法包括:将待答复多模态提问信息中的非文本信息转化为对应的第二文本信息;分别从目标文本库中检索出与待答复多模态提问信息中的第一文本信息相匹配的第一文本结果,以及与第二文本信息相匹配的第二文本结果;目标文本库是基于第一文本信息和第二文本信息构建的;利用预设大语言模型,基于第一文本信息、第一文本结果和第二文本结果,确定待答复多模态提问信息对应的答复信息。本发明可以实现针对多模态提问信息的高效准确回答,不需要额外增加大语言模型的训练成本,有效缓解了大语言模型容易出现的事实性幻觉问题。
-
公开(公告)号:CN117909451A
公开(公告)日:2024-04-19
申请号:CN202410303716.2
申请日:2024-03-18
Applicant: 中国电子技术标准化研究院
IPC: G06F16/33 , G06F16/335 , G06F16/332 , G06F16/36 , G06F40/284 , G06F40/194 , G06F16/31
Abstract: 本发明提供一种问答结果溯源方法、装置、设备、介质及程序产品,涉及智能问答技术领域,所述方法包括:获取与问答结果对应的问答语句相关的N个段落文档;N为大于等于1的正整数;将N个段落文档和问答结果输入到词袋模型中,得到问答结果对应的溯源文档。本发明极大地提升了问答结果溯源的准确率。
-
-
-
-
-
-
-
-
-