Patent search ap:("联通在线信息科技有限公司") AND inv:"王振波" Page 2

11.

发明授权
行业智能体自动微调方法、装置、电子设备及存储介质有权

公开(公告)号：CN119250108B

公开(公告)日：2025-03-04

申请号：CN202411765259.5

申请日：2024-12-04

Applicant: 联通在线信息科技有限公司

Inventor： 肖清 , 王振波 , 郭熹 , 张振字 , 罗刚 , 张立业 , 熊梅艳

IPC: G06N3/006 , G06N5/01 , G06N5/04 , G06F18/10 , G06F18/214 , G06F18/243

Abstract: 本发明涉及行业智能体自动微调方法、装置、电子设备及存储介质，该方法包括：对行业数据进行预处理。采用思维链和思维树构建初始指令响应对，通过投机推理根据初始指令响应对生成包含多个步骤的第一指令响应对，对每个步骤进行校验。通过指令编码器从第一指令响应对中抽取元知识，通过元知识引导指令编码器生成第二指令响应对。对第二指令响应对进行评估，获取第二指令响应对的评估分数，去除评估分数低于第一阈值的第二指令响应对。通过相似度判别将差异度超过第二阈值的第二指令响应对加入微调数据集，丢弃差异度低于第二阈值的第二指令响应对。基于微调数据集中的第二指令响应对结合行业数据的指令数据集对面向行业应用的语言模型进行微调。

12.

发明授权
一种基于RAG与知识图谱的多轮对话处理方法和系统有权

公开(公告)号：CN118885627B

公开(公告)日：2025-03-04

申请号：CN202411366822.1

申请日：2024-09-29

Applicant: 联通在线信息科技有限公司

Inventor： 郭熹 , 王振波 , 张振宇 , 王冠 , 李阳 , 张立业

IPC: G06F16/432 , G06F16/9032 , G06F40/295 , G06N5/022 , G06N5/04 , G06N3/0455 , G06N3/0464 , G06N3/0495 , G06N3/084

Abstract: 本发明属于人工智能技术领域，提供一种基于RAG与知识图谱的多轮对话处理方法和系统。该方法包括：根据专有知识图谱，对与用户问题相关联的实体进行检索识别，得到关联实体，以构建推理链路，并转换为推理文本序列；通过多模态大模型检索与用户问题相关的文本、图片、音频数据，得到相关多模态数据；将相关多模态数据、当前推理文本序列、用户问题与所生成的回答文本进行整合后作为模型输入，输入多模态大模型，得到模型回答；筛选出相关的多模态数据，以所筛选出的多模态数据作为上下文、待处理问题一起作为多模态大模型的模型输入，得到与待处理问题相对应的回答文本。本发明能在减少交互的同时，有效将用户意图与回答文本对齐。

13.

发明公开
一种基于AI反馈的强化学习对齐模型训练方法和系统有权

公开(公告)号：CN118735002A

公开(公告)日：2024-10-01

申请号：CN202411229238.1

申请日：2024-09-03

Applicant: 联通在线信息科技有限公司

Inventor： 郭熹 , 王振波 , 王冠 , 李阳 , 张立业

IPC: G06N20/00 , G06F40/166 , G06F40/205 , G06N3/006 , G06N5/04 , G06F16/335 , G06F16/35

Abstract: 本发明属于人工智能技术领域，提供一种基于AI反馈的强化学习对齐模型训练方法和系统。该方法包括：收集与医疗领域方向相关的文本数据，进行初步处理；确定偏好数据集，提取与用户行为和文本上下文相关特征，进一步形成聚合特征，生成聚合特征向量，形成模型生成数据集，进行筛选得到目标数据集，进一步划分为训练集、验证集和测试集；采用大语言模型，结合COT与RAG方法，采用上下文学习的方式生成偏好标签，建立文本分类模型，获得目标预训练模型，构建基于AI反馈的策略模型，对策略模型进行强化学习，并使用RM模型作为响应分配奖励，得到目标领域模型；接收待处理用户查询，得到相匹配的推荐列表。本发明能精确为用户匹配推荐列表。

14.

发明公开
一种提取文本内容生成融合信息模板的方法审中-实审

公开(公告)号：CN116757171A

公开(公告)日：2023-09-15

申请号：CN202310626646.X

申请日：2023-05-31

Applicant: 联通在线信息科技有限公司

Inventor： 张振宇 , 刘艳伟 , 王振波

IPC: G06F40/186 , G06F40/216

Abstract: 本发明涉及一种提取文本内容生成融合信息模板的方法，包括以下步骤：获取原始文本数据；以预设标签为处理单元；根据预设标签的内容采用文本密度算法从所述原始文本数据中提取包含中文字符数量最多的正文；对提取的正文的字符数值进行判断，当所述字符数值小于或等于所述融合信息模板预设的内容摘要字符数值，所述提取的正文作为内容摘要输入所述融合信息模板，当所述字符数值大于所述融合信息模板预设的内容摘要字符数值，将提取的正文进行提取中心词，并将中心词作为内容摘要输入所述融合信息模板。其解决了提取正文时仅通过定义标签和标签过滤来进行信息的提取，提取到的信息中存在大量无关内容且语义复杂不够精准的技术问题。

15.

发明公开
项目程序升级包的生成方法、装置、设备及存储介质审中-实审

公开(公告)号：CN119512590A

公开(公告)日：2025-02-25

申请号：CN202411356268.9

申请日：2024-09-27

Applicant: 联通在线信息科技有限公司

Inventor： 张振宇 , 王振波 , 郭熹

IPC: G06F8/65

Abstract: 本发明涉及一种项目程序升级包的生成方法、装置、设备及存储介质，涉及服务端程序更新技术领域。方法主要包括：响应于开发人员在代码库触发的项目程序升级包生成指令，通过项目程序中各个模块的配置文件加载依赖关系数据；根据各个模块的依赖关系数据构建树形结构数据，所述树形结构数据用于表示所述项目程序中各模块之间的层级关系；遍历所述树形结构数据，根据所述项目程序升级包生成指令中的目标版本号确定所述项目程序中待升级的模块；对所述待升级的模块进行打包得到所述目标版本号的项目程序升级包。通过本发明生成的项目程序升级包可提高项目程序增量升级的效率。

16.

发明公开
一种基于RAG与知识图谱的多轮对话处理方法和系统有权

公开(公告)号：CN118885627A

公开(公告)日：2024-11-01

申请号：CN202411366822.1

申请日：2024-09-29

Applicant: 联通在线信息科技有限公司

Inventor： 郭熹 , 王振波 , 张振宇 , 王冠 , 李阳 , 张立业

IPC: G06F16/432 , G06F16/9032 , G06F40/295 , G06N5/022 , G06N5/04 , G06N3/0455 , G06N3/0464 , G06N3/0495 , G06N3/084

Abstract: 本发明属于人工智能技术领域，提供一种基于RAG与知识图谱的多轮对话处理方法和系统。该方法包括：根据专有知识图谱，对与用户问题相关联的实体进行检索识别，得到关联实体，以构建推理链路，并转换为推理文本序列；通过多模态大模型检索与用户问题相关的文本、图片、音频数据，得到相关多模态数据；将相关多模态数据、当前推理文本序列、用户问题与所生成的回答文本进行整合后作为模型输入，输入多模态大模型，得到模型回答；筛选出相关的多模态数据，以所筛选出的多模态数据作为上下文、待处理问题一起作为多模态大模型的模型输入，得到与待处理问题相对应的回答文本。本发明能在减少交互的同时，有效将用户意图与回答文本对齐。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification