-
公开(公告)号:CN118779507A
公开(公告)日:2024-10-15
申请号:CN202410916307.X
申请日:2024-07-09
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/9532 , G06F16/958 , G06F40/186 , G06F40/247 , G06F40/30
Abstract: 本申请提供一种面向专家画像的信息追踪方法及装置,方法包括:基于专家信息库中的目标专家的基础专家数据以及该目标专家的简历数据,采用大语言模型获取针对简历数据的缺失信息查询式;应用缺失信息查询式在网络中查找缺失信息关联网页并识别得到目标网页文本数据;对目标网页文本数据和文档数据进行针对用于表示缺失信息的缺失数据的提取、汇总和验证,并验证新增专家属性描述短语及其的语义信息,再基于专家评审规则确定新增专家属性描述短语的标签等级。本申请能够提高面向专家画像的信息追踪的全面性及准确性;并能够提高面向专家画像的信息追踪的效率、准确性以及可靠性,进而能够提高专家画像更新或构建的实时性、准确性及全面性。
-
公开(公告)号:CN118467731A
公开(公告)日:2024-08-09
申请号:CN202410537756.3
申请日:2024-04-30
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/35 , G06F16/36 , G06F40/284 , G06Q50/18
Abstract: 本申请公开了一种科技发展脉络的提取方法、装置、电子设备和存储介质,该方法和装置应用于电子设备,具体为获取目标技术领域的多个文献数据;对多个文献数据进行数据提取、合并和关系构建处理,得到多类短语和短语之间的短语关系;基于多类短语和短语关系构建知识图谱;对知识图谱进行层次聚类处理,得到目标技术领域的科技发展脉络。本申请的技术方案无需科研人员通过自身的经历和掌握的局部信息对科技演化过程进行描述,即可使其得到客观全面的科技演化路径,从而使其能够了解相应领域内存在的细分领域和先进的研究方法。
-
公开(公告)号:CN118779507B
公开(公告)日:2025-02-11
申请号:CN202410916307.X
申请日:2024-07-09
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/9532 , G06F16/958 , G06F40/186 , G06F40/247 , G06F40/30
Abstract: 本申请提供一种面向专家画像的信息追踪方法及装置,方法包括:基于专家信息库中的目标专家的基础专家数据以及该目标专家的简历数据,采用大语言模型获取针对简历数据的缺失信息查询式;应用缺失信息查询式在网络中查找缺失信息关联网页并识别得到目标网页文本数据;对目标网页文本数据和文档数据进行针对用于表示缺失信息的缺失数据的提取、汇总和验证,并验证新增专家属性描述短语及其的语义信息,再基于专家评审规则确定新增专家属性描述短语的标签等级。本申请能够提高面向专家画像的信息追踪的全面性及准确性;并能够提高面向专家画像的信息追踪的效率、准确性以及可靠性,进而能够提高专家画像更新或构建的实时性、准确性及全面性。
-
公开(公告)号:CN119025668A
公开(公告)日:2024-11-26
申请号:CN202411109959.9
申请日:2024-08-13
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/335 , G06F16/31 , G06F16/33 , G06N3/0455
Abstract: 本申请公开了一种基于研究方向的实体匹配方法、装置、设备以及存储介质。该方法包括:获取待匹配研究方向词;采用2GRAM模型分别对待匹配研究方向词和学术主题词库中学术主题词进行切分处理,得到待匹配研究方向词对应的第一双对序列和学术主题词各自对应的第二双字对序列;将每个第二双字对序列分别与第一双对序列进行相似度比对以从学术主题词库中确定多个待匹配学术主题词;采用BERT模型依次对待匹配研究方向词与待匹配学术主题词进行文本向量化处理,并计算得到的待匹配学术主题向量与待匹配研究方向向量的相似度,确定出一个待匹配学术主题词作为目标学术主题词。本申请的方法提高了研究方向实体匹配的效率。
-
公开(公告)号:CN118966222A
公开(公告)日:2024-11-15
申请号:CN202411037378.9
申请日:2024-07-30
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F40/295 , G06F18/214 , G06F18/2411 , G06N3/0442 , G06F18/213
Abstract: 本申请公开了一种基于专家信息的实体抽取方法、装置、设备以及存储介质。该方法包括:从公共资源中获取目标专家信息的文本序列;采用训练好的命名实体识别模型对目标专家信息的文本序列进行标注,确定目标文本序列;目标文本序列为具有实体类型标记的文本序列;其中,训练好的命名实体识别模型中嵌入层采用BERT模型对目标专家信息的文本序列进行文本向量化,编码层采用BiLSTM模型提取语义特征后输出层采用CRF模型确定出目标文本序列;并对目标文本序列进行实体抽取以获取目标专家信息中每个实体类型对应的文本信息,并以结构化数据形式进行存储。本申请的方法能够获取结构化的专家信息,提高了信息获取的效率,避免浪费人力物力。
-
公开(公告)号:CN113590800B
公开(公告)日:2024-03-08
申请号:CN202110966233.7
申请日:2021-08-23
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/583 , G06V10/774 , G06V10/82 , G06N3/044 , G06N3/0455 , G06N3/08
-
公开(公告)号:CN116561265A
公开(公告)日:2023-08-08
申请号:CN202310140734.9
申请日:2023-02-14
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/335 , G06F18/214
Abstract: 本申请公开了一种个性化对话生成方法和模型训练方法以及设备,其中,模型训练方法包括:获取样本数据和个性化信息集合;所述样本数据包括对话过程文本数据和相应的个性化信息标签;个性化信息集合包含每个对话个体的个性化信息,所述对话个体为样本数据中的对话参与者;利用个性化对话生成模型,基于所述样本数据和个性化信息集合,为相应对话过程中的每轮对话,生成系统回复语句;其中,基于当前的对话历史和个性化信息集合,预测当前对话需要表现的个性化信息,基于预测结果、对话历史和个性化信息集合,生成系统回复语句,并利用相应的损失函数值,优化调整个性化对话生成模型参数。采用本申请,可以提高回复生成的个性化且具有可解释性。
-
公开(公告)号:CN112990302B
公开(公告)日:2023-03-21
申请号:CN202110266563.5
申请日:2021-03-11
Applicant: 北京邮电大学
IPC: G06V10/774 , G06V10/74 , G06N20/00 , G06T11/00
Abstract: 本申请公开了一种基于文本生成图像的模型训练方法、设备和图像生成方法,其中方法包括基于预设训练样本集合中各训练样本的文本信息,生成文本嵌入式表示,将所述文本嵌入式表示输入至图像生成模型,触发图像生成模型基于该文本嵌入式表示,生成人造图像,并采用模态解纠缠方式,提取人造图像的真实度参数和相应训练样本的真实图像的真实度参数;基于所述人造图像,确定所述训练样本的正例和负例;利用所述图像生成模型,基于每个训练样本的正例、负例和真实图像各自对应的所述真实度参数,计算总体损失函数;利用所述总体损失函数,调整所述图像生成模型的参数。采用本申请可以提高模型学习效率和图像生成效果。
-
公开(公告)号:CN114706955A
公开(公告)日:2022-07-05
申请号:CN202210361738.5
申请日:2022-04-07
Applicant: 北京邮电大学
IPC: G06F16/33 , G06F16/332 , G06K9/62
Abstract: 本申请公开了一种对话响应生成模型的训练方法和装置及对话响应生成方法,其中训练方法包括:获取预设的样本数据和文档库,所述样本数据包括对话过程数据以及每轮对话的正确文档标签和话题保持标签;利用对话响应生成模型,遍历所述对话过程数据对应的每轮对话,基于在该轮对话的响应信息之前已产生的对话历史数据和所述文档库,生成该轮对话的响应信息,并基于所述样本数据中的相应标签,计算损失函数值,利用所述损失函数值,对所述对话响应生成模型的参数进行优化调整;其中,在进行所述生成时,采用二次相关方式,基于当前的话题保持状况,从所述文档库中选取用于生成所述响应信息的最相关文档。采用本申请,可以提高对话的回复质量。
-
公开(公告)号:CN113705222A
公开(公告)日:2021-11-26
申请号:CN202111018750.8
申请日:2021-09-01
Applicant: 北京邮电大学
IPC: G06F40/284 , G06F40/126 , G06F16/35 , G06K9/62
Abstract: 本申请公开了一种槽识别模型训练方法及装置和槽填充方法及装置,其中,槽识别模型训练方法包括:将训练样本的文本数据输入至预先构建的槽识别模型;槽识别模型对所述文本数据进行编码,得到所述文本数据中每个词的词向量;基于词向量进行粗标签分类,得到相应词的粗标签得分向量;其中,粗标签预先基于槽值的词性类别对槽进行分类得到;基于词向量以及词向量对应的粗标签得分向量,生成相应词的高级细标签得分向量;将高级细标签得分向量,输入至模型的条件随机场层处理,得到相应的细标签分类损失值;基于细标签分类损失值,调整模型的网络参数。采用本申请,能够实现零样本跨领域槽填充,且可以提高填充的准确性。
-
-
-
-
-
-
-
-
-