-
公开(公告)号:CN118839679A
公开(公告)日:2024-10-25
申请号:CN202310450811.0
申请日:2023-04-24
Applicant: 富士通株式会社
IPC: G06F40/186 , G06F16/335 , G06F16/36 , G06N20/00
Abstract: 本申请公开了进行提示微调训练的方法、关系抽取的方法及相关装置。对预训练模型进行提示微调训练的方法,包括:基于原始训练集得到包括多个候选关系模板的候选关系模板集;针对所述原始训练集中的每个关系,基于每个关系与候选关系模板集中的每个候选关系模板的相关度来选择关系模板;针对每个关系,基于选择的关系模板来生成多个假设;基于生成的多个假设生成多个提示模板;基于多个提示模板和原始训练集生成新训练集;以及利用掩码语言模型在新训练集上对预训练模型进行提示微调训练,以生成提示微调预训练模型。
-
公开(公告)号:CN114860943A
公开(公告)日:2022-08-05
申请号:CN202110153759.3
申请日:2021-02-04
Applicant: 富士通株式会社
IPC: G06F16/36 , G06F16/383 , G06F40/242 , G06F40/247 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本公开内容涉及用于规范化生物医学实体提及的方法、装置以及存储介质。根据本公开内容的一个实施例,该方法包括:接收生物医学实体提及作为待映射提及;通过检索生物医学词典生成待映射提及的候选概念集;确定候选概念集中是否包括与待映射提及相同的概念;在确定结果为“否”的情况下,通过针对候选概念集中的每个候选概念,基于从生物医学词典获得的相关概念集扩展该候选概念来更新候选概念集;通过确定更新的候选概念集中每个候选概念与待映射提及的语义相似度来获得语义相似度集;以及将待映射提及映射到语义相似度集中的最大语义相似度所对应的候选概念。本公开内容的方法、装置和存储介质的有益效果至少包括:提高确定规范概念的准确度。
-
公开(公告)号:CN108572960A
公开(公告)日:2018-09-25
申请号:CN201710134401.X
申请日:2017-03-08
Applicant: 富士通株式会社
Abstract: 本发明公开了一种地名消岐方法和地名消岐装置。根据一个具体实施示例的地名消岐方法包括:从文本中提取待消岐地名和所述待消岐地名的上下文;从关联开放数据中检索与所述待消岐地名相关的候选地名实体;以及根据所述上下文与候选地名实体的相似度、所述待消岐地名指向候选地名实体的相对重要性、以及所述上下文与候选地名实体的属性值中所包含的关联实体之间的匹配程度中的至少一个从所述候选地名实体中选择待消岐地名实际所指的地名实体。
-
公开(公告)号:CN107765883A
公开(公告)日:2018-03-06
申请号:CN201610702677.9
申请日:2016-08-22
Applicant: 富士通株式会社
CPC classification number: G06F3/0233 , G06F17/278 , G06F17/2785
Abstract: 本发明公开了一种输入法的候选词语的排序方法和排序设备。该排序方法包括:获得与当前输入对应的多个候选词语;确定多个候选词语中的每一个候选词语与参考词语之间的语义相关度;以及根据所确定的语义相关度,对多个候选词语进行排序;其中,确定多个候选词语中的每一个候选词语与参考词语之间的语义相关度包括:针对每一个候选词语,计算其语义向量与参考词语的语义向量的相似度之和或平均相似度,作为所述语义相关度;其中,所述每一个候选词语的语义向量通过如下步骤获得:将所述每一个候选词语链接到预定知识库中的一个或多个候选实体;以及将所述候选实体的描述输入到语义模型,以得到对应的语义向量。
-
公开(公告)号:CN111241380B
公开(公告)日:2023-10-03
申请号:CN201811434074.0
申请日:2018-11-28
Applicant: 富士通株式会社
IPC: G06F16/9535
Abstract: 公开了用于生成推荐的方法和设备。该方法包括:通过将多个项目链接到关联开放数据网络中的多个实体来形成图,该图包括作为节点的项目、实体和用户;确定图中任意两个节点之间的路径的集合;针对特定用户和特定项目:计算第一特征向量,该第一特征向量的每个分量与路径集合中的一个路径对应,并且表示在对应的路径中连接特定用户和特定项目的子路径的长度与在所有路径中连接特定用户和特定项目的子路径的长度之和的比率;基于第一特征向量和相关函数计算特定用户和特定项目之间的相关度;基于相关度来确定是否向特定用户推荐特定项目;以及在确定推荐的情况下,以特定用户能够感知的方式推荐特定项目。
-
公开(公告)号:CN111241380A
公开(公告)日:2020-06-05
申请号:CN201811434074.0
申请日:2018-11-28
Applicant: 富士通株式会社
IPC: G06F16/9535
Abstract: 公开了用于生成推荐的方法和设备。该方法包括:通过将多个项目链接到关联开放数据网络中的多个实体来形成图,该图包括作为节点的项目、实体和用户;确定图中任意两个节点之间的路径的集合;针对特定用户和特定项目:计算第一特征向量,该第一特征向量的每个分量与路径集合中的一个路径对应,并且表示在对应的路径中连接特定用户和特定项目的子路径的长度与在所有路径中连接特定用户和特定项目的子路径的长度之和的比率;基于第一特征向量和相关函数计算特定用户和特定项目之间的相关度;基于相关度来确定是否向特定用户推荐特定项目;以及在确定推荐的情况下,以特定用户能够感知的方式推荐特定项目。
-
公开(公告)号:CN106326300A
公开(公告)日:2017-01-11
申请号:CN201510382448.9
申请日:2015-07-02
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F16/355
Abstract: 本公开提供一种信息处理方法和信息处理设备。该信息处理方法包括:将预定文本数据库中包括的关键词关联到预定语义知识数据库中,其中,关联到预定语义知识数据库中的关键词作为第一关键词构成第一关键词集合;计算第二关键词集合中的各个第二关键词与每个所述第一关键词之间的相似度,其中所述第二关键词集合由预定文本数据库中未关联到预定语义知识数据库中的第二关键词构成;以及根据第二关键词与各个第一关键词之间的相似度,将第一关键词在预定语义知识数据库中具有的可传递语义关系应用于该第二关键词。根据本公开的信息处理设备和信息处理方法能够容易、准确地将文本数据库中的关键词关联到预定语义知识库中。
-
公开(公告)号:CN118780286A
公开(公告)日:2024-10-15
申请号:CN202310369065.2
申请日:2023-04-06
Applicant: 富士通株式会社
IPC: G06F40/295 , G06F40/30 , G06N3/045
Abstract: 本公开涉及一种信息处理装置、信息处理方法和机器可读存储介质。信息处理装置包括:构建单元,其通过原始训练样本、针对原始训练样本中的每个实体对分别构建对应于每个实体对的多个训练样本,多个训练样本中的至少一部分反映实体对中的实体之间的局部上下文关系;以及训练单元,其利用多个训练样本、针对每个实体对训练文档级关系抽取模型中的预训练语言模型,以学习每个实体对中的实体的描述在不同上下文中的重要性。该信息处理装置可以使预训练语言模型学习到描述在不同上下文中的重要性,而不需要额外的人工标注。
-
公开(公告)号:CN115563270A
公开(公告)日:2023-01-03
申请号:CN202110747494.X
申请日:2021-07-01
Applicant: 富士通株式会社
IPC: G06F16/35 , G06F16/36 , G06F40/295
Abstract: 公开了呈现提示信息的方法和装置以及存储介质。该方法包括:生成针对实体的掩码向量,该掩码向量用于在实体和上下文所构成的语句中标识出实体的位置;由BERT层基于实体和上下文生成第一向量和第二向量;由实体平均层基于掩码向量和第二向量生成第三向量;由拼接层对第一向量和第三向量进行拼接以生成第四向量;由第一分类器基于第四向量预测实体对应于预定义的多个概念中的哪一个概念;由第二分类器基于第四向量预测实体对应于预定义的多个类型中的哪一个类型;联合地训练第一分类器和第二分类器;基于经训练的第一分类器的预测结果确定实体所对应的概念,并且基于所确定的概念生成提示信息,以呈现给用户。
-
公开(公告)号:CN114911924A
公开(公告)日:2022-08-16
申请号:CN202110177358.1
申请日:2021-02-07
Applicant: 富士通株式会社
IPC: G06F16/35 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种多任务学习网络以及基于多任务学习网络的方法。该多任务学习网络包括:任务网络以及合并网络。其中任务网络包括多个子任务网络,多个子任务网络针对相同的输入生成相应的特征向量,合并网络对相应的特征向量进行拼接、对拼接后的特征向量进行优化并得到最终输出,其中多个子任务网络中的每个子任务网络包括编码层和任务层,编码层将所述输入转换成包括维度信息的编码向量并将编码向量发送到所述任务层,任务层对编码向量进行处理以生成特征向量。
-
-
-
-
-
-
-
-
-