-
-
公开(公告)号:CN102654881B
公开(公告)日:2014-10-22
申请号:CN201110056065.4
申请日:2011-03-03
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供了用于名称消岐聚类的装置和方法。对名称训练集进行数据处理的装置包括:用于确定至少两个名称训练集中每个名称训练集的代表相似度的装置,代表相似度为名称训练集中的文本间相似度的代表值;用于针对至少两个名称训练集中的每个名称训练集,采用不同的相似度阈值进行聚类以选择使聚类效果较佳的相似度阈值作为优选相似度阈值的装置;以及用于根据至少两个名称训练集中的每个名称训练集的代表相似度和优选相似度阈值拟合表示代表相似度与优选相似度阈值之间对应关系的函数的装置。
-
公开(公告)号:CN102073653B
公开(公告)日:2013-06-19
申请号:CN200910226105.8
申请日:2009-11-20
Applicant: 富士通株式会社
Abstract: 本发明公开了一种信息抽取方法和装置。其中该信息抽取方法包括:a)获取第一评价信息的初始种子;b)确定与第一评价信息的种子关联的第二评价信息;c)根据与第一评价信息的种子关联出现的第二评价信息的权重来确定新的第二评价信息的种子;d)确定与第二评价信息的种子关联的第一评价信息;e)根据与第二评价信息的种子关联出现的第一评价信息的权重来确定新的第一评价信息的种子;f)判断是否满足迭代结束条件,如果否,则又执行步骤b)至e),否则输出所获得的第一评价信息和第二评价信息。此外,本发明还公开了一种相应的信息抽取装置。
-
公开(公告)号:CN102867006A
公开(公告)日:2013-01-09
申请号:CN201110189562.1
申请日:2011-07-07
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明实施例提供一种分批聚类方法和系统,所述方法包括:按照预定策略对要聚类的文档进行分批;对分批后的每一批文档进行聚类,得到每一批文档的聚类结果;对每一批文档的聚类结果进行凝聚性处理,得到每一批文档的凝聚性处理结果;将除第一批文档以外的每一批文档的凝聚性处理结果中的每一类与上一批文档的凝聚性处理结果中的类合并,得到所述要聚类的文档的分批聚类结果。本实施例的分批聚类方法,通过对要聚类的文档进行分批聚类、批聚类结果的凝聚性处理以及批凝聚性处理结果的合并,提高了聚类性能,实现了增量式的聚类。
-
公开(公告)号:CN102236636A
公开(公告)日:2011-11-09
申请号:CN201010157784.0
申请日:2010-04-26
Applicant: 富士通株式会社
IPC: G06F17/27
Abstract: 本发明公开了一种用于分析对研究对象的情感倾向性的方法和装置。所述方法包括:获取粗粒度的情感倾向性;获取细粒度的情感倾向性;以及将粗粒度的情感倾向性和细粒度的情感倾向性结合,获取对该研究对象的情感倾向性;其中获取细粒度的情感倾向性的步骤包括:基于在句子粒度或者段落粒度上确定的与主题词相关的情感词进行情感倾向性分析;其中获取粗粒度的情感倾向性的步骤包括:基于在段落粒度或者文档粒度上确定的与主题词相关的情感词进行情感倾向性分析。
-
公开(公告)号:CN102073653A
公开(公告)日:2011-05-25
申请号:CN200910226105.8
申请日:2009-11-20
Applicant: 富士通株式会社
Abstract: 本发明公开了一种信息抽取方法和装置。其中该信息抽取方法包括:a)获取第一评价信息的初始种子;b)确定与第一评价信息的种子关联的第二评价信息;c)根据与第一评价信息的种子关联出现的第二评价信息的权重来确定新的第二评价信息的种子;d)确定与第二评价信息的种子关联的第一评价信息;e)根据与第二评价信息的种子关联出现的第一评价信息的权重来确定新的第一评价信息的种子;f)判断是否满足迭代结束条件,如果否,则又执行步骤b)至e),否则输出所获得的第一评价信息和第二评价信息。此外,本发明还公开了一种相应的信息抽取装置。
-
公开(公告)号:CN119444317A
公开(公告)日:2025-02-14
申请号:CN202310946739.0
申请日:2023-07-28
Applicant: 富士通株式会社
IPC: G06Q30/0241 , G06Q30/0251 , G06F18/21 , G06F18/22 , G06F40/103 , G06N5/022
Abstract: 公开了生成广告脚本的方法和装置以及存储介质。该方法包括:由大型语言模型接收用户的第一提示语,并且基于第一提示语生成任务列表,所述任务列表包括多个步骤的描述内容,所述多个步骤至少与识别产品的特点和优势有关;基于从所述多个步骤的描述内容中提取的关键字在网络上搜索与产品有关的信息,并且利用搜索到的信息建立本地知识库;由大型语言模型接收来自本地知识库的内容,并且基于所接收的内容生成报告,所述报告至少包含产品的特点和优势;由大型语言模型基于所述报告生成产品的广告脚本。
-
公开(公告)号:CN108694443B
公开(公告)日:2021-09-17
申请号:CN201710217479.8
申请日:2017-04-05
Applicant: 富士通株式会社
IPC: G06N3/08
Abstract: 本发明涉及基于神经网络的语言模型训练方法和装置。该方法包括:针对训练集中的每一个目标词,利用噪声生成网络生成目标词特征和噪声词特征,其中,目标词特征和噪声词特征具有各自对应的类别标签;利用上下文神经网络提取目标词的上下文特征;将目标词特征、噪声词特征以及上下文特征构成训练样本输入二分类器;迭代更新噪声生成网络的参数和上下文神经网络的参数,直到二分类器的预测误差接近预定值时停止更新;以及用训练得到的上下文神经网络作为语言模型。根据本发明的方法和装置可以训练得到一种收敛速度较快同时泛化能力较好的语言模型。
-
公开(公告)号:CN113128544A
公开(公告)日:2021-07-16
申请号:CN202010043527.8
申请日:2020-01-15
Applicant: 富士通株式会社
Abstract: 公开了训练人工智能模型的方法和装置。该模型用于处理张量数据并且输出指示多种类别之一的分类结果,张量数据包括多个元素,每个元素包括多个特征。该训练方法包括:对张量数据进行分解以获得核心张量;基于核心张量执行第一解释算法,以确定每个元素对于每种类别的贡献分,其中,贡献分表示该元素对于该类别被确定为分类结果的贡献程度;在多个元素中选择贡献分大于阈值的元素;针对所选择的每一个元素,利用第二解释算法来确定该元素中的每个特征对于每种类别的重要性分数;基于重要性分数来选择特征,并且基于所选择的特征来构建张量数据训练样本;利用构建的张量数据训练样本来训练该模型。
-
公开(公告)号:CN108959322A
公开(公告)日:2018-12-07
申请号:CN201710379515.0
申请日:2017-05-25
Applicant: 富士通株式会社
CPC classification number: G06K9/6256
Abstract: 本发明公开了信息处理方法和基于文本生成图像的装置。所述方法包括:从样本文本中提取表征样本文本中的词之间的关联性的文本特征;以尺寸变化的窗口来选择性地截取文本特征的各个局部,以得到各个局部文本特征;基于样本文本的各个局部文本特征和与样本文本对应的样本图像来训练图像生成模型,其中,图像生成模型包括编码器模块和解码器模块,训练后的图像生成模型中的解码器模块根据所输入的文本的各个局部文本特征来迭代地生成与所输入的文本对应的图像,并且各个局部文本特征分别在各次迭代中截取。
-
-
-
-
-
-
-
-
-