-
公开(公告)号:CN111581957A
公开(公告)日:2020-08-25
申请号:CN202010371816.0
申请日:2020-05-06
Applicant: 浙江大学
IPC: G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于金字塔层级网络的嵌套实体检测方法,属于自然语言处理技术领域。该嵌套实体检测方法包括:(一)对单词进行编码获得词向量,将词向量作为仅包含单个单词的文本区域的表示输入第一个解码层;(二)当前解码层对输入的每个文本区域的表示进行命名实体识别,将相邻的两个文本区域的表示被合并为一个新的文本区域的表示,输入到下一解码层,重复该步骤直到次数达到预设的层数或输入文本的长度;(三)对应于上述金字塔层级网络,使用合适的优化方法进行训练;(四)将待检测文本输入训练好的金字塔层级网络,获得命名实体识别结果。本发明的基于金字塔层级网络的嵌套实体检测方法可以解决命名实体识别中存在实体嵌套的问题。
-
公开(公告)号:CN111274814A
公开(公告)日:2020-06-12
申请号:CN201911369784.4
申请日:2019-12-26
Applicant: 浙江大学
IPC: G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种新型的半监督文本实体信息抽取方法。文档短语分割得候选实体集合;建立有、无监督学习部分,有、无标注的文档分别有、无监督学习;文档和实体类型输入实体抽取模块输出实体信息;文档和短语输入类型选择模块输出短语概率分布;两模块损失值相加为损失;文档输入实体抽取模块获得每个实体类型的损失;文档和短语输入类型选择模块输出短语概率分布;两模块损失值相乘后相加构成损失;两部分加权计算获得总损失,优化训练获得模型参数;将测文本依次输入到实体抽取模块和类型选择模块获得实体信息。本发明能够利用海量无标注数据,显著增强模型性能,在小样本标注数据的条件下有着显著的提升,也适用于零样本学习的半监督文本数据处理。
-
公开(公告)号:CN109101468A
公开(公告)日:2018-12-28
申请号:CN201810873554.0
申请日:2018-08-02
Applicant: 浙江大学
IPC: G06F17/21
Abstract: 本发明公开了一种文本数据转换脚本的执行优化方法。针对通过网络分布式处理执行的文本数据转换脚本,对文本数据转换脚本进行解析,生成执行计划树;使用基于元组的多重集作为文本数据的数据模型,文本数据转换脚本包含了对多重集的结构和内容进行修改和转换的数据操作;根据转换脚本执行场景的不同,采用对应的执行优化方法;根据优化后得到的执行计划结果,生成逻辑程序处理并运行,从而对大数据平台上的数据进行高效地转换和处理。本发明方法能够应用于数据准备阶段对海量文本数据的处理,通过应用面向文本数据转换脚本的执行优化方法,能够有效地减少文本数据转换脚本在执行时的时空代价,提高数据准备阶段的效率。
-
公开(公告)号:CN108229503A
公开(公告)日:2018-06-29
申请号:CN201810008857.6
申请日:2018-01-04
Applicant: 浙江大学
Abstract: 本发明公开了一种针对服装照片的特征提取方法。为服装照片构建基于深度学习模型的特征提取模型,特征提取模型中包含多任务分类损失函数和四元损失函数;采集若干带标签的服装照片作为训练数据,将带标签的服装照片及其标签输入到特征提取模型进行训练,在多任务分类损失函数和四元损失函数的共同优化下通过反向传播算法进行特征提取模型的参数优化,获得训练后的特征提取模型,以训练后的特征提取模型对带标签的服装照片进行处理提取获得特征向量。本发明针对服装照片设计的特征提取方法非常通用而且鲁棒,可用于服装照片的分类、标注、检索和聚类等应用。
-
公开(公告)号:CN119988979A
公开(公告)日:2025-05-13
申请号:CN202510160819.2
申请日:2025-02-13
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F18/214 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于迭代数据增强策略提升大模型微调效果的方法和装置。本发明包括根据要求人工生成一批分布各不同的种子数据;基于规则或者大模型对人工生成的种子数据进行增强;检查增强数据的质量;用检查好的数据微调模型,并用训练好的模型推理训练数据;对推理结果进行各方面的综合评估;评估出来的指标是否满足要求;如果不满足要求则对错误的样本再进行增强,反复迭代;评估结果满足要求则结束整个流程。本发明显著降低了小数据集下大模型微调的门槛,通过生成有针对性的合成数据,使模型在数据稀缺的场景中表现优异。
-
公开(公告)号:CN119151016B
公开(公告)日:2025-05-13
申请号:CN202411650247.8
申请日:2024-11-19
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06N20/00 , G06N3/006 , G06F16/242
Abstract: 本申请涉及一种多智能体代理的数据库内的机器学习特征生成方法,包括:根据历史特征集合在数据库内的机器学习模型中的性能指标,确定第一特征集合和第一特征集合的特征描述;根据机器学习任务和历史特征集合,得到第一特征集合对应的特征提示;获取数据库内的大语言模型根据第一特征集合、特征描述和特征提示生成的新特征,并结合第一特征集合和新特征得到第二特征集合;根据历史特征集合和第二特征集合在机器学习模型中的性能指标,确定第三特征集合;分解第三特征集合,直至分解得到的特征集合与第三特征集合匹配,根据分解结果得到执行机器学习任务所需的第四特征集合。采用本方法能够解决数据库内执行机器学习任务困难且准确性低的问题。
-
公开(公告)号:CN119536983A
公开(公告)日:2025-02-28
申请号:CN202411345113.5
申请日:2024-09-25
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F9/50 , G06F21/71 , G06F21/62 , G06N3/0499 , G06N3/084
Abstract: 本申请涉及一种异构系统的模型并行训练方法、装置和计算机设备,其中,该方法包括:在每个预设条件下,构建待训练模型与各计算设备之间的多种映射关系,并生成策略集合;预设条件包括训练数据的批次大小、待训练模型对应的流水线并行粒度和每个计算设备的预设显存预算;遍历各预设条件,通过动态规划算法对不同的映射关系和策略集合中的各候选策略进行处理,得到当前最优的模型并行训练策略下异构系统的执行成本;基于最小执行成本对应的模型并行训练策略,通过各计算设备执行模型训练。通过本申请,解决了采用固定处理器进行训练,无法利用异构系统中多个计算设备实现高效的并行训练的问题,实现高效的模型并行训练,提升计算设备的资源利用率。
-
公开(公告)号:CN119398289A
公开(公告)日:2025-02-07
申请号:CN202411268070.5
申请日:2024-09-10
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06Q10/047 , G06N5/022 , G06N3/063 , G06N10/20
Abstract: 本申请涉及一种基于混合量子算法的路径优化方法、装置、计算机设备和存储介质,其中,该方法包括:获取待优化路径的无向完全加权图的权重邻接矩阵;将权重邻接矩阵输入到预设的量子电路中进行优化,得到第一候选解和对应的第一权重;其中,在量子电路的编码与剪枝的优化过程中,将所有候选解划分为多个步骤;将旅行商在每个步骤中的选择,编码到量子电路中,执行相应的剪枝,以形成包含所有候选解的均匀叠加态;根据第一权重和预设的第一阈值,更新第一候选解,得到目标路径。通过本申请,解决了相关技术中路径规划的效率低下的问题,有效减少编码候选解所需的量子资源,实现在精确规划路径的同时,能够提高路径规划效率。
-
公开(公告)号:CN119398018A
公开(公告)日:2025-02-07
申请号:CN202411975829.3
申请日:2024-12-31
Applicant: 浙江大学计算机创新技术研究院
Abstract: 本发明公开了一种二维表格数据多模态模型的设计和训练方法。本发明首先设计二维表格数据多模态模型,其包括表格表征模块,所述表格表征模块由多个串行的双向注意力模块组成;通过所述双向注意力模块处理使得表格表征词嵌入集能够与其它相关单元格交互,捕获全局结构化表格语义;然后预训练表格表征模块,使用大量原始表格数据来训练表格表征模块,使其能够输出准确的表格表征信息;最后对表格表征模块和大语言模型解码器进行对齐训练,采用表格表征模块和大语言模型解码器进行联合监督微调。本发明能实现表格模态与文本模态共同输入大模型进行表格问答、数据分析等生成式任务,有效提升二维表格问答、代码生成等任务的效果和性能。
-
公开(公告)号:CN119377353A
公开(公告)日:2025-01-28
申请号:CN202411417069.4
申请日:2024-10-11
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/36 , G06N5/025
Abstract: 本发明公开了一种基于大语言模型和知识图谱的多模态问答方法,属于人工智能及知识图谱技术领域。针对现有问答系统中多模态信息处理不充分、语义理解深度不足及跨模态推理能力有限等问题,本发明提出了一种多模态问答引擎,通过为多模态数据构建多模态知识图谱,建立模态内部以及模态之间的语义关联网络,并为知识图谱的实体、关系等元素生成索引,以支持后续的高效检索。通过对知识图谱进行结构化信息检索,结合大型语言模型强大的自然语言理解能力和特定模态问答模型的能力,提高了信息检索的效率与准确性,增强了跨模态推理能力,从而实现在复杂多模态环境下的高效精准问答。
-
-
-
-
-
-
-
-
-