一种基于内容环境增强的用户事件相关度计算方法

    公开(公告)号:CN104572915B

    公开(公告)日:2017-10-10

    申请号:CN201410833448.1

    申请日:2014-12-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于内容环境增强的用户事件相关度计算方法。利用话题模型将用户和社交事件的档案降低维度转化成话题分布;计算得到该用户档案和该社交事件档案的用户偏好特征;将用户偏好特征作为用户参加所对应事件的概率,计算采用基于协同过滤方法提取线上、线下社交影响特征;根据用户城市的事件,得到当地兴趣的话题分布,再与事件比较来得到本地流行度特征;通过训练学习排序模型,得到用户事件相关度。本发明通过充分挖掘事件社交网络中的内容环境相关信息,提取出用户偏好、社交影响、当地流行度的特征进行计算,并通过结合多项特征提高了最终结果的准确度,解决了个性化推荐系统中针对社交事件这类新对象进行推荐的技术问题。

    一种面向医药说明书文本的结构化信息抽取方法

    公开(公告)号:CN113033203B

    公开(公告)日:2025-03-25

    申请号:CN202110162263.2

    申请日:2021-02-05

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向医药说明书文本的结构化信息抽取方法,属于医疗自然语言处理技术领域。首先,采用一种面向无标注数据的基于对抗迁移学习的实体识别模型,进行医药说明书文本的初步实体识别。接着,在实体识别基础上,提出一种用法用量表抽取新任务,即将用法用量文本中复杂的知识结构以表格的形式抽取出来。并针对此任务,设计一种基于特征融合的表抽取算法,来进行说明书用法用量的表抽取。最后,在实体识别的基础上,采用一种基于医疗实体字符注意力机制的关系抽取方法,来对实体之间的关系进行抽取。本发明提出的结构化信息抽取方法可以解决医药说明书文本的复杂信息抽取问题。

    一种面向低数据的动态增强多跳文本阅读识别处理方法

    公开(公告)号:CN113988079B

    公开(公告)日:2025-03-14

    申请号:CN202111144082.3

    申请日:2021-09-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向低数据的动态增强多跳文本阅读识别处理方法。对文档的数据集进行修正预处理;构建动态增强的答案预测模型;使用训练集训练动态增强的答案预测模型作为教师模型;随机挑选一部分无标签的数据集输入到教师模型中预测获得标签结果建立伪标签,将带有伪标签的数据集加到训练集形成新训练集;用新训练集再训练教师模型获得学生模型;不断重复步骤迭代,直到验证集的模型精度结果满足预设阈值要求;用最终的学生模型对待测阅读文档进行预测,输出预测获得待测阅读文档的答案。本发明使用动态增强的方法来扩充数据,能够减少输入长度,解决标签数据少情况下的多跳阅读理解问题,增强模型的泛化能力。

    一种具像化的大模型推理辅助方法

    公开(公告)号:CN119026686A

    公开(公告)日:2024-11-26

    申请号:CN202410876691.5

    申请日:2024-07-02

    Applicant: 浙江大学

    Abstract: 本发明公开了人工智能技术领域的一种具像化的大模型推理辅助方法,包括以下步骤:步骤一,输入问题:以原始问题的文本描述#imgabs0#为输入,通过大语言模型对问题进行初步理解和分析;步骤二,规划阶段:识别阶段所需的关键元信息,元数据包括选择绘图工具和创建初始图像;步骤三,迭代推理阶段:根据语言模型给出的指令逐步更新图像,生成图文结合的思维链;步骤四,联合推理阶段:多模态大语言模型结合图像和文字信息,对整个思考过程进行解释和推理。本发明通过将抽象的推理问题具像化为图像,允许大语言模型接受问题的文本描述作为输入,并使用自我生成的图像作为增强推理的额外信息通道,能够减少先验知识的引入,从而提高方法的普适性。

    一种大模型处理表格数据的方法、装置及介质

    公开(公告)号:CN118245485B

    公开(公告)日:2024-08-23

    申请号:CN202410645067.4

    申请日:2024-05-23

    Applicant: 浙江大学

    Abstract: 本发明公开了一种大模型处理表格数据的方法、装置及介质,包括:将用户的自然语言转化为SQL查询,以进行表格数据查询请求;将SQL查询中的表格任务解析成对应的算子,以生成粗粒度的计算图;使用算子分解、算子组合、算子重排,并结合代价函数对粗粒度的计算图进行优化,生成细粒度的计算图;根据细粒度的计算图编译成代码;执行所述代码,得到用户答复。本发明能够实现与表格的自然语言交互,能够实现提取信息、计算、推理等功能,具备更强的理解和执行表格任务的能力。

    基于数据库管理系统的深度神经网络推理方法和装置

    公开(公告)号:CN118278468A

    公开(公告)日:2024-07-02

    申请号:CN202410695887.4

    申请日:2024-05-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于数据库管理系统的深度神经网络推理方法和装置,包括:将预训练神经网络模型参数转换为二进制格式;根据不同的目标任务,使用对应的目标数据集微调将参数已转换为二进制格式的预训练神经网络模型,并在微调中,通过概率模型和剪枝技术,去除冗余参数,得到轻量化模型;将若干个所述轻量化模型部署到数据库管理系统中,即SmartLite;其中,所述预训练神经网络模型的结构和参数作为共享块;当所述SmartLite接受到混合查询请求,至少调用一个模型进行推理;所述混合查询包括SQL查询和深度学习模型推理。本发明计算效率显著提升,使用查找表和比特操作优化,在各种计算任务中显著提高了计算速度。

    一种大模型处理表格数据的方法、装置及介质

    公开(公告)号:CN118245485A

    公开(公告)日:2024-06-25

    申请号:CN202410645067.4

    申请日:2024-05-23

    Applicant: 浙江大学

    Abstract: 本发明公开了一种大模型处理表格数据的方法、装置及介质,包括:将用户的自然语言转化为SQL查询,以进行表格数据查询请求;将SQL查询中的表格任务解析成对应的算子,以生成粗粒度的计算图;使用算子分解、算子组合、算子重排,并结合代价函数对粗粒度的计算图进行优化,生成细粒度的计算图;根据细粒度的计算图编译成代码;执行所述代码,得到用户答复。本发明能够实现与表格的自然语言交互,能够实现提取信息、计算、推理等功能,具备更强的理解和执行表格任务的能力。

    一种基于数据湖的查询方法和装置

    公开(公告)号:CN118227656A

    公开(公告)日:2024-06-21

    申请号:CN202410650121.4

    申请日:2024-05-24

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于数据湖的查询方法和装置,包括:根据用户输入,对查询的目标数据集进行采样,得到模式信息M和数据样本信息,从而构建查询;将查询分解成若干个子任务,从而构建处理图;修正处理图,采用shuffle技术和/或Collapse技术,并结合成本模型对修正后的处理图进行优化;根据优化后的处理图生成代码并执行,以输出用户查询结果。本发明无需中介模式,简化查询过程,不需要数据转换和加载,简化了操作,从整体上提高了查询效率。在查询细节上,设计了针对LLM生成代码的查询优化器,极大提高了LLM生成代码的执行效率和对应方法的可解释性,其中对处理图修正以辅助LLM能提高查询准确性,使整个自然语言查询任务的准确性超过传统方法。

Patent Agency Ranking