文档级别的事件论元抽取方法

    公开(公告)号:CN112528676B

    公开(公告)日:2022-07-08

    申请号:CN202011506990.8

    申请日:2020-12-18

    Applicant: 南开大学

    Abstract: 本发明提出了一种文档级别的事件论元抽取方法,本发明公开的方法是以非结构化的文档文本作为输入数据,构建基于深度学习的文档级别事件论元抽取模型,包含两个阶段,一个预训练阶段用于微调训练好的文本表示模型,一个抽取模型的训练和预测阶段用于学习各类事件角色的特征和生成预测结果,在两个阶段中均利用了事件角色的语义信息作为文本特征的扩充,以生成更加准确的事件论元抽取结果。对于普遍使用的文档级别事件论元抽取数据集,本发明的方法效果显著优于目前现有的文档级别事件论元抽取方法,证明事件角色的语义信息有助于从文档中进行事件论元的抽取。

    在线新闻多模态情感分析方法

    公开(公告)号:CN109376775B

    公开(公告)日:2021-08-17

    申请号:CN201811181032.0

    申请日:2018-10-11

    Applicant: 南开大学

    Abstract: 本发明提出了一种在线新闻多模态情感分析方法。本发明公开的方法是综合利用在线新闻中的文本和图像内容,构建多模态深度学习模型,实现多种模态数据特征的充分融合,并据此对读者阅读新闻后的情感进行分析和预测。对于真实的带有图像的新闻数据,本发明的方法效果显著优于其他不考虑图像信息的情感分析模型,证明了新闻中的图像有助于整个新闻事件的阐述,影响读者的阅读情感。

    面向时空数据的移动行为图谱构建方法

    公开(公告)号:CN112749209A

    公开(公告)日:2021-05-04

    申请号:CN202011629525.3

    申请日:2020-12-31

    Applicant: 南开大学

    Abstract: 本发明属于数据挖掘技术领域,更具体地,基于位置服务的社交网络中的时空数据,构建符合用户出行规律的移动行为图谱表示方法。图谱的构建主要由三个部分组成,第一部分是移动行为图谱的构建,该部分先对原始用户签到数据进行预处理操作,然后建立移动行为图谱;第二部分是基于移动行为图谱的门控图神经网络的构建,这部分提出将图谱的节点和边融合至节点向量和节点更新函数的方法;第三部分是基于图谱向量化表示的位置预测网络的构建,这部分提出将更新后的节点向量用于位置预测网络的方法。通过基于移动行为图谱的位置预测模型能从多角度、全方位地覆盖时空数据属性,能够更准确地捕捉用户移动特征,从而提高了位置预测的准确性。

    基于最近邻搜索的关系表集合外键识别方法

    公开(公告)号:CN105095522A

    公开(公告)日:2015-11-25

    申请号:CN201510616597.7

    申请日:2015-09-22

    Applicant: 南开大学

    CPC classification number: G06F17/30536

    Abstract: 本发明公布了一种基于最近邻搜索的关系表集合外键识别方法,属于数据库技术应用领域。本发明的基本步骤如下:首先改进现有的包含依赖识别方法,找出关系表中单属性和多属性的包含依赖;然后计算满足包含依赖的属性特征,包括特异元组个数、属性名、元组均值、元组方差、元组平均长度和中位数等,并将这些特征映射到高维欧氏空间中,用得到的高维向量表示原属性;最后基于外键是主键的最近邻,通过最近邻查找方法找出关系表集合中所有的外键。本发明提出的关系表集合外键识别方法,能够为大规模关系表集合自动构建外键关系提供一种有效的解决方案,该发明能应用于数据库设计、数据集成、模式匹配等领域。

    基于自然语言的行程规划方法、系统、设备、产品及介质

    公开(公告)号:CN119539450A

    公开(公告)日:2025-02-28

    申请号:CN202510104793.X

    申请日:2025-01-23

    Applicant: 南开大学

    Abstract: 本发明涉及数据挖掘技术领域,提供基于自然语言的行程规划方法、系统、设备、产品及介质,包括:构建兴趣点数据集;获取用户输入文本和双层大语言模型,对用户输入文本进行解析和微调得到用户需求参数;通过兴趣点数据集对兴趣点进行聚类,得到初始候选列表,计算余弦相似度,以计算候选列表中兴趣点的兴趣点得分,对初始候选列表进行排序,得到中间候选列表;反转交换得到反转候选列表,计算每个反转候选列表的局部最优评分,并进行跨聚类替换,得到目标候选列表;生成目标候选列表,并计算综合行程评分,将综合行程评分最高的目标候选列表作为行程列表,并通过行程列表得到行程规划。本发明有效提高了行程规划的用户体验。

    基于动态图学习的多元时间序列缺失值插补方法及系统

    公开(公告)号:CN118586435B

    公开(公告)日:2025-01-14

    申请号:CN202411069862.X

    申请日:2024-08-06

    Applicant: 南开大学

    Abstract: 本发明涉及人工智能技术领域,具体公开了基于动态图学习的多元时间序列缺失值插补方法及系统,方法包括:获取带缺失值的多元时间序列数据;构建图结构,通过图神经网络调整所述图结构的邻接矩阵,计算得到自适应图结构;所述自适应图结构通过编码器、解码器,计算得到前向插补值、后向插补值和节点嵌入表示;利用多层感知机聚合,计算得到预测缺失值;将所述预测缺失值与带缺失值的多元时间序列数据结合,得到插补后的多元时间序列数据。本发明以动态图结构学习来建模变量之间在不同时间步的相关性,同时学习变量关联性与时间序列的时序依赖关系,通过用学习到的表征对缺失数据进行两阶段的插补计算,有效提升了缺失值插补的准确率。

    基于动态图学习的多元时间序列缺失值插补方法及系统

    公开(公告)号:CN118586435A

    公开(公告)日:2024-09-03

    申请号:CN202411069862.X

    申请日:2024-08-06

    Applicant: 南开大学

    Abstract: 本发明涉及人工智能技术领域,具体公开了基于动态图学习的多元时间序列缺失值插补方法及系统,方法包括:获取带缺失值的多元时间序列数据;构建图结构,通过图神经网络调整所述图结构的邻接矩阵,计算得到自适应图结构;所述自适应图结构通过编码器、解码器,计算得到前向插补值、后向插补值和节点嵌入表示;利用多层感知机聚合,计算得到预测缺失值;将所述预测缺失值与带缺失值的多元时间序列数据结合,得到插补后的多元时间序列数据。本发明以动态图结构学习来建模变量之间在不同时间步的相关性,同时学习变量关联性与时间序列的时序依赖关系,通过用学习到的表征对缺失数据进行两阶段的插补计算,有效提升了缺失值插补的准确率。

    一种多任务个性化行为模式的位置预测方法

    公开(公告)号:CN117493710A

    公开(公告)日:2024-02-02

    申请号:CN202311491772.5

    申请日:2023-11-10

    Abstract: 本发明涉及数据挖掘技术领域,提供一种多任务个性化行为模式的位置预测方法。该方法包括:采集用户的历史位置轨迹并进行编码,获得轨迹嵌入表示;基于用户未提交的位置记录建立辅助轨迹模拟,获得辅助嵌入表示并对轨迹嵌入表示进行数据增强,获得增强嵌入表示;根据增强嵌入表示建立协同位置转移图及图神经网络,以进行特征建模获得用户轨迹特征;通过对比学习网络,将多个预测任务下分别获得的用户轨迹特征和引入的用户的个性化行为模式特征进行可迁移特征学习,获得个性化行为特征;根据个性化行为特征对图神经网络进行训练,基于训练后的图神经网络输出用户的偏好得分。本发明同时解决不同的位置预测任务,提高不同任务下的预测表现。

    面向时空数据的移动行为图谱构建方法

    公开(公告)号:CN112749209B

    公开(公告)日:2023-08-29

    申请号:CN202011629525.3

    申请日:2020-12-31

    Applicant: 南开大学

    Abstract: 本发明属于数据挖掘技术领域,更具体地,基于位置服务的社交网络中的时空数据,构建符合用户出行规律的移动行为图谱表示方法。图谱的构建主要由三个部分组成,第一部分是移动行为图谱的构建,该部分先对原始用户签到数据进行预处理操作,然后建立移动行为图谱;第二部分是基于移动行为图谱的门控图神经网络的构建,这部分提出将图谱的节点和边融合至节点向量和节点更新函数的方法;第三部分是基于图谱向量化表示的位置预测网络的构建,这部分提出将更新后的节点向量用于位置预测网络的方法。通过基于移动行为图谱的位置预测模型能从多角度、全方位地覆盖时空数据属性,能够更准确地捕捉用户移动特征,从而提高了位置预测的准确性。

    一种对抗攻击检测方法
    40.
    发明授权

    公开(公告)号:CN113627543B

    公开(公告)日:2023-08-22

    申请号:CN202110931933.2

    申请日:2021-08-13

    Applicant: 南开大学

    Abstract: 本发明公开了一种对抗攻击检测方法,包括以下步骤:步骤S1,通过多种对抗攻击算法生成对于目标深度神经网络的对抗样本,并与自然输入样本混合作为输入样本;步骤S2,将输入样本输入到目标深度神经网络中提取全局特征和隐含层特征;步骤S3,将输入样本的全局特征和隐含层特征进行特征融合,得到输入样本的最终特征表示;步骤S4,使用输入样本的最终特征表示训练分类器,得到对抗样本检测模型;步骤S5,利用步骤4得到的对抗样本检测模型检测输入数据中是否含有对抗样本。本发明可以为被攻击目标系统的不同隐藏层动态分配不同的权重,不仅能发现单攻击模式下的对抗样本,而且能够不受混合攻击模式影响地检测出每种攻击方法所产生的对抗样本。

Patent Agency Ranking