-
公开(公告)号:CN113823352B
公开(公告)日:2023-09-08
申请号:CN202111130899.5
申请日:2021-09-26
Applicant: 南开大学
Abstract: 本发明提供一种药物‑靶蛋白亲和力预测方法及系统,属于基于人工智能的生物信息处理技术领域,对待检测的药物‑靶蛋白对中的药物化学分子和靶蛋白分子分别进行编码,得到药物输入表示和靶蛋白输入表示;利用药物‑靶蛋白亲和力预测模型对所述药物输入表示和靶蛋白输入表示进行处理,得到药物‑靶蛋白亲和力预测值。本发明利用元学习算法,有效挖掘了不同子任务之间的相关性;利用正则化项缓解不同子任务之间的任务不平等性,提高了药物‑靶蛋白亲和力预测模型的任务自适应性,获得了具有泛化性能的药物‑靶蛋白亲和力预测模型,提高了对未知药物‑靶蛋白对亲和力预测的准确性,有效解决了药物‑靶蛋白亲和力预测方面的冷启动问题。
-
公开(公告)号:CN115080924B
公开(公告)日:2022-11-15
申请号:CN202210875400.1
申请日:2022-07-25
Applicant: 南开大学
IPC: G06F21/10 , G06F40/211 , G06F40/253 , G06F40/284 , G06F40/30
Abstract: 本发明公开了一种基于自然语言理解的软件许可证条款抽取方法,首先构建许可证文本数据集并对其中的许可证条款中权利条款和义务条款涉及到的单词、词组或句子进行标注,使用已标注的许可证文本数据集,训练一个许可证条款提取模型,实现对许可证文本中的许可证条款自动提取功能;然后,对于给定开源软件,抽取其中的所有许可证文本数据,经去噪处理后使用建立的条款提取模型,提取许可证文本数据中所涉及的许可证条款;最后对于提取出的许可证条款,基于语法分析来得到每个条款对应的态度极性。本发明可以辅助软件开发人员快速理解许可证和选择许可证,帮助软件开发项目规避因不恰当使用许可证引起的法律风险和经济风险。
-
公开(公告)号:CN113705737A
公开(公告)日:2021-11-26
申请号:CN202111260522.1
申请日:2021-10-28
Applicant: 南开大学
Abstract: 本发明公开了一种基于搜索的可扩展的最优测试图像集生成方法,在测试池中随机选取多个测试图像组成测试图像集,再由多个测试图像集组成初始的当前种群;对当前种群中的每个测试图像集,计算其覆盖率和规模,选择最优测试图像集作为下一轮迭代的种群;以筛选出来的下一轮迭代的种群作为父代,利用交叉算子进行运算,得到新种群;对得到的新种群进行图像层和图像集层的变异,得到变异后的后代个体;选取得到的后代个体中覆盖率高于父代个体或覆盖率相同但规模更小的作为下一轮迭代的当前种群,然后重复以上步骤。本发明能够生成规模小、覆盖率高、可扩展性强的最优测试图像集。
-
公开(公告)号:CN113627543A
公开(公告)日:2021-11-09
申请号:CN202110931933.2
申请日:2021-08-13
Applicant: 南开大学
Abstract: 本发明公开了一种对抗攻击检测方法,包括以下步骤:步骤S1,通过多种对抗攻击算法生成对于目标深度神经网络的对抗样本,并与自然输入样本混合作为输入样本;步骤S2,将输入样本输入到目标深度神经网络中提取全局特征和隐含层特征;步骤S3,将输入样本的全局特征和隐含层特征进行特征融合,得到输入样本的最终特征表示;步骤S4,使用输入样本的最终特征表示训练分类器,得到对抗样本检测模型;步骤S5,利用步骤4得到的对抗样本检测模型检测输入数据中是否含有对抗样本。本发明可以为被攻击目标系统的不同隐藏层动态分配不同的权重,不仅能发现单攻击模式下的对抗样本,而且能够不受混合攻击模式影响地检测出每种攻击方法所产生的对抗样本。
-
公开(公告)号:CN119149807A
公开(公告)日:2024-12-17
申请号:CN202411076682.4
申请日:2024-08-07
Applicant: 南开大学 , 嗯噢哇网络科技有限公司
IPC: G06F16/9535 , G06F16/9537 , G06F18/214 , G06F18/23 , G06F18/25
Abstract: 本发明涉及数据挖掘技术领域,提供一种空间相关兴趣点推荐方法、系统、设备、产品及介质。该方法包括:构建位置向量预训练网络,使用位置向量预训练网络训练位置向量;利用位置向量预训练网络生成描述兴趣点位置信息的位置向量,构建轨迹编码网络并融合位置向量,将每个用户的签到数据转化成轨迹切片向量,生成用户的兴趣点偏好得分;联合用户访问目标和空间关联目标集合的多目标学习函数,利用兴趣点偏好得分生成损失来实现轨迹编码网络的训练。本发明从用户签到数据的地理特征表示和地理关联目标学习这两个角度实现兴趣点推荐的需求,有效地捕捉了用户移动行为中的空间聚类模式,提高了兴趣点推荐效果。
-
公开(公告)号:CN117539918A
公开(公告)日:2024-02-09
申请号:CN202311490838.9
申请日:2023-11-10
Applicant: 南开大学 , 中国电子科技集团公司第五十四研究所
IPC: G06F16/2457 , G06F18/2411 , G06F18/15
Abstract: 本发明涉及数据处理技术领域,公开了一种用户异常行为分析方法及系统,用于提高用户异常行为分析的准确率。方法包括:从预置的数据库中采集用户历史行为数据,并对所述用户历史行为数据进行编码映射,得到行为编码集合;对所述行为编码集合进行用户意图向量转换,得到用户行为意图向量集合;对所述用户行为意图向量集合进行数据增强处理,得到增强向量集合;将所述增强向量集合输入预置的用户行为检测模型进行用户行为预测,得到预测用户行为;对所述预测用户行为进行异常分值计算,得到目标异常分值,并通过所述目标异常分值进行行为分析,得到行为分析结果,其中,所述行为分析结果为异常或正常。
-
公开(公告)号:CN109446090A
公开(公告)日:2019-03-08
申请号:CN201811282618.6
申请日:2018-10-31
Applicant: 南开大学
Abstract: 本发明公开了一种基于深度神经网络和概率决策森林的静态软件缺陷预测模型。该模型使用概率决策森林为分类器,将深度神经网络的特征学习和概率决策森林相结合进行端到端训练,并提出一套完整、全局的端到端参数优化方法。该模型首先从软件的代码修改中提取传统特征并使用深度神经网络进行高维映射,然后改进了随机森林,提出概率决策森林,并使用概率决策森林进行分类。将概率决策森林中决策树的分裂节点与深度神经网络的输出节点直接相连,使分裂节点由深度神经网络自动学习得到,因此可以使网络的特征学习过程受分类结果所约束。最后,使用集成学习将上述模型集成,并进行缺陷预测。使用该模型可以有效的提高对代码修改进行缺陷预测的准确率。
-
公开(公告)号:CN114626068B
公开(公告)日:2024-06-07
申请号:CN202210173072.0
申请日:2022-02-24
Applicant: 南开大学
Abstract: 一种基于JAVA函数调用序列的高精度第三方库漏洞模块检测方法。其包括爬取第三方库组件数据;获得补丁信息;找到漏洞源函数;生成第三方库代码文件的函数调用图,寻找出被漏洞污染的程序接口模块;建立JAVA第三方库与被漏洞污染的程序接口模块之间的映射关系,搭建漏洞模块关系数据库;识别程序项目当前使用的JAVA第三方库以及库版本号;识别程序接口模块;判断第三方库是否存在漏洞等步骤。本发明效果:可为后续开发人员选择第三方库及相关程序接口模块提供指导,使用更少的资源让开发人员知晓使用的第三方库的程序接口模块有无漏洞情况;避免在开发过程中选择有安全隐患的程序接口模块,可有效提高开发效率,减少后续测试成本。
-
公开(公告)号:CN113836286B
公开(公告)日:2024-04-05
申请号:CN202111129135.4
申请日:2021-09-26
Applicant: 南开大学
IPC: G06F16/332 , G06F16/35 , G06F40/216 , G06F40/289 , G06N3/0455 , G06N3/0442 , G06N3/08
Abstract: 本公开提供了一种基于问答匹配的社区孤寡老人情感分析方法,包括:获取询问信息;对获取的询问信息进行问答匹配;符合匹配要求的询问信息,直接得到询问信息对应的答复结果;不符合要求的询问信息,依据预设的情感分析模型,得到情感分析结果;其中,情感分析模型的学习采用双任务混合学习框架,主任务判断当前语境下说话人的状态,辅助任务对对话中的语句进行编码后,通过注意力机制挖掘当前说话人的历史对话记录,得到说话人上下文向量;本公开可以关怀老人和服务居民,提高了社区服务质量,实现了智能问答;可以高效的将居民问题与社区管理处提供的语料库进行匹配,准确解答居民问题,同时,可以有效的评估孤寡老人的情感状态。
-
公开(公告)号:CN115080924A
公开(公告)日:2022-09-20
申请号:CN202210875400.1
申请日:2022-07-25
Applicant: 南开大学
IPC: G06F21/10 , G06F40/211 , G06F40/253 , G06F40/284 , G06F40/30
Abstract: 本发明公开了一种基于自然语言理解的软件许可证条款抽取方法,首先构建许可证文本数据集并对其中的许可证条款中权利条款和义务条款涉及到的单词、词组或句子进行标注,使用已标注的许可证文本数据集,训练一个许可证条款提取模型,实现对许可证文本中的许可证条款自动提取功能;然后,对于给定开源软件,抽取其中的所有许可证文本数据,经去噪处理后使用建立的条款提取模型,提取许可证文本数据中所涉及的许可证条款;最后对于提取出的许可证条款,基于语法分析来得到每个条款对应的态度极性。本发明可以辅助软件开发人员快速理解许可证和选择许可证,帮助软件开发项目规避因不恰当使用许可证引起的法律风险和经济风险。
-
-
-
-
-
-
-
-
-