-
公开(公告)号:CN102262661A
公开(公告)日:2011-11-30
申请号:CN201110200145.2
申请日:2011-07-18
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于k阶混合马尔可夫模型的Web页面访问预测方法,首先收集和整理Web服务器访问日志数据,识别客户端和用户,排除无意义的访问数据;再识别用户会话,组建Web日志数据库;并根据预测目标从数据库中选取日志数据,以会话为单位组织(k+1)元组,用于训练k阶混合马尔可夫模型;采用最大期望算法学习和校准k阶混合马尔可夫模型的参数集;根据目标用户页面访问操作识别会话,应用上述模型预测用户下一步访问的Web页面。本发明可向用户推荐需要访问的页面,减少页面访问的延迟,优化用户体验;从Web服务器角度可以改善Web页面的组织结构,指导搜索引擎的结果排序,改进页面缓存机制,从而提高服务质量。
-
-
公开(公告)号:CN120032156A
公开(公告)日:2025-05-23
申请号:CN202411861572.9
申请日:2024-12-17
IPC: G06V10/764 , G06V10/26 , G06V10/82 , G06N3/0455 , G06N3/09 , G06N5/04
Abstract: 本发明提供一种基于多智能体的血红细胞图像识别分类方法,属于深度学习领域,所述红细胞图像识别分类方法包括描述阶段、推理树建立阶段和推理阶段,描述阶段首先使用分割模型分割出全部细胞并得到单个细胞图像,再使用视觉问答模型从细胞图像中提取显著的属性,推理树建立阶段使用大语言模型和精心制作的提示并基于属性和类别对搭建成一颗推理树,树节点是基于投票选举方式经过多轮迭代来选出最易区分的属性,最终的推理阶段先把细胞图像和描述阶段得到属性输入视觉问答模型得到属性描述,再输入推理树经过推理得到预测类别。
-
公开(公告)号:CN118246064A
公开(公告)日:2024-06-25
申请号:CN202410387042.9
申请日:2024-04-01
Applicant: 南京大学
Abstract: 本发明设计了一种基于多用户数据溯源图的保隐私物联网取证方法,利用遍历搜索及节点的抽象及隐藏,将多用户中不同用户的数据溯源图进行区分;采用更加适合该场景的伪随机双重密钥协商方法,提高了对于非相关用户隐私性的保护;设计了身份认证技术,便于在特定场景中更好地调查和提取相关用户或非相关用户的数据溯源图信息,具有现实意义和良好的应用前景。本发明在保护物联网取证中非相关用户的隐私性的同时,能够保证特殊场景下的证据可访问性。
-
公开(公告)号:CN118116583A
公开(公告)日:2024-05-31
申请号:CN202410433290.2
申请日:2024-04-11
IPC: G16H50/20 , G16H50/70 , G06N3/094 , G06N3/0895
Abstract: 本发明公开了一种面向医学诊疗数据的跨模态对抗性噪音生成系统及方法,包括:图文语义理解模块,它将医学图像或诊断文本信息输入统一嵌入到语义空间,使成为一个多维的隐向量,并利用自注意力机制对其进行特征提取;噪音生成模块,从提取后的特征语义信息中学习得到干扰模型的噪音;图文还原模块,其负责将在编码到语义空间的原输入加上噪音后还原为原先的图文数据;跨模态通信模块,它通过文生图和图生文模型相互的前向生成和反向恢复的自监督任务,有效完成系统中其他模块参数的训练,并完成不同模态下的语义对齐以让生成的噪音能够泛化到不同形态输入。
-
公开(公告)号:CN116913533A
公开(公告)日:2023-10-20
申请号:CN202211533173.0
申请日:2022-11-30
IPC: G16H50/70 , G16H10/60 , G06F18/241 , G06F18/214 , G06N3/0455 , G06N3/09 , G06N3/096
Abstract: 本发明公开了基于标签分布采样的病例分类模型零样本提取系统及方法,包括:预训练生成模型模块,利用公开病例数据集预训练语言生成模型;迪利克雷分布生成模块,利用训练好的教师模型的线性层计算迪利克雷分布系数;伪样本生成模块,利用生成的迪利克雷分布和预训练生成模型生成伪样本;蒸馏模块,利用伪样本和教师模型对学生模型进行蒸馏,从而将教师模型的知识转移到学生模型中。本发明能够让使得没有真实数据的情境下,可以通过已经训练好的模型转移其知识给新的轻量化模型,使用了前沿的自然语言处理预训练模型放入整个过程,保证了伪样本生成和蒸馏的有效性,可以在没有数据的现实情况下蒸馏得到适用于同一领域数据预测的轻量化新模型。
-
公开(公告)号:CN111353976B
公开(公告)日:2023-07-25
申请号:CN202010114804.X
申请日:2020-02-25
Applicant: 南京大学
IPC: G06T7/00 , G06T7/13 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于卷积神经网络的沙粒目标检测方法,其步骤是:1)设计卷积网络结构,由卷积模块和残差模块堆叠而成;添加双端输入结构和多尺度检测结构;2)基于沙粒图像和标注进行预处理;基于已标注的沙粒图像构建训练数据集;3)基于训练数据集训练卷积网络,包括目标函数定义,训练过程优化;4)应用训练好的卷积网络预测沙粒图像的目标位置。本发明充分利用单偏光图像和正交偏光图像特征,应用卷积神经网络技术,提升检测精度和检测效率;本发明方法网络训练速度快,能快速完成沙粒目标检测,适用于海量沙粒图像的自动检测,具有良好的扩展性、鲁棒性和实用性。
-
公开(公告)号:CN107957929B
公开(公告)日:2021-02-26
申请号:CN201711160414.0
申请日:2017-11-20
Applicant: 南京大学
Abstract: 本发明公开了一种基于主题模型的软件缺陷报告修复人员分配方法,本发明方法利用主题模型充分挖掘缺陷报告的隐含语义信息,然后基于已修复的缺陷报告信息和修复时间度量开发人员的经验,同时考虑开发人员的工作负载均衡,计算开发人员与目标缺陷报告的匹配度以推荐合适的开发人员。本发明计算简单,通用性和扩展性强,能快速有效地对缺陷报告进行人员分配,提高缺陷修复效率,适用于大规模软件产品的开发和维护过程。
-
公开(公告)号:CN107515822B
公开(公告)日:2019-09-03
申请号:CN201710700316.5
申请日:2017-08-16
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开了基于多目标优化的软件缺陷定位方法,包括:整理软件项目的代码文件、BUG报告以及开发人员信息;提取代码文件和BUG报告中的关键词,基于词袋模型计算代码文件和BUG报告的文本相似度函数;基于代码文件的结构特征度量,计算代码文件的结构复杂度函数;基于代码文件的开发人员信息,计算人员生疏度函数;给定BUG报告,基于上相似度函数、结构复杂度函数和开发人员生疏度函数函数,采用基于多目标优化的二阶段排序方法对代码文件进行排序,输出高缺陷怀疑率的代码文件。本发明计算简单,扩展性强,能快速有效地定位缺陷代码,可用于不同类型的代码文件,适用于大规模软件产品的开发和维护过程。
-
公开(公告)号:CN109904854A
公开(公告)日:2019-06-18
申请号:CN201910030412.2
申请日:2019-01-14
Applicant: 中国电力科学研究院有限公司 , 南京大学 , 国网江苏省电力有限公司 , 国家电网有限公司
Abstract: 本发明涉及一种面向需求响应的家庭电路负荷分解方法及系统,将采集的目标家庭的电路负荷数据,代入预先建立的深度长短期记忆网络模型中;利用深度长短期记忆网络模型对所述目标家庭的电路负荷数据进行分解,并将分解结果进行拼接,得到所述目标家庭各用电器的用电情况;其中,所述深度长短期记忆网络模型包括预先采集的典型家庭电路负荷数据。
-
-
-
-
-
-
-
-
-