一种基于扰动粒子群的众测联盟建立方法

    公开(公告)号:CN112418671B

    公开(公告)日:2024-12-13

    申请号:CN202011325632.7

    申请日:2020-11-24

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于扰动粒子群的众测联盟建立方法,根据能力函数初始化众测工人的报酬,获取特征的数据;得到所有特征数据及能力函数组成的三维数据集,作为群优化的初始位置分布,使用PSO算法,在加入一定扰动后,粒子初始位置分布在一定范围内,初始化众测联盟;联盟优化阶段,根据初始化数据及给定的能力函数,计算获取基于收益的最优解,根据不同的特征数据,调整计算过程中的能力函数;联盟形成阶段,每个粒子通过追随自身的个体最好位置与群体的全局最好位置来动态调整自己的飞行速度,最后通过搜索迭代找到近似最优解。本发明能够使得个人收益最大化,从而尽可能在最优化人员分配的角度下节约成本。

    一种面向众测任务发布的图文生成方法

    公开(公告)号:CN112634405B

    公开(公告)日:2024-11-01

    申请号:CN202011373051.0

    申请日:2020-11-30

    Applicant: 南京大学

    Abstract: 本发明公开了一种面向众测任务发布的图文生成方法,获取足够多的真实众测场景任务发布中的相关数据,针对不同任务,对数据进行整理和清洗;根据预处理后的结构化任务相关词,使用基于规则和模板的方法生成优质的完整任务文本描述;根据相关的任务方提供的任务描述和相关背景图生成与任务相关的词云图。使用统计得到的相关风格数据集,使用MUNIT网络模型进行无监督训练风格迁移模型。本发明通过生成相对应的任务发布文本和相关任务图片,在减轻了众测平台管理方的压力同时,能够增加众测平台使用人员的交互并且使相关任务重点内容更突出,提高了浏览和查看任务的效率。

    一种众包任务下的鲁棒分类器训练方法

    公开(公告)号:CN113361611B

    公开(公告)日:2023-12-12

    申请号:CN202110650604.0

    申请日:2021-06-11

    Applicant: 南京大学

    Abstract: 本发明提出了一种众包任务下的鲁棒分类器训练方法,使得训练得到的分类器结果更加鲁棒,在一定程度上可以抵御恶意对抗样本的攻击。本发明首先通过训练一个自动编码器,学习输入样例在隐空间上的表示。将输入投影到隐空间上后,进行两种处理并将损失与正常分类损失一起进行联合对抗训练,得到基本分类器f。鲁棒分类器g通过对输入样例加上高斯噪声扰动,利用蒙特卡罗方法不断查询基本分类器f,输出基本分类器输出最高的概率类别c。本发明还是一种可证明的防御,因而可以用在对安全性要求较高的任务中,在给定的安全范围内保证不会被恶意对抗样本攻击成功。

    一种众包测试报告的处理和分类方法

    公开(公告)号:CN112416780B

    公开(公告)日:2022-03-25

    申请号:CN202011336106.0

    申请日:2020-11-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种众包测试报告的处理和分类方法,在众包平台下发布软件测试任务,待工人测试完成后收集报告;从获得的数据中提取出Word Embedding、TF‑IDF和Metadata三个维度的特征;使用双向长短时记忆网络获得各个特征的全局编码表示,再根据特征的全局编码表示得到各个特征的注意力权重,并通过注意力权重调整全局编码;分类阶段,根据分类器得到相应的分类结果。本发明解决了没有考虑词序的问题,同事提高了分类的精度。

    一种基于行为数据的众包测试人员的评价方法

    公开(公告)号:CN113361780A

    公开(公告)日:2021-09-07

    申请号:CN202110641778.0

    申请日:2021-06-09

    Applicant: 南京大学

    Abstract: 本发明公开了一种众包测试人员的评价方法。S10数据采集,众测测试人员在众包平台上注册信息,参加考试,领取任务并参与测试提交报告;S20特征提取,把采集到数据的来源分为人员信息、人机协同、历史测试数据三类;从获取的数据中提取出身份背景、社交人脉、能力证明、履约记录、历史行为五类特征共22个指标量;S30训练逻辑回归分类器,将训练数据集中的指标数据与众测人员的评价输入逻辑回归模型,对逻辑回归模型进行训练,使用梯度上升法计算损失函数的最大似然估计,确定参数;S33,构建预测函数,求所有数据的概率值,并根据概率值和阈值得出分类器的结果;通过训练好的分类器得到人员的评价。

    一种针对时间间隔覆盖任务的众包拍卖方法

    公开(公告)号:CN113361775A

    公开(公告)日:2021-09-07

    申请号:CN202110634724.1

    申请日:2021-06-08

    Applicant: 南京大学

    Abstract: 本发明公开了一种针对时间间隔覆盖任务的众包拍卖方法,包括:1、任务建模阶段,按照众包时间顺序任务将任务建模为有向图模型,每个点代表一个任务时间阶段,每个报价人报出自己的价格,在图中以一条有向边表示,每条有向边代表完成从一个时间点到另一个时间点的任务;2、图的预处理阶段,按倒序顺序给每个顺序点加上一条反向的顺序边,该边的权重为0;3、求解阶段,使用堆优化的Dijkstra算法计算从起始点到终点的最短路径,最短路径经过的边即是拍卖的胜者;4、支付阶段,使用VCG机制的支付方法,即去除每一个胜者,再计算一次最短路径,两者之差即是最后给该胜者的支付价格,满足最优性,个体理性和激励相容。

    一种基于核约束生成的多播机制设计方法

    公开(公告)号:CN108768980B

    公开(公告)日:2021-08-17

    申请号:CN201810472825.1

    申请日:2018-05-17

    Applicant: 南京大学

    Abstract: 本发明提出一种基于核约束生成的多播机制设计方法,包括如下步骤:1)生成简化图;2)在简化图中构建最小生成树,并计算得原始图中相应的斯坦纳最小树;3)初始化支付向量为VCG机制支付向量,约束矩阵和约束向量均为空集;4)将斯坦纳最小树的边权设置为当前支付向量各维度的值,并重新计算斯坦纳最小树;5)若重新计算的斯坦纳最小树保持不变,则输出当前支付向量,结束迭代;否则生成新、旧斯坦纳最小树差集所对应的新约束,并将新约束加入约束矩阵和约束向量中,再由新生成的约束矩阵和约束向量得到新的支付向量,返回步骤4)。本发明是可防御假名攻击的多播机制,并解决了VCG机制在多播机制设计中的过度支付问题。

    一种基于词网络和词向量的短文本主题模型生成方法

    公开(公告)号:CN108710611B

    公开(公告)日:2021-08-03

    申请号:CN201810473370.5

    申请日:2018-05-17

    Applicant: 南京大学

    Abstract: 本发明提出一种基于词网络和词向量的短文本主题模型生成方法,包括如下步骤:1)学习语义信息:a、分词并去除停止词;b、根据预处理得到的短文本数据学习词向量;c、计算词语之间的语义相似度。2)对每个词语构建伪文档:a、基于语义相似度获得词语共现列表,构建词网络;b、计算词语向量的算术关系获得潜在词语列表;c、判断伪文档长度并决定是否加入相似词语。3)对每个伪文档进行LDA主题建模,得到原始文档的主题、词语频率分布。本发明通过引入语义信息构建伪文档,并对伪文档进行主题建模,从而解决了短文本数据的稀疏和不平衡问题,使在短文本上进行主题发现、文本分类和文本聚类等任务的性能得到提升。

    一种基于语义词网络的短文本主题挖掘方法

    公开(公告)号:CN110134958B

    公开(公告)日:2021-05-18

    申请号:CN201910400416.5

    申请日:2019-05-14

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于语义词网络的短文本主题挖掘方法,包括如下步骤1)模型初始化阶段:相关领域外部语料收集、语料预处理、参数设置等;2)主题单元构建阶段:构建语义词网络、寻找特定词三角结构、计算模型先验参数等工作;3)模型训练阶段:使用吉布斯采样方法对模型变量进行采样,并判断模型是否达到收敛条件;4)结果输出阶段:根据模型训练结束后的各个变量的采样结果,得到各个词三角的主题分布,进而推算出原文档的主题分布。本发明将外部语料库学习到的语义信息与词三角主题结构相结合,应用于短文本主题挖掘方面,相对于传统词对主题模型,该方法提供了一个在传统主题模型中融入外部先验知识的解决方案,并且挖掘主题的质量具有显著提升。

    用于脑卒中分析的多智能体评价准则融合的特征选择系统

    公开(公告)号:CN112434737A

    公开(公告)日:2021-03-02

    申请号:CN202011333029.3

    申请日:2020-11-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于脑卒中分析的多智能体评价准则融合的特征选择系统,包括数据输入单元、数据预处理单元、初始特征序列建立单元、多智能体强化单元、特征融合单元、逻辑回归模型单元,通过对脑卒中数据进行不同属性的处理,并通过多智能体强化学习将三种特征评价准则按照最优权重策略进行特征融合,进一步得到所有特征的重要性排序序列和最优的特征子集,本发明在提高准确率的前提下减少特征子集,得到与脑卒中最相关的影响因素,进而从特征选择的角度提高对脑卒中疾病的预测性能。

Patent Agency Ranking