-
公开(公告)号:CN114492736A
公开(公告)日:2022-05-13
申请号:CN202111658842.2
申请日:2021-12-30
Applicant: 之江实验室
Abstract: 本发明公开了一种基于梯度的样本学习难度度量方法及装置,根据给定训练样本,构建一个深度神经网络,并使用随机梯度下降作为优化策略进行一次完整训练;记录这次完整训练中,K次迭代的Softmax层前一层的梯度向量;依次计算每个样本K次迭代的梯度向量的模,均值和方差;将所得均值和方差进行加权相加,并用以度量对应样本的相对学习难度;使用局部异常因子(LoFk)对各样本的梯度向量的模的均值和方差组成的数组进行分析,视局部异常因子数值大于1的样本为异常点。针对异常点,构建一个logistic回归模型。利用上述构建的logistic回归模型,找到使异常点的局部异常因子最大的加权参数。
-
公开(公告)号:CN112328424B
公开(公告)日:2022-05-06
申请号:CN202011396662.7
申请日:2020-12-03
Applicant: 之江实验室
Abstract: 本发明公开了一种用于数值型数据的智能异常检测方法及装置,该方法包括:上传数据阶段,实现数据上传;数据池阶段,实现数据存储与数据比对;算法池阶段,实现系统智能推荐多种适合当前数据的异常检测算法;算法结果集成阶段,实现汇总各算法的计算结果并得出最终计算结果;异常点判定阶段,实现自主选择异常点判定方法并做出判定;检测结果可视化阶段,实现可视化直观展示数据尤其是异常点。本发明创新地提出了智能辅助算法推荐、算法结果集成和异常点智能判定并将其运用到系统中,极大地简化了用户操作,帮助用户在较少的时间内得到更加准确且易于观察的异常检测结果。
-
公开(公告)号:CN114241380A
公开(公告)日:2022-03-25
申请号:CN202111547952.1
申请日:2021-12-16
Applicant: 之江实验室
IPC: G06V20/40 , G06K9/62 , G06V10/774 , G06V10/764
Abstract: 本发明涉及场景识别技术领域,尤其涉及一种基于类别标签和属性注释的多任务属性场景识别方法,基于多任务属性场景识别网络MASR,利用并计算对象属性分数对对象属性进行筛选精简,简化属性注释流程,减小由数据引起的训练偏差,此外,在MASR网络中设计并运用了一种属性损失函数与一个属性层,以充分利用上述筛选与精简后的属性特征,根据对象检测分数的重要性级别,对对象属性进行重新加权。本发明有效地注释了四个大规模数据集的属性标签,实验结果表明,与最先进的方法相比,本发明学习了更具辨别力的表示并实现了有竞争力的识别性能。
-
公开(公告)号:CN114036948A
公开(公告)日:2022-02-11
申请号:CN202111246467.0
申请日:2021-10-26
IPC: G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于不确定性量化的命名实体识别方法,包括以下步骤:步骤1.收集出定位到实体位置的样本集,构建一个候选实体的检测模型;步骤2.对于样本集中的实体,采用适用于长文本记忆依赖的BILSTM和self_attention网络结构分别获取实体上下文特征和实体本身特征的表示;步骤3.采用对比损失和参数共享的思想,学习一个实体的不确定性量化模型,并给出每个实体的不确定性值;步骤4.将不确定性值转化为每个实体的dropout概率,并给定阈值,剔除掉不确定性大于阈值的样本;步骤5.通过步骤4实体的dropout概率,引入贝叶斯神经网络中蒙特卡罗dropout训练的思想训练一个新的命名实体识别模型。
-
公开(公告)号:CN113590887A
公开(公告)日:2021-11-02
申请号:CN202110814231.6
申请日:2021-07-19
IPC: G06F16/901 , G06F16/903
Abstract: 本发明提出一种基于Quegel分布式图计算系统的K‑truss分解方法,针对大型网络图,系统运行后加载图,对存储图的文件进行逐行读取转成字符串后调用自定义UDF函数,将文件中的一行字符数据转换成顶点和邻接表,并以顶点为端点的边集存入global_Edge_Map中;完成加载后,通过分解函数重置计时器,新建一个查询任务用来分解,并将该查询任务初始化后添加至查询任务队列中,再清空查询任务队列的通信量和计算量;执行查询任务队列,激活所有顶点,对激活的所有顶点进行K‑truss分解;统计并判断global_Edge_Map中边的个数,为空时,判断分解完成并退出该过程,打印信息。解决目前有的技术方案大部分都是一台机器上的图的k‑truss分解处理,当遇到大型图的处理时,需要机器很高的配置,耗费大内存的问题。
-
公开(公告)号:CN113326884A
公开(公告)日:2021-08-31
申请号:CN202110652830.2
申请日:2021-06-11
Abstract: 本发明涉及一种大规模异构图节点表示的高效学习方法及装置。该方法计算异构图中节点的邻居的重要性,根据重要性对节点的邻居进行采样;然后根据异构图中节点的类型信息,学习节点的类型嵌入向量;然后将邻居的类型嵌入向量和属性特征进行融合,得到邻居的向量表示。本发明的大规模异构图节点表示的高效学习方法是在半监督设置下,综合利用异构图的拓扑结构、关系类型、特征属性等信息,在兼顾算法的高效性和可扩展性的情况下学习节点的向量表示,实现了对大规模异构图中缺失的节点标签的分类预测。
-
公开(公告)号:CN111737570A
公开(公告)日:2020-10-02
申请号:CN202010521526.X
申请日:2020-06-10
IPC: G06F16/9535 , G06F16/36 , G06Q10/06 , G06Q50/20
Abstract: 本发明提供一种多模态在线学习资源网络推荐系统。所述网络推荐系统包括数据采集模组、学习能力评估模组、学习资源难度计算模组及学习资源推荐模组,所述数据采集模组采集学习者信息及学习资源信息,所述学习能力评估模组根据所述学习者信息获得学习者的学习能力值,所述学习资源难度计算模组根据所述学习资源信息计算学习资源难度值,所述学习资源推荐模组分别接收所述学习能力值以及所述学习资源难度值,并根据所述学习能力值及所述学习资源难度值之间的相互匹配值生成学习资源推荐方案,并选择性推荐满足匹配值的学习资源至学习者。同时,本发明还提供一种采用上述网络推荐系统的推荐方法。
-
公开(公告)号:CN111581529A
公开(公告)日:2020-08-25
申请号:CN202010376592.2
申请日:2020-05-07
IPC: G06F16/9536 , G06Q50/20
Abstract: 本发明提出了一种结合学生适合度和课程搭配度的课程推荐方法及装置,涉及计算机数据处理技术领域,该在线课程搭配推荐方法包括:获取在线课程学习平台的用户数据和课程数据;计算目标用户对于不同课程的选择的可能性值;根据课程的可能性值大小进行排序,并选取可能性最大的前d个课程,以生成课程推荐的第一子推荐列表C1;对用户u所选课程类别进行统计分析,对专业课程和其它课程分别选取搭配度高的课程,综合构建第二子推荐列表C2;将第一子推荐列表C1和第二子推荐列表C2融合,以生成最终推荐结果。该在线课程搭配推荐方法兼顾了用户与课程之间的选择合适度以及课程之间的可搭配性,提高了推荐课程的准确性,更好地满足了用户的学习需求。
-
公开(公告)号:CN111506785A
公开(公告)日:2020-08-07
申请号:CN202010150112.0
申请日:2020-03-06
IPC: G06F16/9032 , G06F16/951 , G06F40/284 , G06N7/00 , G06Q50/00 , G06Q50/26
Abstract: 本发明提供一种基于社交文本的网络舆情话题识别方法,涉及文本数据处理技术领域。本发明考虑到噪音词对文本话题发现的影响,将生成词中的主题词和生成词的噪声词分开,将噪音词过滤并推断出每个词的主题词分布,从而能准确的判断出生成该词对应的网络舆情话题,提高网络舆情话题识别的准确率,为后续的舆情监测、政府或者相关管理部门舆情引导和个性化营销等实际场景提供准确的数据支持。
-
公开(公告)号:CN114693427B
公开(公告)日:2025-02-07
申请号:CN202210222726.4
申请日:2022-03-07
Applicant: 之江实验室
IPC: G06Q40/03 , G06F18/25 , G06F18/2415 , G06N3/045 , G06N3/0442 , G06N3/088 , G06N3/09 , G06N3/048
Abstract: 本发明涉及金融信贷反欺诈领域,公开了一种金融信贷反欺诈方法,该方法利用信贷中的数据构建多关系时序网络,并对网络中节点特征进行转化,使得表征向量保留原有数据特征的同时,还保留了原数据的角色信息;使用邻居聚合的方法将不同关系不同时间下的网络节点特征进行更新,并添加对应的异步时间戳信息;最后使用门控循环后期融合模型对不同关系各个时间步的特征进行融合,获得融合后的信贷申请者的图节点联合特征,对申请者是否是消费套现或信用卡套现进行准确地判断,达到高效信贷反欺诈的效果。
-
-
-
-
-
-
-
-
-