正反向训练去混淆文本检索方法

    公开(公告)号:CN103150371B

    公开(公告)日:2016-06-29

    申请号:CN201310074209.8

    申请日:2013-03-08

    Abstract: 本发明涉及一种基于正反向训练的去混淆文本检索方法,属于计算机科学与信息检索技术领域。本发明首先对符合检索意愿和违背检索意愿的文本进行语言特征提取,训练得到检索模板;进而利用该检索模板,对待检索文本提取的语言特征库进行检索,得到检出文本,并按照与检索模板相似度由高到低对检出文本进行排序;最终在检出文本中,使用符合检索意愿和违背检索意愿的文本,反馈式更新检索模板,重新检索,得到优化检索结果。与现有技术相比,本发明采用的正、反向训练文本检索方法具有检索准确率高、检索速度快、去混淆明显等特点。

    一种生物医学空缺数据弥补方法

    公开(公告)号:CN103177088B

    公开(公告)日:2016-05-18

    申请号:CN201310074916.7

    申请日:2013-03-08

    Abstract: 本发明涉及一种基于EM聚类-BP神经网络的空缺数据弥补方法,属于生物医学技术领域。本发明首先采用处理不完全数据问题中很重要的迭代算法EM算法,通过EM聚类,将不同缺失数据划分到不同的簇中,完成初步弥补;然后通过BP神经网络方法对每个簇中的完全数据建模,并完成对各个簇中缺失数据的精确弥补。在一定程度上加强弥补算法对任意缺失机制的适用性,并提高弥补的准确性,可适用于生物医学空缺数据弥补领域。

    一种高精度汉语谓词识别方法

    公开(公告)号:CN103150381B

    公开(公告)日:2016-03-02

    申请号:CN201310080760.3

    申请日:2013-03-14

    Abstract: 本发明涉及一种基于规则和统计相结合的谓词识别方法,属于自然语言处理与机器学习领域,目的是为解决谓词高精度高效率识别问题。本发明采用分步识别方法,从已进行词法和句法标注的句子中识别谓词,首先对待测句子进行词法分析,得到可疑谓词及其个数;接着利用初步识别判定条件进行谓词初步识别;对不满足初步识别判定条件的可疑谓词提取相关词法和句法特征并利用C4.5训练得到的决策树判定模型对其进行判定;最终汇总两步识别结果给出每个待测句子中的谓词。本发明具有准确率高、识别速度快、对非动词性谓词识别率高等特点,适用于要求高精度的汉语谓词识别领域,对句义分析的发展具有很大的推动作用,具有很好的应用价值和推广价值。

    基于CRF++汉语句义结构模型自动标注方法

    公开(公告)号:CN103176963A

    公开(公告)日:2013-06-26

    申请号:CN201310074933.0

    申请日:2013-03-08

    Abstract: 本发明涉及一种基于CRF++的汉语句义结构模型自动标注方法,属于计算机科学与自然语言处理语义分析技术领域。本发明首先使用BFS-CTC汉语标注语料库语料,训练得到谓词识别模型、词关系识别模型和语义格类型识别模型;进而使用上述三种识别模型,对原始句子进行识别,得到句子中谓词信息、词关系信息和语义格类型信息;最终根据谓词、词关系和语义格类型的搭配规则得到汉语句义结构模型。本发明为语义分析领域,提供了更多的更全面的语义特征,为使用计算机对句子进行句义结构模型分析奠定了基础。同时为BFS-CTC汉语标注语料库的自动标注,提供了一定的可能,语料数据无论是研究还是实际应用,都是极其重要的,将对BFS-CTC汉语标注语料库的扩充,起到极大的推动作用。

    正反向训练去混淆文本检索方法

    公开(公告)号:CN103150371A

    公开(公告)日:2013-06-12

    申请号:CN201310074209.8

    申请日:2013-03-08

    Abstract: 本发明涉及一种基于正反向训练的去混淆文本检索方法,属于计算机科学与信息检索技术领域。本发明首先对符合检索意愿和违背检索意愿的文本进行语言特征提取,训练得到检索模板;进而利用该检索模板,对待检索文本提取的语言特征库进行检索,得到检出文本,并按照与检索模板相似度由高到低对检出文本进行排序;最终在检出文本中,使用符合检索意愿和违背检索意愿的文本,反馈式更新检索模板,重新检索,得到优化检索结果。与现有技术相比,本发明采用的正、反向训练文本检索方法具有检索准确率高、检索速度快、去混淆明显等特点。

    多类别面部表情高精度识别方法

    公开(公告)号:CN102831447A

    公开(公告)日:2012-12-19

    申请号:CN201210314435.4

    申请日:2012-08-30

    Abstract: 本发明涉及一种基于Haar-like特征的多类别面部表情高精度识别方法,属于计算机科学与图形图像处理技术领域。本发明首先使用Haar-like特征和串联人脸检测分类器实现高准确性的人脸检测;进而利用AdaBoost.MH算法对高维Haar-like特征进行特征筛选;最终使用随机森林算法进行表情分类器训练,以完成表情识别。与现有技术相比,本发明在进一步提升多种类别表情识别率的同时,大大减少训练和识别的时间开销,并可方便地实现并行化,以进一步提高识别效率、满足实时处理及移动计算的需求。本发明可对静态图像和动态视频进行高精度识别;不仅适用于桌面计算机,也适用于手机、平板电脑等移动计算平台。

    基于梯度驱动数据生成的模型窃取攻击方法

    公开(公告)号:CN114547102B

    公开(公告)日:2025-04-04

    申请号:CN202210047190.7

    申请日:2022-01-14

    Abstract: 本发明涉及基于梯度驱动数据生成的模型窃取攻击方法,属于计算机与信息科学技术领域。该方法先对数据集进行K‑means聚类;然后将聚类簇质心组成的查询数据集通过API输入到目标模型中得到每条数据对应的标签;接着使用数据‑标签对作为训练集训练替代模型;最后根据目标模型和替代模型间的输出差异构造目标函数,并基于函数梯度生成数据以迭代训练替代模型。本发明基于模型间输出差异梯度来生成数据并以此窃取目标模型,解决了模型窃取过程中目标模型训练集未知造成的替代模型准确率低的问题,减少了目标模型API调用的次数,提高了模型窃取效率。

    概念关系推理的双视角知识追踪方法

    公开(公告)号:CN117634551A

    公开(公告)日:2024-03-01

    申请号:CN202311665971.3

    申请日:2023-12-06

    Abstract: 本发明涉及概念关系推理的双视角知识追踪方法,属于计算机与信息科学技术领域。本发明首先基于学习者答题记录,通过因果GRU构建概念关系矩阵和知识状态矩阵;然后以两个矩阵为基础构建知识状态图,利用图卷积网络提取邻居节点特征,得到概念关联视角的知识状态图嵌入;同时依据概念关系矩阵将知识状态矩阵序列加权求和,得到时间依赖视角的历史知识状态矩阵;最后结合新问题概念嵌入,预测学习者是否回答正确。本发明针对现有方法未充分挖掘概念关联关系和知识状态时间依赖的问题,提出概念关系推理的双视角知识追踪方法,提升知识追踪预测正确率。

    融合多级特征的增量式动态权值集成学习入侵检测方法

    公开(公告)号:CN115118450B

    公开(公告)日:2024-01-05

    申请号:CN202210534998.8

    申请日:2022-05-17

    Abstract: 本发明涉及融合多级特征的增量式动态权值集成学习入侵检测方法,属于计算机与信息科学技术网络空间安全领域。本发明首先通过混合时间窗重建流量的拓扑特征,同时为时间窗内的流量建立敏感数据流向特征;其次基于注意力机制融合拓扑特征,生成特征向量;然后训练初级分类器和深度置信网络,并在深度置信网络训练过程中加入历史知识;最后利用深度置信网络生成动态权值构建训练集并训练次级分类器。本发明有效缓解了集成学习入侵检测方法中单一级别特征无法检测出高隐蔽性攻击和动态权值生成不精确且不具有可持续性导致检测性能下降的问题,有效提升了入侵检测模型的分类准确率。

    网络安全CTF竞赛多种类作弊识别与溯源分析方法

    公开(公告)号:CN115759811A

    公开(公告)日:2023-03-07

    申请号:CN202211327519.1

    申请日:2022-10-27

    Abstract: 本发明涉及一种网络安全CTF竞赛多类作弊识别与溯源分析方法,属于网络安全技术领域。本发明首先对选手比赛答题过程进行监测并记录日志;然后使用有限状态机分析答题步骤的逻辑异常的选手,基于正态分布判断答题步骤用时异常的选手,并依据flag提交时间提出选手关联度计算方法,发现可疑高相似性选手,对选手作弊来源进行分析追溯;最后收集并综合判别可疑选手Writeup、新旧环境下答题日志,输出作弊识别结果及分析报告。方法有效识别了CTF竞赛中代替参赛、一人多号、抄袭其他选手flag或解题思路的作弊行为,定位到可疑的相似选手;同时能够收集可疑选手多维度特征综合对比分析,输出更具说服力的判别结果和作弊分析报告,保证比赛的公平性。

Patent Agency Ranking