一种基于遗传算法的自动标注方法

    公开(公告)号:CN112988981A

    公开(公告)日:2021-06-18

    申请号:CN202110525248.X

    申请日:2021-05-14

    Abstract: 本发明提供了一种基于遗传算法的自动标注方法,包括依次执行以下步骤:步骤1,预处理:获取评论,从评论中删除长度小于两个单词的评论和所有非字母数字字符,然后取小写字母,在标记化后剔除存在于NLTK语料库中的终止词,接下来,将单词简化为词根形式;步骤2,主题建模:采用LDA主题建模方法,给定一个评论列表R={r1,r2,…,rn},获得相应的词汇D={ω1,ω2,...,ωd},话题β={β1,β2,...,βk};步骤3,基于遗传算法的主题标注:设计适合该主题标注场景的染色体结构、适应度参数以及遗传算子。本发明的有益效果是:利于开发者和用户了解应用评论。

    一种层次化自适应代码生成方法、系统及介质

    公开(公告)号:CN119248289B

    公开(公告)日:2025-05-16

    申请号:CN202411775766.7

    申请日:2024-12-05

    Abstract: 本发明公开了一种层次化自适应代码生成方法、系统及介质,该方法包括:基于代码token类型预测模块分析待生成代码的上下文,识别下一个待生成token的基本类型,所述基本类型包括基本结构、代码逻辑和高级语义内容;基于解码层自适应选择算法,自动选择适当的模型层进行输出预测;利用三种不同的分类解码策略分别生成属于基本结构、代码逻辑和高级语义内容的token。本发明提高了LLMs在代码生成任务中的可靠性,使模型能够更有效地利用其内在各层次的知识,减少了生成代码的结构性或语义性错误,能有效确保生成代码的逻辑性和可执行性。

    一种层次化自适应代码生成方法、系统及介质

    公开(公告)号:CN119248289A

    公开(公告)日:2025-01-03

    申请号:CN202411775766.7

    申请日:2024-12-05

    Abstract: 本发明公开了一种层次化自适应代码生成方法、系统及介质,该方法包括:基于代码token类型预测模块分析待生成代码的上下文,识别下一个待生成token的基本类型,所述基本类型包括基本结构、代码逻辑和高级语义内容;基于解码层自适应选择算法,自动选择适当的模型层进行输出预测;利用三种不同的分类解码策略分别生成属于基本结构、代码逻辑和高级语义内容的token。本发明提高了LLMs在代码生成任务中的可靠性,使模型能够更有效地利用其内在各层次的知识,减少了生成代码的结构性或语义性错误,能有效确保生成代码的逻辑性和可执行性。

    MDATA知识图谱的可达路径查询方法及其系统

    公开(公告)号:CN115983379A

    公开(公告)日:2023-04-18

    申请号:CN202310265601.4

    申请日:2023-03-20

    Abstract: 公开了一种MDATA知识图谱的可达路径查询方法及其系统,其首先基于大型网络中的IP关联性构建通信图和实际场景下网络中节点之间的通信关系构建MDATA知识图谱,接着计算MDATA知识图谱的强连通子图和所述强连通子图中心顶点,并以中心顶点为核心构建节点的两跳标签索引,继而基于两条标签索引查询节点间的可达路径以实现快速查询来自不同强连通子图的两个节点的可达性与路径关系。同时,依据存储的事件时间对可达路径进行筛选以过滤掉不符合事件发展顺序的无效路径,从而保存攻击者实际采用的攻击路径和采用的操作,最终能够结合模式匹配的方法依据操作的时序关系和路径分析出攻击者选用的攻击方式从而采取防御措施。

    一种基于客户端分类和信息熵的联邦学习方法及装置

    公开(公告)号:CN114723071B

    公开(公告)日:2023-04-07

    申请号:CN202210450751.8

    申请日:2022-04-26

    Abstract: 本发明公开了一种基于客户端分类和信息熵的联邦学习方法及装置,涉及机器学习技术领域,该方法包括:基于客户端在非独立同分布数据场景的偏置程度,将客户端归入第一服务器或第二服务器;在相对应的服务器中训练客户端,得到训练好的客户端模型,并确定客户端模型的本地模型参数,并基于本地模型参数对应的更新第一服务器的第一模型参数和第二服务器的第二模型参数;确定第一服务器和第二服务器满足交互条件,基于第一模型参数和第二模型参数分别对应的权重,更新中央服务器的中央模型参数。本发明可以提升联邦学习的模型准确率,使得联邦学习适用于在不同混合程度的Non‑IID场景。

    基于评论有用性的自动用户评论摘要的方法

    公开(公告)号:CN114429109A

    公开(公告)日:2022-05-03

    申请号:CN202210354868.6

    申请日:2022-04-06

    Abstract: 本发明提供了一种基于评论有用性的自动用户评论摘要的方法,包括依次执行以下步骤:步骤1:预处理;对评论文本进行词形还原;步骤2:评论有用性预测;提取可能会影响评论有用性的特征,用所提取的特征来刻画评论,并使用随机森林分类模型预测评论的有用性;步骤3:基于二元词语的情感‑话题建模;向传统二元词语话题模型中加入情感变量,为评论同时建模话题和情感;步骤4:多要素话题和评论排序。本发明的有益效果是:1.本发明的方法可有效利用一些忽略的重要的评论特征辅助评论有用性预测、辅助后续的排序摘要任务;2.本发明的方法的话题的排序可以节约开发者的时间。

Patent Agency Ranking