-
公开(公告)号:CN119088514A
公开(公告)日:2024-12-06
申请号:CN202411076939.6
申请日:2024-08-07
Applicant: 西北工业大学
IPC: G06F9/48 , G06V10/764 , G06V10/80 , G06V10/774 , G06F9/50
Abstract: 本发明涉及人机计算任务分配技术领域,特别涉及一种基于置信度和成本的人机计算任务分配方法;所述方法包括:获取图像分类任务,人类执行者的置信度和机器执行者的置信度、设置置信度阈值,根据置信度阈值、人类执行者的置信度和机器执行者的置信度获取置信度大小的两个比较条件、根据置信度大小的两个比较条件,判断人类执行者和机器执行者进行图像分类任务的准确率,决定图像分类任务的执行者;本发明解决了现有技术中资源冗余和成本增加、缺乏动态响应能力的问题,不仅能够充分利用人机协同的优势,提高任务完成的准确率,还能在动态变化的环境中灵活调整任务分配,优化资源利用效率。
-
公开(公告)号:CN119005287A
公开(公告)日:2024-11-22
申请号:CN202411023440.9
申请日:2024-07-29
Applicant: 西北工业大学
IPC: G06N3/092 , G06N3/094 , G06N3/045 , G06N3/0475 , G06N3/006
Abstract: 一种基于多维人类反馈融合的人机强化学习方法,包括通过专家演示,基于策略生成器和鉴别器进行生成式对抗模仿学习,使得策略生成器学到的策略无法被鉴别器区分,得到演示奖励函数;利用用户的轨迹偏好,得到符合用户偏好的偏好奖励函数;融合演示奖励函数和偏好奖励函数,得到统一奖励函数,并通过动态奖励权重调整策略解决演示奖励函数与偏好奖励函数之间的冲突。本申请可以克服单一反馈所带来的限制以及多个反馈源之间存在的潜在冲突,增强了奖励函数的鲁棒性和连贯性。
-
公开(公告)号:CN118446280A
公开(公告)日:2024-08-06
申请号:CN202410514458.2
申请日:2024-04-26
Applicant: 西北工业大学
IPC: G06N3/092
Abstract: 本发明涉及博弈论技术领域,具体涉及一种基于同伴激励的集中式单次博弈方法及系统,该方法包括获取多个智能体;基于猎鹿博弈,确定每个智能体的行为;使用同伴激励机制对每个智能体行为进行扩展与定义同伴奖励;对每个行为扩展后的智能体的Q‑Network进行训练;当Q‑Network中用于控制训练次数的参数小于第一阈值时,训练结束,获得行为扩展后的每个智能体训练好的Q‑Network;每个智能体根据训练好的Q‑Network得到最大收益的亲社会行为。本发明在训练过程中通过历史交互信息实时更新合作倾向,并在一定的时间步长更新合作关系,实现智能体之间的有效交互,最终达到最大化智能体系统收益的目的。
-
公开(公告)号:CN117711641A
公开(公告)日:2024-03-15
申请号:CN202311726832.7
申请日:2023-12-15
Applicant: 西北工业大学
Abstract: 本发明涉及一种面向在线问诊的人机协作分层强化学习方法及框架,属于人机协作技术领域。框架包括分配层、执行层、诊断模型和患者模拟器,分配层由Master智能体组成;执行层由人类医生、激活器以及多个反应器组成。采用基于强化学习的智能人机资源分配策略对分配层进行人机分配,对执行层进行症状询问;本发明提出了一个基于分层强化学习的机器模块,可以有效地从大量症状中进行选择,性能可与基于Transformer的最佳模型相媲美。最后,大量实验证明本发明可以在仅占10.9%的人力劳动成本的情况下实现高达89.4%(相对100%)的准确率。
-
公开(公告)号:CN114998044A
公开(公告)日:2022-09-02
申请号:CN202210504293.1
申请日:2022-05-10
Applicant: 西北工业大学
IPC: G06Q50/00
Abstract: 本发明公开了一种在线社区亲社会与反社会行为传染性度量方法,首先获取在线社区用户个人属性数据、用户历史回答数据和社交关系数据;接着通过回答数据是否被折叠并且根据折叠原因将其标注为反社会行为,通过textcnn模型对回答数据是否是亲社会行为进行标注;然后对时间因素、用户免疫状态、传染者与易感者的相互状态、亲社会与反社会行为之间的相互影响和环境因素进行度量,得到一个用户可能受另一个用户的传染而回答问题的概率;最后使用PageRank算法,结合传染概率和重启因素,断进行迭代,得到最终的用户传染性度量数值排序。该方法由于考虑到了行为传染的多种影响因素,对于用户传染性度量具有较好的性能。
-
公开(公告)号:CN112989592A
公开(公告)日:2021-06-18
申请号:CN202110254837.9
申请日:2021-03-09
Applicant: 西北工业大学
IPC: G06F30/20 , G06Q30/02 , G06F111/04 , G06F111/08
Abstract: 本发明公开了一种基于动态犯罪网络的事件场景建模方法,首先对犯罪事件中的空间特征组进行处理;接着使用效用函数将犯罪网络节点中包含的个人信息归纳到犯罪网络的分析,并且将一个犯罪活动抽象为交易利益最大化的模型;最终在约束条件下求出最优解。本发明确保了犯罪事件与不同犯罪类型和犯罪地点之间的动态交互性,保护了犯罪事件在动态变化的犯罪场景中的多变性。
-
公开(公告)号:CN110889560A
公开(公告)日:2020-03-17
申请号:CN201911240899.3
申请日:2019-12-06
Applicant: 西北工业大学
Abstract: 本发明提供一种具有深度可解释性的快递序列预测的方法,将未来一段时间内目标区域的快递业务量表示为一个连续时间段中每天快递包裹量形成的时间序列,所述快递序列预测则为多步时间序列的预测。本发明提出的一种具有深度可解释性的快递序列预测的方法,与现有的预测快递业务量的方法相比,具有对多个因素的复杂耦合关系进行建模和自适应的动态分配影响权重的特定。同时该发明能够对方法的预测过程提供解释,发掘用户快递行为与影响因素的关联关系,在资源调度分配、电商促销活动等应用场景有着极其重要的作用。
-
公开(公告)号:CN118864085A
公开(公告)日:2024-10-29
申请号:CN202410890436.6
申请日:2024-07-04
Applicant: 西北工业大学
IPC: G06Q40/03 , G06N3/092 , G06N3/0442
Abstract: 本发明公开了一种基于显式信用分配的合作多智能体协同方法。其中,该方法包括:获取每一智能体的初始状态信息、初始动作信息和历史动作信息,其中,初始状态信息、初始动作信息为当前时刻每一智能体观测到的除过自身智能体的剩余智能体的初始状态信息和初始动作信息,历史动作信息为当前时刻的前一时刻的所述每一智能体的历史动作信息。本发明解决了现有技术在合作多智能体系统对全局奖励分配时,隐式方法受到分解函数设计的限制,导致分解不够充分,并且在信用分配方面缺乏可解释性,显式方法:在涉及微妙联盟的共同目标下非常复杂,进而因全局奖励分配不明确而导致的协同合作困难技术问题。
-
公开(公告)号:CN118468897A
公开(公告)日:2024-08-09
申请号:CN202410551137.X
申请日:2024-05-07
Applicant: 西北工业大学
IPC: G06F40/58 , G06F40/253 , G06F18/24 , G06F18/214 , G06N3/0442 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于抽象语法树的人机协作程序翻译方法,首先源程序的抽象语法树输入到训练好的程序翻译机器模型,程序翻译模型根据源抽象语法树翻译得到目标抽象语法树;然后在翻译模型得到的翻译结果上进行检查,若发现错误,可选择合适的人机协作形式来进行修改,包括基于首个错误的修改和基于层次的修改方式;最后程序翻译模型收到修改信息作为反馈,根据反馈信息,程序翻译模型生成更优结果,随后将生成的更优结果进行检查。本发明将人机协作引入基于抽象语法树的程序翻译当中,充分利用了程序的结构性,减少了人力消耗。
-
公开(公告)号:CN116911408A
公开(公告)日:2023-10-20
申请号:CN202310298785.4
申请日:2023-03-24
Applicant: 西北工业大学
Abstract: 本发明公开了一种基于模型拆分的混合联邦学习方法,首先提出自适应模型拆分算法,对设备模型进行拆分,以减少模型传输带来的开销。其次基于拆分学习对设备参数进行优化,并提出多粒度模型聚合算法对不同层次的模型进行簇聚合。最后通过实验证明了本方法通过共享少量数据,在不降低全局模型精度的情况下,显著减少了系统中的数据传输量。
-
-
-
-
-
-
-
-
-