-
公开(公告)号:CN115169252A
公开(公告)日:2022-10-11
申请号:CN202211086686.1
申请日:2022-09-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种结构化仿真数据生成系统及生成方法,所述系统包括数据预处理单元以及训练和生成单元,所述数据预处理单元用于将原始数据中的每个样本转换成向量表示,并且在转换的过程中建模贝叶斯网络用以描述特征间的关联关系;所述训练和生成单元利用原始数据转换后的向量表示进行训练,得到仿真数据生成模型,利用所述仿真数据生成模型生成仿真数据记录。本发明系统和方法能够同时生成含有连续型特征和离散型特征的仿真数据记录;针对生成仿真数据,既保持了与原始数据一致的数据分布,也保证了与原始数据一致的特征间关联关系;同时提出一种根据所需条件生成仿真数据的方法,能够根据不同的仿真数据应用场景生成分析所需的仿真数据记录。
-
公开(公告)号:CN114429109A
公开(公告)日:2022-05-03
申请号:CN202210354868.6
申请日:2022-04-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/169 , G06K9/62
Abstract: 本发明提供了一种基于评论有用性的自动用户评论摘要的方法,包括依次执行以下步骤:步骤1:预处理;对评论文本进行词形还原;步骤2:评论有用性预测;提取可能会影响评论有用性的特征,用所提取的特征来刻画评论,并使用随机森林分类模型预测评论的有用性;步骤3:基于二元词语的情感‑话题建模;向传统二元词语话题模型中加入情感变量,为评论同时建模话题和情感;步骤4:多要素话题和评论排序。本发明的有益效果是:1.本发明的方法可有效利用一些忽略的重要的评论特征辅助评论有用性预测、辅助后续的排序摘要任务;2.本发明的方法的话题的排序可以节约开发者的时间。
-
公开(公告)号:CN113987522A
公开(公告)日:2022-01-28
申请号:CN202111637333.1
申请日:2021-12-30
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种用于源代码漏洞检测的代码属性图压缩方法及装置,所述方法包括如下步骤:根据代码属性图计算基于前K跳邻居的节点邻域信息增益;对节点邻域信息增益进行局部归一化处理;选择归一化处理后的节点邻域信息增益低的节点组成候选删除节点集合,判断候选删除节点集合中是否存在割点,并将割点从候选删除节点集合中移除,最终得到删除节点集合;从代码属性图中去掉删除节点集合中的节点以及与节点相连的边,得到代码属性压缩图。本发明通过计算节点的前K跳邻居增益信息,选择增益信息低的节点进行删除同时保证压缩图的连通性,在尽可能保持代码属性图的节点属性和结构特征的情况下降低其复杂度,从而提高后续模型训练的时空效率。
-
公开(公告)号:CN113918743A
公开(公告)日:2022-01-11
申请号:CN202111526779.7
申请日:2021-12-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/51 , G06F16/54 , G06V10/774 , G06V10/764 , G06K9/62
Abstract: 本发明提供了一种面向长尾分布场景下图片分类的模型训练方法,包括:构建第一损失函数,用于加入原型归一化以及角域上与类别数量相关的带有边界的交叉熵分类损失;构建第二损失函数,使得各个类别的原型分散的更加均匀的,与类别数量相关最小角度最大化的正则项损失;构建第三损失函数,用于帮助模型有效训练的特征向量模长大小的正则化损失;将第一损失函数、第二损失函数、第三损失函数组合起来得到最终的损失函数Loss。本发明的有益效果是:本发明可以避免训练数据不均衡带来的模型先验偏差的问题以及进一步提升模型在测试集上的泛化性,从而在长尾分布场景下提升图片分类准确率。
-
公开(公告)号:CN120017478A
公开(公告)日:2025-05-16
申请号:CN202510466850.9
申请日:2025-04-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请提出的一种基于多轮消息交换的分布式请求处理方法及相关设备,方法包括:响应于任一节点服务器获取到任务请求,根据任务请求广播任务共识请求消息;针对每一节点服务器,确定对任务共识请求消息的接收状态,基于接收状态广播首次报告消息;针对每一节点服务器,响应于接收到的首次报告消息满足预设的二次报告条件,基于首次报告消息广播二次报告消息;针对每一节点服务器,根据首次报告消息以及二次报告消息广播当前投票消息;针对每一节点服务器,根据首次报告消息、二次报告消息以及投票消息,得到当前共识结果;响应于共识结果满足预设共识条件,根据当前共识结果对任务请求处理。本申请能够提高分布式系统中任务请求处理的效率。
-
公开(公告)号:CN119323141A
公开(公告)日:2025-01-17
申请号:CN202411864576.2
申请日:2024-12-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F30/20 , G01M17/007
Abstract: 本发明涉及自动驾驶技术领域,特别涉及一种用于自动驾驶仿真测试的雾天场景生成方法及系统。其方法包括步骤:S1.按照场景描述文件,在CARLA模拟器中生成对应传感器配置所需的自动驾驶场景;S2.在场景描述文件的雾天场景中,CARLA模拟器获取自动驾驶主车对应传感器的参数配置;S3.根据对应传感器的参数配置构建传感器仿真模型;S4.自动驾驶场景结合自动驾驶主车构成CARLA模拟器的自动驾驶仿真测试环境,将自动驾驶被测对象接入到自动驾驶仿真测试环境中,执行在环测试。本发明基于CARLA模拟器构建自动驾驶仿真场景,创新性地设计了一种基于物理建模的激光雷达雾仿真算法,实现了雾天驾驶场景的传感器仿真能力。
-
公开(公告)号:CN118673736B
公开(公告)日:2024-12-03
申请号:CN202411162658.2
申请日:2024-08-23
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F30/20 , G06T17/00 , G06F111/20
Abstract: 本发明公开了一种用于自动驾驶测试的雪天仿真方法、系统及介质,所述方法包括以下步骤:利用CARLA来搭建自动驾驶雪天仿真环境;在所述雪天仿真环境中对雪天激光雷达和雪天摄像头进行仿真;基于所述雪天仿真环境和所述雪天激光雷达、雪天摄像头构建雪天仿真测试系统;将被测自动驾驶系统接入所述雪天仿真测试系统,对所述雪天仿真测试系统进行测试。本发明能更加真实地仿真雪天自动驾驶环境,能够模拟出激光雷达和摄像头在雪天天气下的工作原理,进而模拟出雪天对激光传播过程和摄像头的影响,提升自动驾驶的安全性。
-
公开(公告)号:CN118331995A
公开(公告)日:2024-07-12
申请号:CN202410761162.0
申请日:2024-06-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/242 , G06F16/332 , G06F16/31
Abstract: 本申请涉及计算机技术领域,提供了从文本到SQL语句的增强方法、设备和计算机存储介质,该方法包括:对自然语言问题进行优化,得到优化的自然语言问题;基于数据库内容信息和优化的自然语言问题,生成模型的上下文感知提示;将上下文感知提示输入模型,生成与自然语言问题相应的SQL语句;对SQL语句进行评估并将评估结果向模型反馈,直至模型生成的SQL语句合规或生成次数达到预设次数。本申请的技术方案可以使得模型能够生成更精确和合规的SQL语句。
-
公开(公告)号:CN116938951B
公开(公告)日:2024-02-13
申请号:CN202311200591.2
申请日:2023-09-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04L67/104 , H04L41/00
Abstract: 本申请提供了区块链共识方法和系统、电子设备及存储介质,属于区块链技术领域。该方法包括:主节点对数据进行封装打包,得到第一区块,第一区块包括第一数据包;主节点对第一数据包进行编码处理,得到编码结果;主节点根据编码结果生成提案消息,提案消息包括第一数据包的哈希值;主节点将提案消息分发给副本节点;副本节点将提案消息转发至其他副本节点;若副本节点接收到包含第一数据包的哈希值的不少于第一阈值的提案消息,对提案消息进行解码处理,得到第一数据包;副本节点和主节点中的任一节点对第一数据包进行投票处理,得到投票结果;节点将自身的投票结果广播;节点对第一区块进行确认。本申请能够降低通信复杂度从
-
公开(公告)号:CN116738443B
公开(公告)日:2023-12-26
申请号:CN202311003502.5
申请日:2023-08-10
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F21/57 , G06F18/214
Abstract: 本发明公开了一种基于多示例感知的软件漏洞检测方法及相关设备,所述方法包括:获取包级代码片段,使用预训练模型对所述包级代码片段进行训练,得到表征向量;将表征向量分别映射到不同的线性空间中,得到包级代码片段的注意力表征向量;将第一标志向量与表征向量结合,得到包级代码片段中的每个函数代码片段的第二表征向量,将每个函数代码片段的第二表征向量拼接,再进行卷积和拆分操作,得到函数级第二标志向量和目标表征向量,并通过最大池化层计算得到文件级标志向量,根据函数级第二标志向量和文件级标志向量检测漏洞。本发明捕捉示例本身的局部信息和不同示例之间的全局信息,同时检测判断文件级代码和函数级代码是否包含漏洞。
-
-
-
-
-
-
-
-
-