-
公开(公告)号:CN119272770B
公开(公告)日:2025-05-16
申请号:CN202411190943.5
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06N3/045 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制优化的网络数据命名实体识别方法,属于命名实体识别的预训练模型优化技术领域。解决了现有技术中传统的网络数据命名实体识别方法因未考虑网络安全数据特点导致的识别结果精度较低的问题;本发明给定输入序列,将其输入BERT模型,生成三种嵌入并进行相加,得到词的最终输入,输入到引入BERT模型的Transformer‑XL模型,设置基础矩阵,引入内容嵌入矩阵和位置嵌入矩阵,得到内容嵌入基础矩阵和位置嵌入基础矩阵;获得句子中任意两个单词之间的注意力机制分数,对所有注意力机制分数的加和进行归一化,得到归一化后的注意力机制分数。本发明有效提升了命名实体识别的精度,可以应用于实体识别。
-
公开(公告)号:CN119272770A
公开(公告)日:2025-01-07
申请号:CN202411190943.5
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06N3/045 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制优化的网络数据命名实体识别方法,属于命名实体识别的预训练模型优化技术领域。解决了现有技术中传统的网络数据命名实体识别方法因未考虑网络安全数据特点导致的识别结果精度较低的问题;本发明给定输入序列,将其输入BERT模型,生成三种嵌入并进行相加,得到词的最终输入,输入到引入BERT模型的Transformer‑XL模型,设置基础矩阵,引入内容嵌入矩阵和位置嵌入矩阵,得到内容嵌入基础矩阵和位置嵌入基础矩阵;获得句子中任意两个单词之间的注意力机制分数,对所有注意力机制分数的加和进行归一化,得到归一化后的注意力机制分数。本发明有效提升了命名实体识别的精度,可以应用于实体识别。
-
公开(公告)号:CN118070774A
公开(公告)日:2024-05-24
申请号:CN202410353286.5
申请日:2024-03-26
Applicant: 哈尔滨工业大学
IPC: G06F40/194 , G06F40/242 , G06F40/216
Abstract: 一种基于目标信息识别的用户生成内容立场检测方法及系统,涉及社交网络数据处理技术领域。本发明为了解决现有的用户生成内容立场检测或识别方法需要花费大量人工成本去标注目标信息,并且仅有的类似方法在目标识别阶段往往需要大规模数据对模型进行训练或微调,导致样本数据质量会直接影响目标识别的性能和准确率的问题。技术要点:首先从给定社交媒体文本中抽取出具有代表性的关键词;然后通过余弦相似度计算关键词与目标集合中特定目标之间的相似度,并根据相似度将确定文本所针对的目标对象;最后基于识别出的目标对象,采用多任务BERTweet模型来检测文本与该目标对象之间的立场关系。本发明所提出的基于目标信息识别的用户生成内容立场检测方法可有效减少人工成本,从而提高了立场检测方法在实际应用中的可行性和实用性。
-
公开(公告)号:CN117216397B
公开(公告)日:2024-03-12
申请号:CN202311237690.8
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F16/9535 , G06F16/9537 , G06N3/044 , G06N3/08
Abstract: 本发明提出一种基于区域影响的深度矩阵分解的POI推荐方法,属于智能推荐技术领域。包括:S1.获取POI数据,进行预处理,并构建用户兴趣点矩阵;S2.对用户兴趣点进行偏置分析;S3.对用户兴趣点矩阵进行正则化处理;S4.构建POI图获取POI功能嵌入表示,构建Region图获取区域嵌入表示;S5.获取区域影响指数和关联区域特征的用户兴趣点偏置矩阵;S6.构建深度矩阵分解模型,训练模型,预测用户对未知兴趣点的兴趣程度。本发明通过学习用户和POI之间的潜在特征向量,能够更好地捕捉用户的兴趣和POI的特征。通过对用户‑POI矩阵的分解和补全,能够准确地预测用户的POI访问偏好,并生成个性化的推荐结果。
-
公开(公告)号:CN117216614A
公开(公告)日:2023-12-12
申请号:CN202311237696.5
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F18/23213 , G06F18/24 , G06F18/22 , G06F16/29 , G06N3/0442 , G06N3/08
Abstract: 本发明提出一种基于时空信息提取的轨迹表征挖掘方法,属于数据挖掘技术领域。包括:S1.获取时空轨迹数据,并对数据进行预处理;S2.将时空轨迹数据映射到对应的城市区域;S3.根据区域分布的属性和用户对每个区域的访问时间点,进行初始时空特征编码;S4.将地理编码和关联访问区域编码的时间编码拼接构成轨迹的时空特征编码,并映射为向量表示;S5.将向量输入至LSTM网络中训练,捕捉上下文信息;S6.根据上下文信息计算每个区域对于轨迹经过其他区域的动态功能权重;S7.使用注意力权重对BiLSTM的输出进行加权,生成加权的上下文表示聚合每个区域在不同时段内的特征信息。解决缺少挖掘轨迹的动态功能表征方法的问题。
-
公开(公告)号:CN107256980B
公开(公告)日:2020-06-19
申请号:CN201710586267.7
申请日:2017-07-18
IPC: H01M10/0525 , H01M10/0567 , H01M10/058 , H01M10/42
Abstract: 本发明公开了一种提高锂离子电池耐过放电性能的方法,所述方法包括如下步骤:一、使用含有LiODFB和腈化合物的溶液对锂离子电池的负极进行表面电化学成膜化处理,或进行表面电化学成膜化和内部嵌锂化处理;二、使用步骤一预成膜后的负极,或使用步骤一预成膜且预嵌锂后的负极组装锂离子电池,并在锂离子电池的电解液中同时添加LiODFB和腈化合物。本发明的耐过放电方法兼顾了电池的负极固体/电解质界面膜和负极集流体长时间处于高电位的稳定性,因此可以提高锂离子电池的零伏存储性能,即提高锂离子电池耐受长时间处于零伏状态的能力。
-
公开(公告)号:CN118484481B
公开(公告)日:2025-05-02
申请号:CN202410663869.8
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/29 , G06F18/22 , G06F18/23213 , G06N3/0455 , G06N3/048 , G06N3/0499 , G06N3/08
Abstract: 一种基于时空信息提取的轨迹相似度分析方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为更全面准确地评估轨迹相似性,本发明采集时空轨迹数据,进行数据清洗、编码预处理,得到预处理后的时空轨迹数据输入到具有位置代码层的Transformer模型中进行处理,输出时空轨迹表征结果;将时空轨迹表征结果,通过余弦相似度进行T‑SNE降维处理,然后再进行K‑Means聚类,得到基于时空信息提取的轨迹相似度分析的可视化结果。本发明将复杂的轨迹数据转化为易于处理的向量形式,进而利用相似度分析算法对轨迹数据进行高效的比对和分类。这不仅能够提高数据分析的效率,还能够提升分析的准确性和可靠性。
-
公开(公告)号:CN119167936B
公开(公告)日:2025-04-29
申请号:CN202411190960.9
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/08
Abstract: 基于BERT预训练模型的网络安全NER数据增广方法、电子设备及存储介质,属于网络安全数据处理技术领域。为提高网络安全数据的效率和准确度,本发明采集网络空间安全报告,得到网络空间安全数据;使用BIO方法标注采集的网络空间安全报告,得到的文本序列和标签序列,作为原始数据集;构建BERT预训练模型;将网络空间安全数据进行掩码处理,然后输入到BERT预训练模型中进行训练,得到用于网络安全NER数据的BERT训练模型;将原始数据集进行掩码处理,输入到用于网络安全NER数据的BERT训练模型,将得到的用于网络安全NER数据的BERT训练结果和步骤S2得到的原始数据集进行合并后得到增广数据集。
-
公开(公告)号:CN118485181B
公开(公告)日:2024-12-20
申请号:CN202410663873.4
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06F16/2458 , G06F16/29 , G06N3/0455 , G06N3/0499 , G06N3/047 , G06N3/0464 , G06N3/049 , G06Q50/26
Abstract: 一种基于时空轨迹表征挖掘的轨迹序列预测方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为提高处理时序轨迹序列数据的效率和准确性,本发明包括采集时空轨迹数据,对时空轨迹数据进行预处理后,采用填充技术将所有预处理后的时空轨迹数据的长度补齐至采集的轨迹数据最长长度,然后进行掩码操作,得到掩码处理的时空轨迹数据;进行位置编码,得到位置编码的时空轨迹序列输送到Transformer模型中的基于结合多头注意力的全连接网络层进行训练,输出自注意力层的输出结果输送到前馈神经网络层中进行处理,得到包含输入轨迹数据的时空特征表示结果输送到解码器中,输出轨迹预测结果。本发明预测准确。
-
公开(公告)号:CN118485181A
公开(公告)日:2024-08-13
申请号:CN202410663873.4
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06F16/2458 , G06F16/29 , G06N3/0455 , G06N3/0499 , G06N3/047 , G06N3/0464 , G06N3/049 , G06Q50/26
Abstract: 一种基于时空轨迹表征挖掘的轨迹序列预测方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为提高处理时序轨迹序列数据的效率和准确性,本发明包括采集时空轨迹数据,对时空轨迹数据进行预处理后,采用填充技术将所有预处理后的时空轨迹数据的长度补齐至采集的轨迹数据最长长度,然后进行掩码操作,得到掩码处理的时空轨迹数据;进行位置编码,得到位置编码的时空轨迹序列输送到Transformer模型中的基于结合多头注意力的全连接网络层进行训练,输出自注意力层的输出结果输送到前馈神经网络层中进行处理,得到包含输入轨迹数据的时空特征表示结果输送到解码器中,输出轨迹预测结果。本发明预测准确。
-
-
-
-
-
-
-
-
-