-
公开(公告)号:CN117216397B
公开(公告)日:2024-03-12
申请号:CN202311237690.8
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F16/9535 , G06F16/9537 , G06N3/044 , G06N3/08
Abstract: 本发明提出一种基于区域影响的深度矩阵分解的POI推荐方法,属于智能推荐技术领域。包括:S1.获取POI数据,进行预处理,并构建用户兴趣点矩阵;S2.对用户兴趣点进行偏置分析;S3.对用户兴趣点矩阵进行正则化处理;S4.构建POI图获取POI功能嵌入表示,构建Region图获取区域嵌入表示;S5.获取区域影响指数和关联区域特征的用户兴趣点偏置矩阵;S6.构建深度矩阵分解模型,训练模型,预测用户对未知兴趣点的兴趣程度。本发明通过学习用户和POI之间的潜在特征向量,能够更好地捕捉用户的兴趣和POI的特征。通过对用户‑POI矩阵的分解和补全,能够准确地预测用户的POI访问偏好,并生成个性化的推荐结果。
-
公开(公告)号:CN117216614A
公开(公告)日:2023-12-12
申请号:CN202311237696.5
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F18/23213 , G06F18/24 , G06F18/22 , G06F16/29 , G06N3/0442 , G06N3/08
Abstract: 本发明提出一种基于时空信息提取的轨迹表征挖掘方法,属于数据挖掘技术领域。包括:S1.获取时空轨迹数据,并对数据进行预处理;S2.将时空轨迹数据映射到对应的城市区域;S3.根据区域分布的属性和用户对每个区域的访问时间点,进行初始时空特征编码;S4.将地理编码和关联访问区域编码的时间编码拼接构成轨迹的时空特征编码,并映射为向量表示;S5.将向量输入至LSTM网络中训练,捕捉上下文信息;S6.根据上下文信息计算每个区域对于轨迹经过其他区域的动态功能权重;S7.使用注意力权重对BiLSTM的输出进行加权,生成加权的上下文表示聚合每个区域在不同时段内的特征信息。解决缺少挖掘轨迹的动态功能表征方法的问题。
-
公开(公告)号:CN117216397A
公开(公告)日:2023-12-12
申请号:CN202311237690.8
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F16/9535 , G06F16/9537 , G06N3/044 , G06N3/08
Abstract: 本发明提出一种基于区域影响的深度矩阵分解的POI推荐方法,属于智能推荐技术领域。包括:S1.获取POI数据,进行预处理,并构建用户兴趣点矩阵;S2.对用户兴趣点进行偏置分析;S3.对用户兴趣点矩阵进行正则化处理;S4.构建POI图获取POI功能嵌入表示,构建Region图获取区域嵌入表示;S5.获取区域影响指数和关联区域特征的用户兴趣点偏置矩阵;S6.构建深度矩阵分解模型,训练模型,预测用户对未知兴趣点的兴趣程度。本发明通过学习用户和POI之间的潜在特征向量,能够更好地捕捉用户的兴趣和POI的特征。通过对用户‑POI矩阵的分解和补全,能够准确地预测用户的POI访问偏好,并生成个性化的推荐结果。
-
公开(公告)号:CN114896423A
公开(公告)日:2022-08-12
申请号:CN202210686880.7
申请日:2022-06-17
Applicant: 哈尔滨工业大学
IPC: G06F16/36 , G06F40/295 , G06N7/00 , G06Q10/10
Abstract: 本发明提供了一种企业基本信息知识图谱的构建方法及系统。所述构建方法包括:首先,对于包含公司基本信息的网站进行数据爬虫,采集完成知识图谱所需的相关数据;其次,对构建完成的数据集进行知识抽取:实体抽取、关系抽取、属性抽取,从复杂的数据集中明确研究对象;然后,对得到的实体、关系、属性集合进行知识融合,完成实体‑关系‑实体或者实体‑属性‑属性值的三元组建立,完成知识图谱的构建过程,并利用构建完成的知识图谱与马尔可夫逻辑网结构学习结合完成知识推理。本发明搭建了一个小型知识图谱,不仅制作了一个包含企业信息的“百科知识库”,并且可进一步利用谓词表示及马尔可夫逻辑网对缺失信息的企业的各方面信息进行准确预测。
-
公开(公告)号:CN112307364B
公开(公告)日:2021-10-29
申请号:CN202011336057.0
申请日:2020-11-25
Applicant: 哈尔滨工业大学
IPC: G06F16/9537 , G06F16/29 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/00
Abstract: 一种面向人物表征的新闻文本发生地抽取方法,属于信息提取领域,用以解决在人物表征过程中现有的命名实体识别算法缺少语义结构信息分析,导致新闻文本中出现多个地名时难以分辨新闻发生地的问题。本发明的技术要点包括,对新闻文本数据集中新闻文本进行预处理;对预处理后的新闻文本中的实体及实体类别、段落特征、句子特征、词特征进行标注;对标注后的新闻文本中的地名关系进行抽取,构建新的地名实体知识图谱;并采用基于深度森林算法gcForest对新闻文本数据集中的新闻发生地进行预测抽取。本发明可用于新闻事件相关人物的特性表征。
-
-
公开(公告)号:CN112307364A
公开(公告)日:2021-02-02
申请号:CN202011336057.0
申请日:2020-11-25
Applicant: 哈尔滨工业大学
IPC: G06F16/9537 , G06F16/29 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/00
Abstract: 一种面向人物表征的新闻文本发生地抽取方法,属于信息提取领域,用以解决在人物表征过程中现有的命名实体识别算法缺少语义结构信息分析,导致新闻文本中出现多个地名时难以分辨新闻发生地的问题。本发明的技术要点包括,对新闻文本数据集中新闻文本进行预处理;对预处理后的新闻文本中的实体及实体类别、段落特征、句子特征、词特征进行标注;对标注后的新闻文本中的地名关系进行抽取,构建新的地名实体知识图谱;并采用基于深度森林算法gcForest对新闻文本数据集中的新闻发生地进行预测抽取。本发明可用于新闻事件相关人物的特性表征。
-
-
-
-
-
-