-
公开(公告)号:CN117422527A
公开(公告)日:2024-01-19
申请号:CN202311526419.6
申请日:2023-11-15
Applicant: 哈尔滨工业大学
IPC: G06Q30/0601 , G06F16/9536 , G06F16/9535
Abstract: 本发明公开了一种基于用户偏好感知的全新商品冷启动方法,包括:获取用户协同特征、商品协同特征和商品内容特征;基于用户协同特征和商品协同特征,建立用户与商品的关系模型;基于商品协同特征和商品内容特征,将同一商品的内容特征与协同特征进行对齐,获取商品层级特征对齐模型;将同一用户购买记录中除目标商品外的所有商品的协同特征进行聚合,获取用户偏好;将用户偏好与商品内容特征进行对齐,获取群组层级特征对齐模型;将用户与商品的关系模型、商品层级特征对齐模型、群组层级特征对齐模型进行联合损失优化,获取联合损失模型,并将原有商品和全新商品分别通过协同特征和内容特征进行推荐。本发明能够更好的解决全新商品冷启动问题。
-
公开(公告)号:CN116757195A
公开(公告)日:2023-09-15
申请号:CN202310746692.3
申请日:2023-06-25
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/30 , G06F40/216 , G06N20/00
Abstract: 本发明公开了一种基于提示学习的隐性情感识别方法,包括以下步骤:获取情感文本进行主题识别,基于识别的主题,选择种子词对应的母类别;基于种子词对应的母类别,采用未标记评论的聚类和余弦相似度对所述种子词继续进行类别检测,获得所述种子词对应的子类别;构建提示模板,将所述种子词对应的子类别嵌入到所述提示模板中并进行训练,将训练后的提示模板与预训练语言模型相结合,识别出对应的隐性情感。本发明构建的提示模板相较于手工构建的模板可以更加匹配预训练语言模型,通过让下游任务主动适应大型预训练语言模型的方式提升学习效率。
-
公开(公告)号:CN116501890A
公开(公告)日:2023-07-28
申请号:CN202310486585.1
申请日:2023-04-28
Applicant: 哈尔滨工业大学
IPC: G06F16/36 , G06N3/0464
Abstract: 本发明提供一种知识图谱嵌入向量确定方法、装置、电子设备及存储介质,涉及知识图谱技术领域,该方法包括:根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量;根据属性节点关系嵌入向量,确定各个属性节点的第一嵌入向量;根据预设关系因子,确定第一实体节点关系嵌入向量;根据第一嵌入向量和第一实体节点关系嵌入向量,确定第二实体节点知识图谱;根据第二实体节点知识图谱中第一实体节点关系嵌入向量,确定各个实体节点的第二嵌入向量;根据第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量。
-
公开(公告)号:CN114547232A
公开(公告)日:2022-05-27
申请号:CN202111406140.5
申请日:2021-11-24
IPC: G06F16/33 , G06F40/279 , G06K9/62
Abstract: 本发明提供了一种低标注成本的嵌套实体识别方法及系统,该方法包括:获取训练文本,对所述训练文本中的实体进行预标注,获得标注文本;从所述标注文本中提取正样本;对所述标注文本进行负采样,获得负样本集合,将所有所述正样本与至少一个负样本作为训练样本集,其中,所述负样本的类别标注为非实体类别;基于预训练语言模型处理所述训练样本集中的训练样本,获得语义编码,向所述语义编码中添加相对位置信息获得样本编码;将每个所述样本编码输入至全连接网络,使用分类模型进行多分类处理,获得第一训练结果,基于所述第一训练结果优化所述分类模型。保证在减少人工标注成本的前提下获得准确率高、鲁棒性好的预测模型。
-
公开(公告)号:CN110510584A
公开(公告)日:2019-11-29
申请号:CN201910912645.5
申请日:2019-09-25
Applicant: 哈尔滨工业大学
Abstract: 一种CoSbSe纳米片材料的制备方法及其应用,本发明属于纳米材料制备技术领域,它的目的是针对CoSbSe作为热电材料所存在的制备过程所需温度较高、时间较长、能耗较高的问题。CoSbSe纳米片的制备方法:一、对碳布进行超声清洗;二、按照化学计量比Sb:Se=1:1的比例将锑粉和硒粉混合;三、将钴盐、尿素和氟化铵加入到超纯水中搅拌溶解;四、碳布浸入步骤三的反应液中水热反应;五、将锑硒粉混合物和前驱体一同放入石英管中,抽真空密封,分两个阶段加热反应,得到CoSbSe纳米片。本发明得到的CoSbSe纳米片所需的制备温度大幅度降低,所需的制备时间大幅度减少,有利于清洁高效制备CoSbSe纳米片。
-
公开(公告)号:CN102043910A
公开(公告)日:2011-05-04
申请号:CN201010600321.7
申请日:2010-12-22
Applicant: 哈尔滨工业大学
Abstract: 一种基于Top-n-gram的蛋白质远程同源性检测和折叠识别方法,涉及一种蛋白质远程同源性检测和折叠识别方法。本发明为了解决现有的蛋白质远程同源性检测和折叠识别方法中,二进制谱无法找到最优阈值,无法区分氨基酸出现频率的差别的问题。具体步骤:一、运行PSI-BLAST,输入测试蛋白质序列进行多序列比对,计算氨基酸i的伪计数;二、生成频率谱;三、将频率谱转化为Top-n-gram;四、获得测试蛋白质序列对应的潜在语义表达向量;五、将测试蛋白质序列对应的潜在语义表达向量输入SVM分类器进行分类,得到预测结果。应用于蛋白质同源性检测和折叠识别领域。
-
公开(公告)号:CN113987179B
公开(公告)日:2024-03-22
申请号:CN202111255353.2
申请日:2021-10-27
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F18/214 , G06N3/0455 , G06N3/0985 , G06F18/24
Abstract: 本申请公开了一种基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质,属于自然语言处理技术领域。本申请首先利用编码器,通过设计不同的掩码矩阵以实现对话中各方的交互,同时引入对话历史信息,仅在词编码阶段就考虑了情感动力学的影响。然后,本申请通过利用图注意力网络实现对外部结构化情感知识的利用,从而扩充了话语的语义信息,弥补了词编码器模块在某些特定维度上知识的缺失。最终,在任务损失函数的基础上又加入了一个回溯损失以达到在训练过程中利用过去模型状态的先验经验的效果。旨在利用先前的训练经验来指导权重更新,确保模型决策更接近真实值,而不是前一个训练步骤中表现相对较差的预测。
-
公开(公告)号:CN116738053A
公开(公告)日:2023-09-12
申请号:CN202310718242.3
申请日:2023-06-16
IPC: G06F16/9535 , G06N3/045
Abstract: 一种基于文本蕴含的跨域新闻推荐系统及推荐方法,属于信息推荐技术领域。为解决跨域新闻的推荐的问题。本发明包括包括用户领域兴趣生成模块、基于BERT的新闻嵌入模块、基于注意力机制的用户情景兴趣生成模块、基于文本蕴含思想的兴趣融合模块、点击率预测模块、损失函数计算模块;所述基于BERT的新闻嵌入模块分别连接基于注意力机制的用户情景兴趣生成模块、点击率预测模块,所述用户领域兴趣生成模块、基于注意力机制的用户情景兴趣生成模块连接基于文本蕴含思想的兴趣融合模块、所述基于文本蕴含思想的兴趣融合模块连接点击率预测模块,所述点击率预测模块连接损失函数计算模块。本发明在新闻推荐任务中效果更明显的提升。
-
公开(公告)号:CN113344060B
公开(公告)日:2022-07-08
申请号:CN202110600977.7
申请日:2021-05-31
Applicant: 哈尔滨工业大学
Abstract: 本发明提供了一种文本分类模型训练方法、诉讼状分类方法及装置,训练方法包括:获取预先根据文本信息建立的多个人物事件关系图和文本信息的标签;将各个所述人物事件关系图输入预先建立的文本分类模型,分别对各个所述人物事件关系图进行编码,获得各个所述人物事件关系图的编码结果;基于注意力机制,分别确定各个所述编码结果的权重值,根据所述权重值对各个所述编码结果进行加权求和,获得文本表征结果;根据所述文本表征结果进行分类预测,获得预测结果;根据所述文本表征结果、所述预测结果和所述标签迭代优化所述文本分类模型至收敛。本发明的技术方案能够提高文本分类准确率,获得更好的分类效果。
-
公开(公告)号:CN114201621A
公开(公告)日:2022-03-18
申请号:CN202111406136.9
申请日:2021-11-24
IPC: G06F16/43 , G06F16/583 , G06V10/25 , G06V10/774 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于图文协同注意力的跨模态检索模型构建及检索方法,所述方法包括:获取训练图像和训练文本,分别提取图像样本和文本样本的局部特征;将图像样本所有的局部图像特征和文本样本所有的局部文本特征分别映射为特征向量,并将图像样本和文本样本的特征向量分别表示成矩阵,再得到各自的Key矩阵、Query矩阵和Value矩阵;基于该多个矩阵,计算出图像样本和文本样本的跨模态注意力特征、模态内注意力特征;将跨模态注意力特征和模态内注意力特征进行融合,得到图像样本的全局特征表示和文本样本的全局特征表示;基于所述全局特征表示,训练得到跨模态检索模型。本发明可直接对不同模态的数据进行相似度匹配,具有较高的匹配准确性。
-
-
-
-
-
-
-
-
-