-
公开(公告)号:CN111737427B
公开(公告)日:2024-03-22
申请号:CN202010391330.3
申请日:2020-05-11
Applicant: 华南理工大学
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/9535
Abstract: 本发明公开了一种融合论坛互动行为与用户阅读偏好的慕课论坛帖推荐方法,包括步骤:1)构建用户对帖子的目标评分矩阵、用户互动评分矩阵和用户互动频次矩阵;2)分解用户互动评分矩阵,得到用户目标函数和用户行为特征矩阵;3)计算用户互动行为次数,提取嵌入特征,基于用户行为特征矩阵和用户嵌入矩阵得到用户矩阵;4)通过降噪自编码器提取帖子主题,得到物品目标函数,分解目标评分矩阵,得到评分矩阵目标函数;5)优化评分矩阵目标函数、用户目标函数和物品目标函数,为用户提供推荐列表。本发明通过深度学习和基于概率的矩阵分解,将用户与帖子、用户间的细微交互融入到模型中,缓解冷启动问题,结合用户阅读偏好,实现精准推荐。
-
公开(公告)号:CN117649657A
公开(公告)日:2024-03-05
申请号:CN202311381822.4
申请日:2023-10-23
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于改进Mask R‑CNN的骨髓细胞检测系统,包括:生成伪标签模块,用于生成细胞核伪标签,用于辅助模型更加关注细胞核信息;复制粘贴模块,挑选种类个数少的细胞,随机复制到另一张显微镜图像中,以解决种类不平衡问题;改进Mask R‑CNN模型,添加语义分割分支,使模型更加关注细胞核信息,输出更准确的分类结果;训练模块,让模型从骨髓细胞数据集和细胞核伪标签中学习到有用特征,训练完成后得到权重文件;推理模块,基于权重文件对骨髓细胞显微镜图像进行检测,检测结果通过后处理模块去除冗余检测结果。本发明可有效提高细胞个数少的种类的识别准确率,解决细胞种类不平衡问题,并使模型更加关注细胞核信息,提高模型的识别准确率。
-
公开(公告)号:CN113793239A
公开(公告)日:2021-12-14
申请号:CN202110928810.3
申请日:2021-08-13
Applicant: 华南理工大学
Abstract: 本发明公开了一种融合学习行为特征的个性化知识追踪方法与系统,利用卷积神经网络提取学习行为和答题结果数据组成的复合向量中的有效特征;并通过降噪自编码器提取包含知识点在内的题目信息特征,最终将学习行为特征与题目信息特征相结合,经过LSTM网络和全连接层,获得学生对知识的掌握程度状态。在建模过程中,本发明融合了学生在学习过程中的一系列学习行为特征和习题本身及知识点的丰富信息,更准确地预测了每位学生的知识掌握程度。本发明可应用于混合式教学,为个性化教学提供量化依据。
-
公开(公告)号:CN112989848A
公开(公告)日:2021-06-18
申请号:CN202110332815.X
申请日:2021-03-29
Applicant: 华南理工大学
IPC: G06F40/58 , G06F40/44 , G06F40/56 , G06F40/289 , G06F16/35
Abstract: 本发明公开了一种领域适应医学文献神经机器翻译模型的训练方法,包括:1)对域内外数据集进行数据预处理;2)基于域外子词化训练集进行域外子词化神经机器翻译模型进行动态递减训练集训练;3)使用改进的数据选择法,从域外数据集中挑选出与域内平行数据集相似的数据集来增强域内数据集;4)基于高质量的人工纠错的子词化医学数据集,训练小型的分类器或语言模型,获得域内子词化训练集句子对的训练权重,将权重作为训练参数加入到继续训练过程中;5)结合上一步骤处理得到的域内子词化训练集和训练权重文件,基于已训练域外子词化神经机器翻译模型,在域内子词化训练集上继续训练。本发明可节省总体训练时间,提高最终翻译训练效果。
-
公开(公告)号:CN109918477A
公开(公告)日:2019-06-21
申请号:CN201910122541.4
申请日:2019-02-18
Applicant: 华南理工大学
IPC: G06F16/33 , G06F16/951 , G06F16/953 , G06F16/9535 , G06F16/332
Abstract: 本发明公开了一种基于变分自编码器的分布式检索资源库选择方法,该方法利用深度神经网络构建编码器与解码器网络结构,学习资源库文本的隐含表示,用来捕捉资源库文本的深层语义表示。通过无监督的训练方法得到的模型,对查询词的扩展文本进行推理,获得查询词的隐含表示。通过计算查询词与资源库的隐含表示的相似性,来获得资源库的相关性排名。该模型为无监督的训练,自动获得资源库以及文本的隐含表示向量,可克服有监督训练方法中的设计文本特征的缺点。此外,变分自编码器的网络结构简单,变分推理的计算耗时比基于马尔科夫链蒙特卡罗推理方法的LDA主题模型要低。模型训练完成后,进行资源库选择的耗时低,资源库选择的效率高。
-
公开(公告)号:CN109871538A
公开(公告)日:2019-06-11
申请号:CN201910119391.1
申请日:2019-02-18
Applicant: 华南理工大学
IPC: G06F17/27
Abstract: 本发明公开了一种中文电子病历命名实体识别方法,包括步骤:1)构建普通词汇字典;2)简约词性标注;3)构建文本和词性向量映射表;4)训练命名实体的预测模型;5)命名实体的标签预测。本发明通过加入词性特征,来提高命名实体和普通词汇的边界可区分性,从而提高命名实体边界准确率。同时,在双向的LSTM-CRF模型中引入自注意力机制,计算每个时刻输入与句子中其他成分的相关度,从而缓解长依赖问题,提高命名实体识别准确率。
-
公开(公告)号:CN109871439A
公开(公告)日:2019-06-11
申请号:CN201910122563.0
申请日:2019-02-18
Applicant: 华南理工大学
IPC: G06F16/332 , G06F17/50 , G06Q50/00 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的问答社区问题路由方法,包括步骤:1)通过对社区问答的文本内容进行分词,利用词向量技术,获取单词的词向量表示;2)根据用户的历史回答记录,构建用户档案;3)利用深度学习根据用户档案分别学习用户兴趣预测模型、用户能力预测模型、用户响应度预测模型;4)根据步骤3)学习到的模型获取用户特征,进而根据用户特征训练打分模型;5)利用步骤3)学习的户兴趣预测模型、用户能力预测模型、用户响应度预测模型及步骤4)训练的打分模型,进行问题路由。本发明充分考虑到用户回答的评分信息和时间信息,通过单独的深度学习模型分别来预测用户对问题的评分及响应时间,在排序阶段充分利用了用户回答的评分、时间等信息。
-
公开(公告)号:CN108563923A
公开(公告)日:2018-09-21
申请号:CN201711267170.6
申请日:2017-12-05
Applicant: 华南理工大学
Abstract: 本发明公开了一种基因变异数据分布式存储方法及架构,该方法包括分布式数据存储过程、分布式位图索引创建过程和分布式查询检索过程;该架构包括分布式列式存储模块、分布式位图索引模块和查询检索模块。本发明通过采用新的列式存储引擎kudu进行数据分布式存储,并针对各样本列建立分布式局部位图索引,有效解决现有的HDFS方案随机数据访问性能低的问题;解决HBase方案批量分析性能不佳的问题;简化存储架构模型;解决基因型查询工具对多个工具依赖的限制问题;同时本发明通过分布式的局部位图索引方案,实现了高并发,并提高了可拓展性。
-
公开(公告)号:CN108303108A
公开(公告)日:2018-07-20
申请号:CN201711266923.1
申请日:2017-12-05
Applicant: 华南理工大学
IPC: G01C21/34
Abstract: 本发明公开了一种基于车辆历史轨迹的个性化路线推荐方法,该方法是:首先建立一个分场景路径时间预测模型,热门路径采用KNN预测,非热门路径采用GBDT算法预测;接着,采用最优化的思想,利用梯度下降方法建模用户偏好;最后根据用户偏好进行个性化推荐。推荐过程中,一方面,本发明将协同过滤思想引入了进来,通过寻找相似的用户,利用相似用户的历史轨迹进行推荐;另一方面,我们也可以将其认为是一个导航问题,只不过不是普通导航,而是一个个性化导航,此时,建立一个多权重道路网图,在这个多权重路网图上,根据用户偏好向量,利用迪杰斯特拉算法求得一条总开销最小的路径,即最满足用户偏好的路径。
-
公开(公告)号:CN104090936B
公开(公告)日:2017-02-22
申请号:CN201410299211.X
申请日:2014-06-27
Applicant: 华南理工大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于超图排序的新闻推荐方法,包括以下步骤:1)预处理,2)超图构建,3)矩阵构建,4)排序,5)获得排序结果,6)获得推荐结果。本发明主要通过使用超图模型挖掘用户和新闻内容的内在关系和排序关系,从而将新闻推荐比较繁杂的处理体系简化为一个明晰简洁的关联架构。本发明的特色在于简化了新闻推荐的预处理步骤,而且直接给出了推荐列表。使用本发明可以较好地保证推荐结果与用户偏好的准确性,同时对推荐结果无需做额外二次挑选的前提下又可以保证推荐结果的多样性。
-
-
-
-
-
-
-
-
-