-
公开(公告)号:CN110543557A
公开(公告)日:2019-12-06
申请号:CN201910841535.4
申请日:2019-09-06
Applicant: 北京工业大学
Abstract: 本发明提出了一种基于注意力机制的医疗智能问答系统的构建方法。首先采集医疗问答数据,并用Word2vec技术进行向量化表示,对每个问题,从回答数据中选取语义相似度最大的句子作为标准答案,构建医疗知识问答训练库。然后构建基于注意力机制的医疗智能问答系统的深度学习模型:包括利用双向LSTM将问题和回答数据进行语义编码和拼接,并增加注意力机制;拼接后的语义编码输入到双向LSTM中进行特征融合,最后由softmax函数输出标准答案。
-
公开(公告)号:CN110084303B
公开(公告)日:2022-02-15
申请号:CN201910347785.2
申请日:2019-04-28
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于CNN与RF高维多粒度特征选择方法,属于信息处理技术领域。本发明基于高纬多粒度特征数据集,结合深度学习算法和机器学习算法用于解决高纬多粒度特征提取的问题。首先利用深度学习算法CNN模型构建了一种FSelCNN模型,通过该模型将原有数据从多粒度转化为单一粒度,使得该数据成为机器学习算法所需的数据;最后利用机器学习算法RF从该高纬的数据中选择出影响实际问题的有效特征。本发明从高纬多粒度特征数据的单一特征层面出发,将其从多粒度维度转化为单一粒度维度,有效解决了运算复杂度;模型减少了参数量,能够在较短时间内训练完成;适用于各种高纬多粒度数据,自适应能力较强,并且具有较好的效果。
-
公开(公告)号:CN111061873A
公开(公告)日:2020-04-24
申请号:CN201911191475.2
申请日:2019-11-28
Applicant: 北京工业大学
IPC: G06F16/35 , G06F40/242 , G06F40/289
Abstract: 本发明涉及一种基于Attention机制的多通道的文本分类方法,首先将由固定的预训练词向量和随机初始化的词向量构建的句子嵌入矩阵分别作为一个文本通道,其次在每层通道上单独引入Attention机制为每个词创建上下文向量,然后将上下文向量和词向量进行拼接,从而得到多通道的句子嵌入矩阵。最后使用不同尺寸的卷积核对多通道的句子嵌入矩阵在多个通道上进行卷积操作,得到卷积后的文本特征向量,再使用最大池化层从特征向量中提取文本主要特征,最后经过Softmax层输出所属类别的概率分布,从而构建基于Attention机制的多通道的文本分类模型。提高了模型的泛化能力和训练速度,解决了非连续词之间相关性的问题。
-
公开(公告)号:CN110084303A
公开(公告)日:2019-08-02
申请号:CN201910347785.2
申请日:2019-04-28
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于CNN与RF高维多粒度特征选择方法,属于信息处理技术领域。本发明基于高纬多粒度特征数据集,结合深度学习算法和机器学习算法用于解决高纬多粒度特征提取的问题。首先利用深度学习算法CNN模型构建了一种FSelCNN模型,通过该模型将原有数据从多粒度转化为单一粒度,使得该数据成为机器学习算法所需的数据;最后利用机器学习算法RF从该高纬的数据中选择出影响实际问题的有效特征。本发明从高纬多粒度特征数据的单一特征层面出发,将其从多粒度维度转化为单一粒度维度,有效解决了运算复杂度;模型减少了参数量,能够在较短时间内训练完成;适用于各种高纬多粒度数据,自适应能力较强,并且具有较好的效果。
-
公开(公告)号:CN109670922A
公开(公告)日:2019-04-23
申请号:CN201811633423.1
申请日:2018-12-29
Applicant: 北京工业大学
IPC: G06Q30/06
Abstract: 本发明属于计算机软件技术领域,提出了一种基于混合特征的线上图书价值发现方法,本发明通过分析线上图书的各类特征指标,结合机器学习算法构建线上图书价值发现模型。首先,采集线上图书数据,利用统计方法对图书的评论、价格、出版时间等价值特征进行分析,确定出对图书价值影响较大的特征。其次,根据已确定特征对每类图书在时间维度上进行分析,建立图书价值发现模型。图书价值发现模型可用于线上图书在时间维度上的价值发现。实验分析以亚马逊图书网站为例,说明了方法的有效性。
-
-
-
-