一种复杂行为序列数据的特征学习方法

    公开(公告)号:CN107609589A

    公开(公告)日:2018-01-19

    申请号:CN201710816615.5

    申请日:2017-09-12

    Applicant: 复旦大学

    Inventor: 熊贇 张尧 朱扬勇

    Abstract: 本发明属于大数据技术领域,具体为一种复杂行为序列数据的特征学习方法。本发明核心是定义一个行为事件的概率表达式以便通过对观测到的数据集进行极大似然估计来求解。为此,假设一个事件发生的概率大小取决于其字段之间是否相容,首先将复杂行为事件中每一个字段都通过嵌入转换为欧式空间中的多维向量表示,对字段的向量两两进行内积运算,作为其相容程度的度量,然后进行加权求和,进一步通过指数运算与归一化,作为单个事件的概率。本发明方法通过分析复杂行为序列数据集,以无监督的方式自动生成指定实体的特征向量,得到较低维度的特征向量,作为后续机器学习、数据挖掘任务的特征,无需专家手工设计特征。

Patent Agency Ranking