一种基于异质数据的人物相似度刻画方法

    公开(公告)号:CN107577782A

    公开(公告)日:2018-01-12

    申请号:CN201710827978.9

    申请日:2017-09-14

    Abstract: 本发明公开了一种基于异质数据的人物相似度刻画方法,属于数据挖掘领域。本发明首先搜集用户的微博文本,获取用户之间的关注关系以及各用户的基本信息,针对不同类型数据的特点个性化选择处理方式,并对于微博文本采用Doc2vec模型,结合上下文信息将文本表示成向量,再根据定义的相似度函数衡量相似度,最后将不同维度得到的矩阵进行融合,刻画用户最终的相似度。本发明引入了多种社交网络信息,包括社交关系数据、用户属性数据和用户文本数据等,通过对不同类型的信息加以综合考虑,以得到更全面的人物相似度刻画方法;同时本发明提供了对于多种数据的处理和计算方案,利用完整的数据和加权融合方法,个性化计算不同偏好的人物相似度。

    新闻APP应用活跃度的分析方法

    公开(公告)号:CN107168986A

    公开(公告)日:2017-09-15

    申请号:CN201710178505.0

    申请日:2017-03-23

    Abstract: 本发明公开了一种新闻APP应用活跃度的分析方法,包括以下步骤:步骤1、采集不少于2个新闻APP的相关数据;步骤2、将步骤1采集的数据代入活跃度计算模型进行分析计算;步骤3、将步骤2中得到的计算结果进行排列,即得所采集新闻APP的活跃度排行。其能够综合客观的判断一个新闻APP的实际活跃度,并对多个新闻APP的活跃度进行分析和排行,使用户方便的选择适合自身的新闻APP。

    移动新闻App影响力评级方法

    公开(公告)号:CN107153908A

    公开(公告)日:2017-09-12

    申请号:CN201710186473.9

    申请日:2017-03-24

    CPC classification number: G06Q10/06393 G06F17/3089 G06Q50/01

    Abstract: 本发明公开了一种移动新闻App影响力评级方法,步骤包括:1)采集新闻APP上的数据,并将数据聚类入库,所述数据包括:所属网站、评论次数、转载次数、日均访问量(PV)和访问量(UV);2)计算新闻影响力因子;3)利用PageRank算法计算新闻App转载率;4)通过查询回复率参考表得出新闻App回复率;5)利用计算模型计算新闻APP得分,根据分数将新闻App排序。本发明以分数的形式展现给用户,更加直白的显示出不同的新闻App的影响力。这个数值就是新闻App的评价分,分数越高的新闻App,越能满足用户的需求,可以及时的为大众提供实时新闻。

    微博深度分类方法及系统
    155.
    发明公开

    公开(公告)号:CN105843957A

    公开(公告)日:2016-08-10

    申请号:CN201610236172.8

    申请日:2016-04-15

    Abstract: 本发明实施例提供一种微博深度分类方法及系统,该方法包括:将分词处理后的第一微博训练样本数据分别与各第一筛选词库进行词汇匹配,确定所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率;将所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率进行归一化处理,并将归一化处理后的数据输入学习模型;根据所述学习模型的输出确定微博事件分类模型;根据所述微博事件分类模型对微博文本进行分类。本发明实施例提供的微博深度分类方法及系统,能够对微博文本进行深入的细化分类,提高微博文本的分类正确率。

    一种基于自动机的实体关系快速抽取方法

    公开(公告)号:CN105824801A

    公开(公告)日:2016-08-03

    申请号:CN201610150794.9

    申请日:2016-03-16

    CPC classification number: G06F17/2785 G06F16/288

    Abstract: 本发明提供一种基于自动机的实体关系快速抽取方法,包括以下步骤:步骤1,定制规则文件;步骤2,对规则文件中的各个规则进行文法检查,检测规则文件中的各个规则是否满足文法要求,如果满足,则执行步骤3;步骤3,对通过文法检查的所述规则文件中的各个规则进行语义解释;步骤4,将语义解释后的所述规则文件中的各个规则进行解析编译,完成规则向层叠有限状态自动机的转换,得到有限状态自动机;步骤5,使用所述有限状态自动机,对输入的文本数据进行实体属性以及实体关系的抽取,得到最终的实体属性以及实体关系。优点为:能够保证对开放域文本进行快速的实体关系与实体属性抽取。同时,对于特定领域的实体关系可以定制化的进行抽取。

    舆情态势数据智能识别及异常检测方法

    公开(公告)号:CN118780275A

    公开(公告)日:2024-10-15

    申请号:CN202410586391.3

    申请日:2024-05-13

    Abstract: 本发明涉及数据识别与检测领域,尤其涉及一种舆情态势数据智能识别及异常检测方法,包括以下步骤:S1:采用多策略数据抽取方法,处理不同格式的数据源;引入自适应语义映射机制,通过语义深度调节因子SDF动态调整每个词的语义向量vi,使动态语义融合网络捕获更加丰富和准确的语义信息;S2:时间序列异常态势预测器通过融合动态解码模型TSIM,结合时间‑语义交互机制,将文本的语义信息与时间信息进行深度融合,评估舆情态势,预测及判断舆情态势异常,本方法大幅提升数据处理的准确性和工作效率,有利于及时发现并响应舆情异常,准确预测及判断舆情异常态势。

    文本立场分析方法、装置、设备及存储介质

    公开(公告)号:CN117574892A

    公开(公告)日:2024-02-20

    申请号:CN202311492828.9

    申请日:2023-11-09

    Abstract: 本公开涉及一种文本立场分析方法、装置、设备及存储介质,该方法包括:获取待分析文本和所述待分析文本对应的主题短语;对所述待分析文本与所述主题短语进行特征提取,得到文本向量和主题向量;将所述文本向量和所述主题向量输入预训练的分层胶囊模型,得到所述分层胶囊模型输出的根据所述主题短语对所述待分析文本进行立场分析的分析结果,所述分层胶囊模型包括词胶囊层、句子胶囊层和类别胶囊层,所述词胶囊层、句子胶囊层和类别胶囊层分别用于提取所述待分析文本的词级特征、句子级特征和类别特征。本公开通过设置分层胶囊模型,能够提取文本的不同层级的特征信息,从而挖掘文本的深层信息,提升对文本进行立场判断的准确度。

    一种基于时空推理的用户未来位置预测方法

    公开(公告)号:CN115905732A

    公开(公告)日:2023-04-04

    申请号:CN202211248018.4

    申请日:2022-10-12

    Abstract: 本发明涉及一种基于时空推理的用户未来位置预测方法,属于时空大数据分析与挖掘技术领域。针对目前用户未来位置预测工作中,因忽略人本身的行为规律信息导致的不足,为解决如何将人类行为规律融入未来位置预测的技术问题,在预测用户未来位置时,本方法充分考虑了时空数据的社会属性,对每一个位置将其类别也进行编码从而是模型可以获得位置的社会属性从而更好地挖掘位置信息。本方法充分考虑了人类自身的社会规律。将用户在星期、月份上的规律性也考虑进内,大幅提升了规律挖掘的深度。

Patent Agency Ranking