基于言语行为理论的用户交互意图识别方法及系统

    公开(公告)号:CN107153672A

    公开(公告)日:2017-09-12

    申请号:CN201710171926.0

    申请日:2017-03-22

    Abstract: 本发明涉及一种基于言语行为理论的用户交互意图识别方法及系统,所述用户交互意图识别方法包括:基于外部知识源构建行为标记语词典;根据所述行为标记语词典,自动标注用户在社交媒体平台上输入的在线文本的意图;利用自动标注语料训练基于特征的分类器对所述在线文本的意图进行分类识别,确定用户的交互意图类别。本发明基于言语行为理论的用户交互意图识别方法通过基于外部知识源构建对应不同意图类别的行为标记语词典,并基于行为标记语词典自动标注扩充语料和基于特征分类识别,能够有效识别社交媒体中的用户交互意图,识别准确度高,可用于商务智能、社情舆情、决策评估等领域的意图分析与识别,应用范围广。

    一种面向微博的疑似水军发现方法

    公开(公告)号:CN106940732A

    公开(公告)日:2017-07-11

    申请号:CN201710212983.9

    申请日:2017-04-01

    Abstract: 本发明涉及一种面向微博数据的疑似水军发现方法,属于计算机应用技术领域。本发明共分为以下六个步骤,分别为相关微博数据的采集;数据预处理;用户特征提取;构建训练集;训练水军检测模型;预测判别未标注数据。对比现有技术,本发明实现了数据的充分利用,方便快捷的进行群体发现而不用建立复杂的分类检测模型,从而降低了算法的复杂度,并且算法的模块性较高,可以投入大规模数据计算,具有较高的稳定性;本发明除了可以对单一用户进行水军检测,还可以对某一特定事件中的一批用户进行识别,该方法模块性极强,可以稳定适用于大规模数据计算框架下。

    一种挖掘微博话题趋势发起人的方法

    公开(公告)号:CN104866561A

    公开(公告)日:2015-08-26

    申请号:CN201510255994.6

    申请日:2015-05-19

    CPC classification number: G06F17/30867

    Abstract: 本发明公开了一种挖掘微博话题趋势发起人的方法,属于数据挖掘领域。首先针对某一话题微博,以天为时间粒度,构造微博量随时间变化的趋势图,获取波峰点和波谷点,确定趋势的时间范围,提取微博高频词代表趋势主要内容,以趋势早期参与微博高频词的数量作为该条微博的内容相关度,降序排序后提取趋势制造者。根据趋势变化,以小时为时间粒度,构造趋势时间范围的微博数量变化图,获取斜率最大的时间范围作为增速最大的时间段,并对微博转发量降序排序,确定趋势推动者。本发明利用微博数据平台,具有高效性、鲁棒性和简洁性等优点,适用于对话题微博趋势发起人方面的分析,在社会舆情监控和信息传播分析等领域具有重要的应用价值。

    一种微博转发树和转发森林构建方法

    公开(公告)号:CN104778210A

    公开(公告)日:2015-07-15

    申请号:CN201510111754.9

    申请日:2015-03-13

    Abstract: 本发明公开了一种微博转发树和转发森林构建方法,属于数据挖掘领域,包括以下步骤:收集该条微博的原创微博信息;并且根据单条原创微博信息,获取其转发微博信息;然后在单条原创微博信息及其所有转发微博信息上,构造单条微博的微博树结构;根据用户给定时间段t3-t4内的话题关键词Topic,收集与该话题相关的全量微博信息,针对每一条微博信息,构造单条微博的微博树结构;最后汇总该话题相关的全量微博信息的转发树;形成微博转发森林。本发明的优点为:通过转发树生成算法,高效快速完整地进行转发树和转发森林的提取,具有较高的效率和效果。

    一种基于时空推理的用户未来位置预测方法

    公开(公告)号:CN115905732A

    公开(公告)日:2023-04-04

    申请号:CN202211248018.4

    申请日:2022-10-12

    Abstract: 本发明涉及一种基于时空推理的用户未来位置预测方法,属于时空大数据分析与挖掘技术领域。针对目前用户未来位置预测工作中,因忽略人本身的行为规律信息导致的不足,为解决如何将人类行为规律融入未来位置预测的技术问题,在预测用户未来位置时,本方法充分考虑了时空数据的社会属性,对每一个位置将其类别也进行编码从而是模型可以获得位置的社会属性从而更好地挖掘位置信息。本方法充分考虑了人类自身的社会规律。将用户在星期、月份上的规律性也考虑进内,大幅提升了规律挖掘的深度。

    基于分布式数据采集任务调度方法及装置

    公开(公告)号:CN111857983B

    公开(公告)日:2023-02-28

    申请号:CN202010355882.9

    申请日:2020-04-29

    Inventor: 刘春阳 张旭 王鹏

    Abstract: 本发明公开了一种基于分布式数据采集任务调度方法,其包括:获取待处理任务;对待处理任务分类得到多个周期性重复任务;记录每个周期性重复任务在前n次执行中每次执行的起止时间点;计算每个周期性重复任务在前n次执行中的平均间隔时长每个周期性重复任务下一次执行的起始时间点,确定多个周期性重复任务的下一次执行顺序;记录每个任务执行器的负载;向多个任务执行器分别发送任务请求信号,并接受各个任务执行器的反馈信号;向接受到的第一个反馈信号对应的任务执行器发送需要最先执行的周期性重复任务。本发明还公开了一种基于分布式数据采集任务调度装置。本发明能够使得分布式系统执行任务时取得最优效果,运行更加稳健。

Patent Agency Ranking