基于用户生成内容的新闻认证预警方法及系统

    公开(公告)号:CN104636408A

    公开(公告)日:2015-05-20

    申请号:CN201410414956.6

    申请日:2014-08-21

    CPC classification number: G06F17/3089 G06F17/30705

    Abstract: 本发明公开了一种基于用户生成内容的新闻认证预警方法及系统,其中该方法包括,通过对新闻线索进行语义扩展,获得参考数据,将该参考数据进行定向采集,获取该新闻线索相关的信息内容、传输模式、用户群体、用户群体的行为信息和属性信息等,对信息内容进行语义知识提取,将该语义知识进行进行聚类和相似度计算,识别与历史新闻线索数据库不匹配的新闻线索,并从语义知识对比、用户群体、传播模式和信息内容等方面对其进行可信度评估。最终形成UGC新闻真实性的分级度量和预警,为该新闻是否为真实信息提供决策支持。

    一种基于微博信息源的新闻认证方法及系统

    公开(公告)号:CN104572807B

    公开(公告)日:2018-02-06

    申请号:CN201410594515.9

    申请日:2014-10-29

    Abstract: 本发明涉及微博新闻可信度领域,特别涉及一种基于微博信息源的新闻认证方法及系统,该方法包括:提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户的用户信息;获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数比例,并根据以上三个比例,获取所述用户的社交关系可信度值;获取所述用户的用户活跃度与历史微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值;获取微博的评价舆情指数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情指数作为社交评价可信度值;将以上三个可信度值进行线性加权求和作为综合可信度值。

    基于用户生成内容的新闻认证预警方法及系统

    公开(公告)号:CN104636408B

    公开(公告)日:2017-08-08

    申请号:CN201410414956.6

    申请日:2014-08-21

    Abstract: 本发明公开了一种基于用户生成内容的新闻认证预警方法及系统,其中该方法包括,通过对新闻线索进行语义扩展,获得参考数据,将该参考数据进行定向采集,获取该新闻线索相关的信息内容、传输模式、用户群体、用户群体的行为信息和属性信息等,对信息内容进行语义知识提取,将该语义知识进行进行聚类和相似度计算,识别与历史新闻线索数据库不匹配的新闻线索,并从语义知识对比、用户群体、传播模式和信息内容等方面对其进行可信度评估。最终形成UGC新闻真实性的分级度量和预警,为该新闻是否为真实信息提供决策支持。

    一种基于微博信息源的新闻认证方法及系统

    公开(公告)号:CN104572807A

    公开(公告)日:2015-04-29

    申请号:CN201410594515.9

    申请日:2014-10-29

    CPC classification number: G06F17/3089 G06Q50/01

    Abstract: 本发明涉及微博新闻可信度领域,特别涉及一种基于微博信息源的新闻认证方法及系统,该方法包括:提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户的用户信息;获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数比例,并根据以上三个比例,获取所述用户的社交关系可信度值;获取所述用户的用户活跃度与历史微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值;获取微博的评价舆情指数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情指数作为社交评价可信度值;将以上三个可信度值进行线性加权求和作为综合可信度值。

    一种基于高分散哈希算法的数据采集策略方法及装置

    公开(公告)号:CN105208075B

    公开(公告)日:2018-07-31

    申请号:CN201510492674.2

    申请日:2015-08-12

    Abstract: 种基于高分散哈希算法的数据采集策略方法及装置,该装置包括用户行为采集模块、时间种子生成器、哈希回传时间生成器、时间校正器、定时服务模块、数据传输模块、文件缓存模块、后台接收服务模块;该装置将高分散性哈希算法引入,计算合理的回传时间;数据传输模块及数据加密器等用于将数据进行加密后传输;文件缓存、传输计数器、启动计数器等用于测算数据传输成功率。本发明利用高分散性哈希算法的天然特质,在对实时性要求不高的移动互联网数据采集系统中,有效的将大量的设备发送请求进行了分散疏导,合理的利用服务器的资源情况,将其服务能力平均化,同时也可以将数据回传的延时降到最低,实现系统的均衡、稳定的目标。

    基于模板自动生成新闻的系统和方法

    公开(公告)号:CN106021389A

    公开(公告)日:2016-10-12

    申请号:CN201610312962.X

    申请日:2016-05-12

    Abstract: 基于模板自动生成新闻的系统和方法,新闻事件日志库、新闻文章模板库、规则库组成该系统的数据库,新闻事件日志库通过选定事件日志与统计数据生成器连接,统计数据生成器分别与模板选择器、自然语言生成进行交互,自然语言生成与年报生成模块进行交互,统计数据生成器与模板选择器相交互,新闻文章模板库、模板选择器与年报生成模块相连接,年报生成模块与数据库进行连接。其实现方法的具体步骤阐述如下,建立年报日志库:建立模板库:建立规则库、选择模板、建立统计数据库、自然语言生成、年报生成;与现有技术相比,在新闻写作行业减轻了双手的劳动量,同时也提高了新闻报道的效率,为新闻发展提供了里程碑性的改革。

    一种结合聚类和双key值的高维向量检索方法

    公开(公告)号:CN103500165B

    公开(公告)日:2016-08-31

    申请号:CN201310365592.2

    申请日:2013-08-21

    Abstract: 本发明是一种结合聚类和双key值的高维向量检索方法。在本发明中,提出了一种结合聚类的双key值索引结构CDKB?tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建双key值扩展B+?tree,形成CDKB?tree。进行检索时,只需对与查询范围相交的簇数据进行搜索,通过聚类实现第一次过滤,并通过主key和辅key(双key值),实现两次key值过滤,只需对主key和辅key均在搜索范围内的那些高维向量与查询向量间进行相似度匹配计算。本发明提出的索引结构通过聚类及简单的双key值大小比较,大大地减少了相似度匹配的运算量,极大地加快了检索速度。

    基于格网的多比例尺海量数据空间渲染方法

    公开(公告)号:CN106682001B

    公开(公告)日:2019-05-14

    申请号:CN201510750559.0

    申请日:2015-11-05

    Abstract: 本发明提供一种基于格网的多比例尺海量数据空间渲染方法,包括:服务器得到每个矢量数据所对应的n条矢量数据属性组;服务器接收前端发送的空间数据查询请求;服务器基于所述查询关键字,获得每条矢量数据在当前比例尺下的1条矢量数据属性组;服务器预定义聚类规则,然后,基于所述聚类规则,对绑定有矢量数据属性组的格网进行聚类计算,得到若干个聚类,并计算得到每个聚类的聚类中心点地理坐标以及每个聚类所包含的矢量数据属性组的数量,前端根据预定义的数据渲染规则,进行渲染。优点为:可以较为完整地实现大数据可视化分析中矢量数据快速显示、多尺度动态渲染以及无数据压盖显示等需求,从而提高客户使用体验。

Patent Agency Ranking