-
公开(公告)号:CN111161063A
公开(公告)日:2020-05-15
申请号:CN201911273314.8
申请日:2019-12-12
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种基于图计算的资金账号识别方法及计算机可读存储介质,方法包括:从待分析的资金交易网络中随机抽取多个子资金交易网络;分别计算各子资金交易网络中的各账号的入度、出度以及在预设周期内的资金通量;分别根据各账号的入度和出度,计算各账号的第一积分,并分别根据各账号的所述资金通量,计算各账号的第二积分;分别根据各账号的第一积分和第二积分以及预设的积分阈值,识别各账号的账号类型,所述账号类型包括收集账号、分发账号和中转账号。本发明可快速识别出可能存在异常的资金账号,进而可快速定位出可能存在异常的资金交易网络。
-
公开(公告)号:CN109743411A
公开(公告)日:2019-05-10
申请号:CN201811509275.2
申请日:2018-12-10
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: H04L29/12
Abstract: 本发明提供了一种在分布式环境下动态调度IP代理池的方法、装置及存储介质。该方法包括:构建步骤,扫描代理IP资源,为扫描获得的代理IP初始化状态标识后构建IP代理池;检测步骤,对初始代IP理池中的代理IP进行检测,并根据检测结果更新代理IP的状态标识;调度步骤,获取IP代理池中M个代理IP生成代理IP队列以供下载中心请求使用。本发明确保代理池中的可用IP代理保持在一定数量之上,并根据加锁机制和缓存机制,实现单个代理IP在面对多线程调度的情况下可以做到时间维度上的有序响应,防止单个代理IP高频率访问,通过IP代理池、有效性检测及调度的协同,使分布式数据采集系统在保证采集效率的同时,又可以避免因高频率访问导致访问失败。
-
公开(公告)号:CN109657117A
公开(公告)日:2019-04-19
申请号:CN201811341252.5
申请日:2018-11-12
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/951 , G06F16/955
Abstract: 本发明提供一种网页要素的自动提取方法、系统及计算机存储介质,该方法包括:基于浏览器插件提取所述网页的URL,获取爬虫采集规则库和网站版块集合;判断所述网站版块集合在爬虫采集规则库中是否存在提取规则,如果所述爬虫采集规则库中存在所述网站版块集合的提取规则,则提取所述网页的要素;判断所述网页的要素是否提取成功,如果所述网页的要素提取成功则将提取的内容填充到对应的文本区域。根据本发明的方法、系统及计算机存储介质,可以增加提取网页要素以及截图的准确性、灵活性、易用性,为信息编辑人员查阅收集网页信息提供很好的技术支持。
-
公开(公告)号:CN108009229A
公开(公告)日:2018-05-08
申请号:CN201711224272.X
申请日:2017-11-29
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开一种基于RDF知识库的舆情事件数据发现的方法,包括如下步骤,S1:根据描述舆情事件的要素,构建至少包括人物、地点和组织的多个实体(即要素)的多维度的RDF实体库,进入S2步骤;S2:依据RDF实体库,从各个维度对需要进行舆情事件数据发现的网络文本数据,使用隐马尔科夫模型对网络文本数据中命中的实体进行判断,获得包含有该网络文本数据在各个维度中命中的实体及其相关信息的结构化的文本数据,进入S3步骤;S3:根据用户输入的舆情事件条件,对S2中获得的结构化的文本数据进行舆情事件条件匹配,并将匹配到的结构化的文本数据,作为相关的舆情事件数据,进入S4步骤;S4:将相关的舆情事件数据返回给用户。
-
公开(公告)号:CN107967332A
公开(公告)日:2018-04-27
申请号:CN201711212788.2
申请日:2017-11-28
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30241 , G06F17/30345 , G06F17/30554
Abstract: 本发明提供了一种企业地址识别方法及识别系统,方法包括:获取公开的企业地址信息;依据获取到企业地址信息更新预设的地址信息资源库;获取预设时间段内互联网站上的企业地址信息;若所述互联网站上的企业地址信息中出现了地址信息资源库的企业地址,则增加所述企业地址的积分;判断所述企业地址的积分是否小于阈值;若所述企业地址的积分大于或等于阈值,则判定所述企业地址为企业当前的经营地址。通过对地址信息资源库中的企业地址进行积分,将积分值大于或等于阈值的企业地址判定为企业的经营地址,能够应对同时存在多个实际经营地址的情况,并且不会遗漏企业短距离的位置改变的情况,能够准确地识别出企业当前使用的经营地址。
-
公开(公告)号:CN103246700B
公开(公告)日:2016-08-10
申请号:CN201310112130.X
申请日:2013-04-01
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种基于HBase的海量小文件低延时存储方法,其通过在Hadoop、HBase环境下建立一种包括一个行主键及两个列族的小文件表,从而建立适合小文件存储环境,并配套包括小文件写入、小文件续写及小文件读取应用流程,进而实现海量小文件的合理存储和低延时性读写,满足实际需求。
-
公开(公告)号:CN105608072A
公开(公告)日:2016-05-25
申请号:CN201510979376.6
申请日:2015-12-23
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/27
CPC classification number: G06F17/2785 , G06F17/2715
Abstract: 本发明公开了一种文本涉及地分析方法及其系统,方法包括提取文本的地域相关名词;将地域相关名词进行地域匹配,得到包含文本涉及地的地域区划列表;计算地域相关名词在文本中的词频概率,确定地域区划列表中对应的文本涉及地的第一概率;根据地域相关名词及其对应的文本涉及地的语义相关度,获取文本涉及地的语义概率;根据文本所在版块的统计信息或发布人的统计信息中文本涉及地的历史概率,获取文本涉及地的第二概率;根据第一概率、语义概率和第二概率,获取文本涉及地的综合概率;若综合概率大于等于第一预设阈值,则判定文本涉及地为文本的属地;将文本涉及地添加至文本的地域属性标签。本发明可提高文本地域分析判断的准确性。
-
公开(公告)号:CN102298633B
公开(公告)日:2013-05-29
申请号:CN201110264866.X
申请日:2011-09-08
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明提供的分布式海量数据排重方法中,预先将数据库中所有数据的HASH值分为若干个HASH值集合并存储到至少两个节点服务器内存中,记录每个所述HASH值集合及其存放的节点服务器地址之间的映射关系;当接收到请求判断当前数据是否已存在的判断请求时,先计算当前数据的HASH值,确定当前数据的HASH值应该所处的HASH值集合所对应的节点服务器地址;随后比对判断当前数据的HASH值应该所处的HASH值集合所对应的节点服务器中是否有当前数据的HASH值,若是,则返回“当前数据已存在”的执行结果并结束流程;否则返回“当前数据不存在”的执行结果,并更新当前数据的HASH值应该所处的HASH值集合。
-
公开(公告)号:CN102298633A
公开(公告)日:2011-12-28
申请号:CN201110264866.X
申请日:2011-09-08
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明提供的分布式海量数据排重方法中,预先将数据库中所有数据的HASH值分为若干个HASH值集合并存储到至少两个节点服务器内存中,记录每个所述HASH值集合及其存放的节点服务器地址之间的映射关系;当接收到请求判断当前数据数据是否已存在的判断请求时,先计算当前数据的HASH值,根据预先记录的HASH值集合和节点服务器地址之间的映射关系确定当前数据的HASH值及其应该所处的HASH值集合所对应的节点服务器地址;随后比对判断当前数据的FASH值应该所处的HASH值集合所对应的节点服务器中是否有当前数据的HASH值,若是,则返回“当前数据已存在”的执行结果并结束流程;否则返回“当前数据不存在”的执行结果,并更新当前数据的FASH值应该所处的HASH值集合。
-
-
-
-
-
-
-
-