-
公开(公告)号:CN106599270A
公开(公告)日:2017-04-26
申请号:CN201611201913.5
申请日:2016-12-23
Applicant: 浙江省公众信息产业有限公司
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明提出一种网络数据抓取方法和爬虫,涉及互联网技术领域。其中,本发明的一种网络数据抓取方法包括:调用浏览器发起网页访问请求;模拟用户操作,获取返回页面;在返回页面中提取目标内容。通过这样的方法,能够调用真实的浏览器,在真实浏览器上模拟用户的操作,并对网页反馈的内容进行数据抓取,从而实现了对异步请求反馈信息的内容抓取,提高网络数据抓取能力。
-
公开(公告)号:CN106599270B
公开(公告)日:2020-08-21
申请号:CN201611201913.5
申请日:2016-12-23
Applicant: 浙江省公众信息产业有限公司
IPC: G06F16/951
Abstract: 本发明提出一种网络数据抓取方法和爬虫,涉及互联网技术领域。其中,本发明的一种网络数据抓取方法包括:调用浏览器发起网页访问请求;模拟用户操作,获取返回页面;在返回页面中提取目标内容。通过这样的方法,能够调用真实的浏览器,在真实浏览器上模拟用户的操作,并对网页反馈的内容进行数据抓取,从而实现了对异步请求反馈信息的内容抓取,提高网络数据抓取能力。
-
公开(公告)号:CN108170685A
公开(公告)日:2018-06-15
申请号:CN201810082070.4
申请日:2018-01-29
Applicant: 浙江省公众信息产业有限公司
Abstract: 本公开提出一种文本情感分析方法、装置和计算机可读存储介质,涉及文本挖掘技术领域。本公开的一种文本情感分析方法,包括:根据文本的领域选择相匹配的情感关联规则,情感关联规则中包括多种情感维度的标识、正则表达式和情感极性;将文本分割成短文本;利用情感关联规则分析短文本,获取文本中出现的情感维度和情感极性。通过这样的方法,能够采用与文本的领域相匹配的情感关联规则对文本分割成的短文本进行处理,得到文本中出现的情感维度和情感极性,从而实现自动确定用户评价的分类、角度以及用户的态度,提高对评价内容的利用率和分析的准确性。
-
公开(公告)号:CN108170685B
公开(公告)日:2021-10-29
申请号:CN201810082070.4
申请日:2018-01-29
Applicant: 浙江省公众信息产业有限公司
IPC: G06F40/289 , G06F40/216 , G06F16/2458 , G06F16/35
Abstract: 本公开提出一种文本情感分析方法、装置和计算机可读存储介质,涉及文本挖掘技术领域。本公开的一种文本情感分析方法,包括:根据文本的领域选择相匹配的情感关联规则,情感关联规则中包括多种情感维度的标识、正则表达式和情感极性;将文本分割成短文本;利用情感关联规则分析短文本,获取文本中出现的情感维度和情感极性。通过这样的方法,能够采用与文本的领域相匹配的情感关联规则对文本分割成的短文本进行处理,得到文本中出现的情感维度和情感极性,从而实现自动确定用户评价的分类、角度以及用户的态度,提高对评价内容的利用率和分析的准确性。
-
-
-