java爬虫与python爬虫对比哪个更简单
这篇文章将为大家详细讲解有关java爬虫与python爬虫对比哪个更简单,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
java爬虫与python爬虫的对比:
python做爬虫语法更简单,代码更简洁。java的语法比python严格,而且代码也更复杂
示例如下:
url请求:
java版的代码如下:
publicStringcall(Stringurl){Stringcontent="";BufferedReaderin=null;try{URLrealUrl=newURL(url);URLConnectionconnection=realUrl.openConnection();connection.connect();in=newBufferedReader(newInputStreamReader(connection.getInputStream(),"gbk"));Stringline;while((line=in.readLine())!=null){content+=line+"\n";}}catch(Exceptione){e.printStackTrace();}finally{try{if(in!=null){in.close();}}catch(Exceptione2){e2.printStackTrace();}}returncontent;}
python版的代码如下:
#coding=utf-8importchardetimporturllib2url="http://www.baidu.com"data=(urllib2.urlopen(url)).read()charset=chardet.detect(data)code=charset['encoding']content=str(data).decode(code,'ignore').encode('utf8')printcontent
正则表达式
java版的代码如下:
publicStringcall(Stringcontent)throwsException{Patternp=Pattern.compile("content\":\".*?\"");Matchermatch=p.matcher(content);StringBuildersb=newStringBuilder();Stringtmp;while(match.find()){tmp=match.group();tmp=tmp.replaceAll("\"","");tmp=tmp.replace("content:","");tmp=tmp.replaceAll("<.*>","");sb.append(tmp+"\n");}Stringcomment=sb.toString();returncomment;}}
python的代码如下:
importrepattern=re.compile(正则)group=pattern.findall(字符串)
关于java爬虫与python爬虫对比哪个更简单就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。