如何安装Python3爬虫利器Scrapy-Splash
这篇文章将为大家详细讲解有关如何安装Python3爬虫利器Scrapy-Splash,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
Scrapy-Splash是一个Scrapy中支持JavaScript渲染的工具,本节来介绍它的安装方式。
Scrapy-Splash的安装分为两部分。一个是Splash服务的安装,具体是通过Docker,安装之后,会启动一个Splash服务,我们可以通过它的接口来实现JavaScript页面的加载。另外一个是Scrapy-Splash的Python库的安装,安装之后即可在Scrapy中使用Splash服务。
1. 相关链接
GitHub:https://github.com/scrapy-plugins/scrapy-splash
PyPI:https://pypi.python.org/pypi/scrapy-splash
使用说明:https://github.com/scrapy-plugins/scrapy-splash#configuration
Splash官方文档:http://splash.readthedocs.io
2. 安装Splash
Scrapy-Splash会使用Splash的HTTP API进行页面渲染,所以我们需要安装Splash来提供渲染服务。这里通过Docker安装,在这之前请确保已经正确安装好了Docker。
安装命令如下:
dockerrun-p8050:8050scrapinghub/splash
安装完成之后,会有类似的输出结果:
2017-07-0308:53:28+0000[-]Logopened.2017-07-0308:53:28.447291[-]Splashversion:3.02017-07-0308:53:28.452698[-]Qt5.9.1,PyQt5.9,WebKit602.1,sip4.19.3,Twisted16.1.1,Lua5.22017-07-0308:53:28.453120[-]Python3.5.2(default,Nov172016,17:05:23)[GCC5.4.020160609]2017-07-0308:53:28.453676[-]Openfileslimit:10485762017-07-0308:53:28.454258[-]Can'tbumpopenfileslimit2017-07-0308:53:28.571306[-]Xvfbisstarted:['Xvfb',':1599197258','-screen','0','1024x768x24','-nolisten','tcp']QStandardPaths:XDG_RUNTIME_DIRnotset,defaultingto'/tmp/runtime-root'2017-07-0308:53:29.041973[-]proxyprofilessupportisenabled,proxyprofilespath:/etc/splash/proxy-profiles2017-07-0308:53:29.315445[-]verbosity=12017-07-0308:53:29.315629[-]slots=502017-07-0308:53:29.315712[-]argument_cache_max_entries=5002017-07-0308:53:29.316564[-]WebUI:enabled,Lua:enabled(sandbox:enabled)2017-07-0308:53:29.317614[-]Sitestartingon80502017-07-0308:53:29.317801[-]Startingfactory<twisted.web.server.Siteobjectat0x7ffaa4a98cf8>
这样就证明Splash已经在8050端口上运行了。这时我们打开http://localhost:8050,即可看到Splash的主页,如图1-80所示。
图1-80 运行页面
当然,Splash也可以直接安装在远程服务器上。我们在服务器上以守护态运行Splash即可,命令如下:
dockerrun-d-p8050:8050scrapinghub/splash
这里多了-d参数,它代表将Docker容器以守护态运行,这样在中断远程服务器连接后,不会终止Splash服务的运行。
3. Scrapy-Splash的安装
成功安装Splash之后,接下来再来安装其Python库,命令如下:
pip3installscrapy-splash
命令运行完毕后,就会成功安装好此库,后面会详细介绍它的用法。
关于如何安装Python3爬虫利器Scrapy-Splash就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。