Python爬虫框架开发环境简介和Scrapy安装
一、开发环境
Centos6.0
Scrapy1.5
Python3.6
Mongodb3.6
Pycharm
二、Scrapy1.5安装
pip install scrapy
如果Python3.6时通过编译安装的,先进行如下设置,设置环境变量,设置别名。
安装遇到的问题:
pip无法请求HTTPS类型的网站,原因是缺少SSL模块。解决办法安装openssl-devel。命令是 sudo yum install -y openssl-devel
SSL安装成功
现在执行pip3 install scrapy 还是报错,这是因为我们的Python3.6是通过编译安装的,所以要重新编译Python以兼容SSL模块。
编译安装执行make && make install完毕后,再执行pip3 install scrapy又报了一个错误,找不到twisted大于13.1.0的版本。
打开浏览器,输入https://pypi.org/ 搜索twisted并下载。完成后通过rz命令导入到服务器中,移动到soft文件中。使用tar -xvjf 进行解压缩,进入到解压后的twisted文件中,使用Python3 setup.py install安装。
再次pip3 install scrapy,成功。安装位置在python安装文件的bin目录下,编辑.bashrc,设置别名。使用source .bashrc编译。在命令行输入scrapy即可。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。