去年因項目需要,用python寫了個爬蟲。因爬到的數(shù)據(jù)需要存到生產(chǎn)環(huán)境的PG數(shù)據(jù)庫。所以需要將腳本部署到CentOS服務(wù)器,并設(shè)置定時任務(wù),自動啟動腳本。
實施步驟如下:
1.安裝pip(操作系統(tǒng)自帶了python2.6可以直接用,但是沒有pip)
# 下載pip安裝包
wget "https://pypi.python.org/packages/source/p/pip/pip-1.5.4.tar.gz#md5=834b2904f92d46aaa333267fb1c922bb" --no-check-certificate
# 解壓安裝包并安裝
tar -xzvf pip-1.5.4.tar.gz
cd pip-1.5.4
python setup.py install
2.用pip安裝第三方庫
pip install PyGreSQL==5.0.3
pip install requests==2.18.3
3.設(shè)置定時任務(wù)
# 開啟定時任務(wù)服務(wù)
service crond start
# 查看定時任務(wù)服務(wù)狀態(tài)
service crond status
# 打開定時任務(wù)編輯窗口
crontab -e
# 添加兩條定時任務(wù),即每天0點0分和12點20分各執(zhí)行一次,并寫入日志
0 0 * * * /usr/bin/python /home/longrise/psrd/collect.py > /home/longrise/psrd/collect.log 2>&1 &
20 12 * * * /usr/bin/python /home/longrise/psrd/collect.py > /home/longrise/psrd/collect.log 2>&1 &
定時任務(wù)語法如下:
# For details see man 4 crontabs
# Example of job definition:
# .---------------- minute (0 - 59)
# | .------------- hour (0 - 23)
# | | .---------- day of month (1 - 31)
# | | | .------- month (1 - 12) OR jan,feb,mar,apr ...
# | | | | .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat
# | | | | |
# * * * * * user-name command to be executed
以上這篇Linux部署python爬蟲腳本,并設(shè)置定時任務(wù)的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。