濮阳杆衣贸易有限公司

主頁(yè) > 知識(shí)庫(kù) > python模擬登陸網(wǎng)站的示例

python模擬登陸網(wǎng)站的示例

熱門(mén)標(biāo)簽:n400電話申請(qǐng)多少錢(qián) 西藏快速地圖標(biāo)注地點(diǎn) 地圖標(biāo)注推廣單頁(yè) 長(zhǎng)春人工智能電銷機(jī)器人官網(wǎng) 如何在地圖標(biāo)注文字 女王谷地圖標(biāo)注 ai地圖標(biāo)注 百應(yīng)ai電銷機(jī)器人鄭州 廈門(mén)crm外呼系統(tǒng)如何

使用已有cookie登陸

使用瀏覽器登陸,獲取瀏覽器中的cookie信息,來(lái)進(jìn)行登陸。

我們以博客園為例,先登錄博客園賬號(hào)。我們?cè)L問(wèn)隨筆列表,在控制臺(tái)我們可以看到我們登陸后瀏覽器的cookie

剔除一些數(shù)據(jù)統(tǒng)計(jì)及分析的cookie,剩下的就是登陸可能需要的.CNBlogsCookie和.Cnblogs.AspNetCore.Cookies

# _ga google分析 cookie
# UM_distinctid 友盟cookie
# CNZZxxx CNZZcookie
# __utma,__utmc,__utmz google統(tǒng)計(jì)網(wǎng)站
# Hm_lvt_xxx 百度統(tǒng)計(jì)網(wǎng)站
import urllib.request

url = 'https://i.cnblogs.com/posts'

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'

#瀏覽器登錄后得到的cookie,也就是剛才復(fù)制的字符串
cookie_str = '.CNBlogsCookie=xxx; .Cnblogs.AspNetCore.Cookies=xxx'

headers = {
 'User-Agent': user_agent,
 'cookie':cookie_str
}

req = urllib.request.Request(url,headers=headers)
resp = urllib.request.urlopen(req).read().decode('utf-8')

print(resp)

登陸獲取cookie

登陸的表單一般是使用的form data,現(xiàn)在也有些表單使用request payload使用json格式傳參。

form data如藥智網(wǎng)

request payload如博客園

form data

博客園的登陸需要拖動(dòng)驗(yàn)證所以略過(guò)。我們以藥智網(wǎng)為例,我們打開(kāi)控制臺(tái)可以看到登陸需要傳的表單參數(shù),這里是使用的form data表單。我們模擬登陸后獲取到登陸后的cookie,然后訪問(wèn)登錄后的個(gè)人中心頁(yè)面。

import urllib.request
import http.cookiejar

url = 'https://www.yaozh.com/login'

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'

# formData數(shù)據(jù)
data = {'username': '用戶名',
  'pwd': '密碼',
  'formhash': 'C3086BBA84',
  'backurl': 'https%3A%2F%2Fwww.yaozh.com%2F'}

post_data = urllib.parse.urlencode(data).encode('utf-8')

# 請(qǐng)求頭設(shè)置
headers = {
 'User-Agent': user_agent
}

# 構(gòu)造登陸請(qǐng)求
req = urllib.request.Request(url, headers=headers, data=post_data)

# cookie
cookie = http.cookiejar.CookieJar()

# 構(gòu)造一個(gè)opener攜帶登錄后的cookie
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))

# 發(fā)送登陸請(qǐng)求
resp = opener.open(req)

print(resp)

# 登錄后個(gè)人中心
url = 'https://www.yaozh.com/member/'

# 構(gòu)造訪問(wèn)請(qǐng)求
req = urllib.request.Request(url, headers=headers)

resp = opener.open(req).read().decode('utf-8')

print(resp)

request payload

如果登陸需要request payload我們需要將參數(shù)轉(zhuǎn)為json字符串并在頭部設(shè)置Content-Type

import json
...

data = {'loginType': '1',
  'pwdOrVerifyCode': '密碼',
  'userIdentification': '賬號(hào)',
  'uaToken': '',
  'webUmidToken':''}

headers = {
 'Content-Type': 'application/json;charset=UTF-8',
 'User-Agent': user_agent
}


req = urllib.request.Request(url, headers=headers, data=json.dumps(data))
...

登陸后用session保持登陸狀態(tài)

我們用requests模塊的Session對(duì)象來(lái)保存回話信息

import requests

url = 'https://www.yaozh.com/login'

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'

# formData數(shù)據(jù)
data = {'username': 'chenjy1225',
  'pwd': '19931225yjy',
  'formhash': 'C3086BBA84',
  'backurl': 'https%3A%2F%2Fwww.yaozh.com%2F'}


#構(gòu)造Session
session = requests.Session()

# 發(fā)送post請(qǐng)求
resp = session.post(url, data)

# 登錄后個(gè)人中心
url = 'https://www.yaozh.com/member/'

# 發(fā)送請(qǐng)求訪問(wèn)個(gè)人中心
resp = session.get(url).content.decode('utf-8')

print(resp)

調(diào)用瀏覽器登陸

我們也可以在程序中調(diào)用一個(gè)瀏覽器來(lái)訪問(wèn)登陸網(wǎng)站。在python中使用Selenium庫(kù)就能輕松實(shí)現(xiàn)調(diào)用瀏覽器,被控制的瀏覽器可以是chrome、firefox等。
以前較常用的還是PhantomJS但是PhantomJS被python棄用了。

UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead
warnings.warn('Selenium support for PhantomJS has been deprecated, please use headless '

firefox對(duì)應(yīng)的geckodriver

chrome對(duì)應(yīng)的chrnpm.taobao.org/mirrors/chromedriveromedriver

1.下載Selenium、firefox瀏覽器及firefox驅(qū)動(dòng)。

2.將下載的firefox驅(qū)動(dòng)geckodriver放在firefox瀏覽器安裝目錄

3.將firefox瀏覽器安裝目錄添加到path中

4.重啟ide

我們找到需要登陸時(shí)候輸入的元素id及登陸button id。

from selenium import webdriver
import time

# 新建selenium瀏覽器對(duì)象,后面是geckodriver.exe下載后本地路徑
browser = webdriver.Firefox()

url = 'https://www.yaozh.com/login'

# 瀏覽器訪問(wèn)登錄頁(yè)面
browser.get(url)

# 等待3s用于加載腳本文件
browser.implicitly_wait(3)

# 輸入用戶名
username = browser.find_element_by_id('username')
username.send_keys('chenjy1225')

# 輸入密碼
password = browser.find_element_by_id('pwd')
password.send_keys('19931225yjy')

# 點(diǎn)擊登錄按鈕
login_button = browser.find_element_by_id('button')
login_button.submit()

# 網(wǎng)頁(yè)截圖
browser.save_screenshot('screenshot.png')

# 強(qiáng)制等待5s,等待登錄后的跳轉(zhuǎn)
time.sleep(5)

url = 'https://www.yaozh.com/member/'

browser.get(url)

# 網(wǎng)頁(yè)截圖個(gè)人中心
browser.save_screenshot('screenshot1.png')

# 關(guān)閉瀏覽器
browser.quit()

screenshot.png:

screenshot1.png:

以上就是python模擬登陸網(wǎng)站的示例的詳細(xì)內(nèi)容,更多關(guān)于python模擬登陸網(wǎng)站的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

您可能感興趣的文章:
  • 詳解如何用Python模擬登錄淘寶
  • selenium攜帶cookies模擬登陸CSDN的實(shí)現(xiàn)
  • python 模擬登陸github的示例
  • python requests模擬登陸github的實(shí)現(xiàn)方法
  • 詳解python項(xiàng)目實(shí)戰(zhàn):模擬登陸CSDN
  • python模擬登陸,用session維持回話的實(shí)例
  • 詳解如何用Python登錄豆瓣并爬取影評(píng)

標(biāo)簽:渭南 黔東 興安盟 內(nèi)江 綿陽(yáng) 拉薩 廊坊 亳州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python模擬登陸網(wǎng)站的示例》,本文關(guān)鍵詞  python,模擬,登陸,網(wǎng),站的,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《python模擬登陸網(wǎng)站的示例》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于python模擬登陸網(wǎng)站的示例的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    屏山县| 平原县| 长沙县| 祁东县| 鄂尔多斯市| 彭州市| 阳泉市| 巴中市| 绥江县| 焦作市| 灵山县| 罗田县| 六安市| 红河县| 叙永县| 若羌县| 达尔| 垫江县| 庆安县| 紫金县| 龙门县| 平阳县| 嵩明县| 南漳县| 上饶市| 安图县| 收藏| 临猗县| 武陟县| 长沙市| 阳新县| 开远市| 安泽县| 富阳市| 微山县| 镇赉县| 石林| 龙井市| 连州市| 湖北省| 枣庄市|