python爬取12306_python爬取12306的车次信息
#靜態的數據一般在elements中(復制文字到sources按ctrl+f搜索。找到的為靜態),而動態去network中去尋找相關的信息
import requests
import re
def send_request():
headers= {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36','Cookie':'_uab_collina=159618052151589201474313; JSESSIONID=D33C89D8BEC6A692C79CFA69FC0B0D29; BIGipServerotn=233832970.24610.0000; BIGipServerpool_passport=216859146.50215.0000; RAIL_EXPIRATION=1596443951465; RAIL_DEVICEID=nMo94O2Z21cXLblW7otLoxUZ_LP9Q01PYj_I89OqU6MqjxyX9814Jc3CH5TNwgBVJqnBaBG8OGiBWo2QtNcu5wVu-asNk6YLa49g0fMwVp03XFJQ-GkhHYHcqIgUd-nqQB_VEdWH1Om_D2yAgIu8QcEavt02pmH5; route=c5c62a339e7744272a54643b3be5bf64; _jc_save_fromStation=%u5317%u4EAC%2CBJP; _jc_save_toStation=%u5929%u6D25%2CTJP; _jc_save_fromDate=2020-07-31; _jc_save_toDate=2020-07-31; _jc_save_wfdc_flag=dc'}#創建頭部信息
url='https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2020-07-31&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=TJP&purpose_codes=ADULT'#設置編碼格式。防止亂碼
resp=requests.get(url,headers=headers)
resp.encoding='utf-8'
returnresp
#解析數據
#{}是字典。根據key獲取值。
def parse_json(resp,city):
json_ticket=resp.json()#將相應的數據轉換為json
data_list=json_ticket['data']['result']#得到車次的列表
lst=[]#列表for item indata_list:
#遍歷車次信息進行分割
d=item.split('|')
lst.append([d[3],city[d[6]],city[d[7]],d[31],d[30],d[13]])returnlst'''d[3]從列表中獲取索引為3的表示車次
d[6]查詢起始站
d[7]查詢到達站
d[31]一等座
d[30]表示二等座
d[13]表示出行時間'''#獲得station_name的信息
def get_city():
url='https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9151'headers= {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'}
resp=requests.get(url,headers=headers)
resp.encoding='utf-8'#進行數據的提取(只要一部分)
stations=re.findall('([\u4e00-\u9fa5]+)\|([A-Z]+)',resp.text)
#將列表進行轉換為字典
stations_data=dict(stations)
#key與value進行互換
station_d={}#空字典。用于完成上述操作for item instations_data:
station_d[stations_data[item]]=item
#print(station_d)returnstation_d
def start():
lst=parse_json(send_request(),get_city())
#進行數據的篩選(得到有效的數據)for i inlst:if i[3]!='無' and i[3]!='':
print(i)if __name__=='__main__':
start() #開始
總結
以上是生活随笔為你收集整理的python爬取12306_python爬取12306的车次信息的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 冒泡排序 java_冒泡排序Java版本
- 下一篇: python继承问题_深入浅析pytho