當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

urllib 模块学习

發(fā)布時間：2024/1/17 编程问答 29 豆豆

生活随笔收集整理的這篇文章主要介紹了 urllib 模块学习小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

urllib.urlopen('網址'):這里傳入urlopen()的參數有特別說要求，要遵循一些網絡協議，比如http,ftp。

也就是說，在網址的開頭必須要有http://這樣的說明,如：urllib.urlopen('http://www.baidu.com')。

要么就是本地文件，本地文件需要使用file關鍵字，比如urllib.urlopen('file:hello.py')。

注意，這里的hello.py是指的是當前的classpath所指定的內容，當然也可以直接寫全部路徑，urllib.urlopen('file:F:\pythontest\hello.py')。

#-*- coding:utf-8 -*- import urllibf = urllib.urlopen('http://www.baidu.com') print f.read() print f.info() print f.getcode()

如果傳入的參數正確，比如該網站可以訪問，沒有特殊情況(比如需要代理等)，那么將返回一個類似于文件對象的對象。即上面代碼中的f,f對象有的方法一些操作方法，使用dir(f)：

>>> dir(f) ['__doc__', '__init__', '__iter__', '__module__', '__repr__', 'close', 'code', 'fileno', 'fp', 'getcode', 'geturl', 'headers', 'info', 'next', 'read', 'readline', 'readlines', 'url']

urlopen返回一個類文件對象，他提供了如下方法：

read() , readline() , readlines() , fileno() , close() ：這些方法的使用方式與文件對象完全一樣;

info()：返回一個httplib.HTTPMessage 對象，表示遠程服務器返回的頭信息；

getcode()：返回Http狀態(tài)碼。如果是http請求，200表示請求成功完成;404表示網址未找到；

geturl()：返回請求的url；

使用read()方法會將所有內容讀取出來，并且不能返回重讀，在使用f.read()將得不到任何數據，也就是說，得到的數據在這個時候如果想在后面進行任何處理操作的話，需要另外定義一個對象來進行存儲

轉載于:https://www.cnblogs.com/Roger1227/archive/2013/05/18/3086329.html

總結

以上是生活随笔為你收集整理的urllib 模块学习的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Linux下进程通信的八种方法
下一篇： Tkinter Helloword ！