urllib 模块学习
生活随笔
收集整理的這篇文章主要介紹了
urllib 模块学习
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
urllib.urlopen('網址'):這里傳入urlopen()的參數有特別說要求,要遵循一些網絡協議,比如http,ftp。
也就是說,在網址的開頭必須要有http://這樣的說明,如:urllib.urlopen('http://www.baidu.com')。
要么就是本地文件,本地文件需要使用file關鍵字,比如urllib.urlopen('file:hello.py')。
注意,這里的hello.py是指的是當前的classpath所指定的內容,當然也可以直接寫全部路徑,urllib.urlopen('file:F:\pythontest\hello.py')。
#-*- coding:utf-8 -*- import urllibf = urllib.urlopen('http://www.baidu.com') print f.read() print f.info() print f.getcode()如果傳入的參數正確,比如該網站可以訪問,沒有特殊情況(比如需要代理等),那么將返回一個類似于文件對象的對象。即上面代碼中的f,f對象有的方法一些操作方法,使用dir(f):
>>> dir(f) ['__doc__', '__init__', '__iter__', '__module__', '__repr__', 'close', 'code', 'fileno', 'fp', 'getcode', 'geturl', 'headers', 'info', 'next', 'read', 'readline', 'readlines', 'url']urlopen返回 一個類文件對象,他提供了如下方法:
使用read()方法會將所有內容讀取出來,并且不能返回重讀,在使用f.read()將得不到任何數據,也就是說,得到的數據在這個時候如果想在后面進行任何處理操作的話,需要另外定義一個對象來進行存儲
轉載于:https://www.cnblogs.com/Roger1227/archive/2013/05/18/3086329.html
總結
以上是生活随笔為你收集整理的urllib 模块学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux下进程通信的八种方法
- 下一篇: Tkinter Helloword !