Get me outta here!

【Python 事始め】進捗を表示しながらダウンロードする

2010年5月6日 by delphinus

このエントリーをはてなブックマークに追加

ファイルをダウンロードしてローカルに保存するスクリプトを書いてみる。ただ保存するだけではつまらないので進捗状況を表示してみよう。

ファイルのダウンロードには urllib モジュールの uriretrieve 関数を使う。

11.4 urllib — URL による任意のリソースへのアクセス
http://www.python.jp/doc/2.4/lib/module-urllib.html

`urlretrieve` 関数

次の 4 つの引数が指定できる。url 以外の指定は全て任意だ。

url: ダウンロード対象の URL
filename（任意）: 保存するファイル名。指定しなかった場合はテンポラリフォルダに適当な名前で保存される。
reporthook（任意）: ブロックが読み出される度に呼び出される関数。
data（任意）: POST リクエストするときに使う。指定しなければ自動的に GET リクエストになる。

reporthook 引数に指定した関数には次の 3 つの引数が与えられる。

これまで転送されたブロック数のカウント
バイト単位で表されたブロックサイズ
ファイルの総サイズ

スクリプトの例 `download_test.py`

#!/usr/bin/python
# coding=utf-8
import urllib
import urlparse
import sys

# コマンドライン引数から URL を得る
url = sys.argv[ 1 ]
# URL からファイル名を得る
filename = urlparse.urlparse( url )[ 2 ].split( "/" )[ -1 ]

def progress( block_count, block_size, total_size ):
    ''' コールバック関数 '''
    percentage = 100.0 * block_count * block_size / total_size
    # 改行したくないので print 文は使わない
    sys.stdout.write( "%.2f %% ( %d KB )\r"
            % ( percentage, total_size / 1024 ) )

# ダウンロード開始
urllib.urlretrieve(
        url = url
        ,filename = filename
        ,reporthook = progress
        )
print

実行例

$ python download_test.py "http://www.exmple.com/archive.zip"
12.34 % ( 567 KB )

これだけ。簡単なもんだね。

関連

コメントを残すコメントをキャンセル