初心者から始めるGoogle Colaboratoryの使い方

資料としてまとめる機会がありましたので・・・

drive.google.com

Google Colaboratoryとは・・・

Google Colaboratory(以下、Google Colabとする)はGoogleアカウントさえあれば、
ローカルPCにて設定・環境構築をしなくとも、
深層学習やデータサイエンスを実装できます。

Pythonスクリプトは基本的にJupyter Notebook環境となっており、
Pythonコードを対話型で実行可能。
Python初心者にとっても易しいサービスとなっています。

  1. Google Drive上で実行・共有が可能
  2. Jupyter Notebook環境
  3. クラウド上でGPUを無料で扱える

使用方法はYoutubeで詳しく紹介してくれています。
(Google Colaboratoryの開始方法)

www.youtube.com

使い方

フォルダ作成

Google Driveにアクセル → [新規]ボタンをクリック → [フォルダ]をクリック

f:id:electric-city:20200430232710p:plain:h300:w450
フォルダ作成

ファイル作成

[その他]にマウスをポイント → Google Colaboratoryをクリック

f:id:electric-city:20200430232800p:plain:h300:w350
Google Colabファイルを作成

保存

画面左上の[ファイル] → [保存]

f:id:electric-city:20200430232941p:plain:w300:h500
Google Driveにて保存

12時間ルールと90分ルール

もちろんGoogle Colabは無限に使えるわけではなく、
使用制限があります。

分かりにくいインスタンスの考え方(自分なりに)

f:id:electric-city:20200502232548p:plain
インスタンスの特徴

12時間ルール

インスタンス起動から12時間経過した場合、インスタンスは落ちるます。
インスタンスが落ちた場合、再度起動した時に一からプログラムを実行し直さなくてはいけません。

f:id:electric-city:20200502232550p:plain
12時間ルール

90分ルール

90分間Jupyter Notebook中断・スリープモード・ブラウザ切断した場合、インスタンスは落ちます。

f:id:electric-city:20200502232553p:plain
90分ルール

GPUマシンを活用する

深層学習のコードを実行するには、膨大な計算量が求められることが多いです。
実行時間の大幅短縮が求められるケースが多く、
通常のローカルPCではスペック不足により学習が終了しないケースもあります。

ところがGPUマシンを活用すると、実行時間の大幅短縮につながるわけです。

  • CPU・・・コンピュータにおける制御・演算を行う中央演算処理装置
  • GPU・・・一般的に高速な画像処理で用いられる画像処理装置

CPU君は「複雑な処理ができる反面、計算量とスピードに比べてはGPU君には劣ります」
GPU君は「単純な処理を超スピードで実行します」

冒頭で述べたとおり、Google Colabは以下のメリットがあります。

  • 高級なGPUを購入しなくても良い(無料で使用可能)
  • クラウドで簡単にGPUを活用できる(操作性抜群)

GPUマシンチュートリアル

以下のQiitaを参考にGPUマシンを起動させます。
GPUマシンの使用方法やCPUとGPUの速度比較などを実装してくれています。
qiita.com

f:id:electric-city:20200430235240p:plain
ランタイムのタイプを変更

f:id:electric-city:20200430235248p:plain
GPUを選択

以下のコードでGPUがしっかりと適用できているかを確認します。
コードはPythonで書きましたが、GPU適応した場合と適応していない場合の結果比較です。

import tensorflow as tf
tf.test.gpu_device_name()

GPU適用しない場合
→ ""

GPU適用した場合
→ '/device:GPU:0'

TPUに関して関心のある方はこちらの記事を参考に
qiita.com

参考文献

ntk-lab.com

qiita.com