Google Cloud DataLab

Google Cloud DataLabは、データを探索、視覚化、分析、変換するための、生産性の高いインタラクティブな統合ツールです。Google Cloud Datalabは、Dockerで起動、GCPのインスタンスで起動が可能である。今回は、ローカル環境でDockerで起動していく。

Cloud SDKを経由してGCPのプロジェクトと連携

Datalabは、Cloud SDKを経由して、GCPのプロジェクトと連携が可能になる。もちろん、連携しないで起動する事も可能である。GCPの設定時に、プロジェクトを作成した場合は、そのプロジェクトと連携できるので、GCPのプロジェクトIDを、Cloud Shellを起動し、コマンドで取得する。

[CloudMLで実行]

$ gcloud projects list

Datalabの起動

下記はOS X用。Windows用のDocker設定は、https://cloud.google.com/datalab/docs/quickstarts/quickstart-localを参照。

[Dockerのインストール]

Docker公式サイト で Get Started を選択、次にDownload Docker for Macを選択し本体をダウンロードする。ダウンロード終了後インストールを行い、終了後に表示されるアイコンをクリックすることでDockerを立ち上げる。その後以下のどちらかでDatalabを起動する。

[OS Xで実行:プロジェクトIDを指定]

$ cd ~
$ mkdir -p ./datalab
$ docker run -it -p 127.0.0.1:8081:8080 -p 6006:6006 -v "${HOME}/datalab:/content" \
 -e "PROJECT_ID=プロジェクトID"  \
gcr.io/cloud-datalab/datalab:local

[OS Xで実行:プロジェクトIDを未指定]

$ cd ~
$ mkdir -p ./datalab
$ docker run -it -p 127.0.0.1:8081:8080 -p 6006:6006 -v "${HOME}/datalab:/content" \
gcr.io/cloud-datalab/datalab:local
引数 意味
-p 127.0.0.1:8081:8080 Datalabに8081ポートでアクセスできるようにする
-p 6006:6006 TensorBoardに6006ポートでアクセスできるようにする
-v "${HOME}/datalab:/content" OSX上の${HOME}/datalabフォルダとDocker内の/contantを連携する
gcr.io/cloud-datalab/datalab:local 起動するDocker Image

Datalabにアクセス

Browserで、localhost:8081に接続します。

Hello World

import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

x = np.arange(0, 10, 0.1)
y = np.sin(x)

plt.plot(x,y)
plt.show()