bookmark_border[環境構築] TensorFlow+KerasをGPUで動かす[venv]

頻繁にすることではないものの、いざ構築するとなるとやることが多いのでメモ。Pythonの仮想環境はvenvを使います。

1. 構築前の確認事項

グラフィックボードがNVIDIAであること

2022年1月現在、TensorFlowはNVIDIAのGPUドライバだけをサポートしています。

MACなどRadeonのようにNVIDIA以外のGPUの場合は残念ながらTensorFlowを使うことができません。

TensorFlowが求めるGPUドライバ, cuDNN, CUDAのバージョン

TensorFlow公式ページに行き、最新のTensorFlowが求めるcuDNNとCUDAのバージョンを確認します。このバージョンたちにずれがあるとimportに失敗することがあります。

https://www.tensorflow.org/install/source_windows?hl=ja

2. 各種ファイルのダウンロード

CUDA

https://developer.nvidia.com/cuda-toolkit-archive

CUDAはCPUで行う処理をNVIDIAのGPUに行わせる開発環境のことです。TensorFlow公式ページに書いてあったCUDAのバージョンを探し、ダウンロードします。今回の場合11.2系です。

cuDNN(アカウント登録が必要)

https://developer.nvidia.com/rdp/cudnn-archive

登録(ログイン)したらcuDNNのアーカイブページに行き、先ほどTensorFlow公式ページで確認したバージョンのcuDNNをダウンロードします。今回の場合8.1です。

グラボのドライバ(should)

CUDAとcuDNNは大抵バージョンが上がるごとに新しいGPUドライバを求めてくるため、この機会に最新のドライバを入れても良いでしょう。

3. CUDAとcuDNNのインストール

CUDA

インストーラーのため、実行したら画面の指示に従うだけでOKです。

cuDNN

ダウンロードしたzipファイルを展開するとbinなどのフォルダが3つほどあります。

CUDAをインストールしたことによってできた下記のフォルダにそのcudaフォルダの中身を全部移動します。(フォルダとは別にSLAのtxtファイルもありますが、公的文書のため覚書として今回一緒にコピーします)

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2
※↑末尾のバージョン番号はインストールしたCUDAのバージョンによって異なります。

4. Pythonのライブラリのインストール

Pythonがインストールされており、パスが通っていること前提です。

pip venv

まずはvenvで仮想環境を作ります。

cd 好きなディレクトリ
python -m venv venv

仮想環境を作ったらactivateしておきます。

venv¥Scripts¥activate

pip install

必要なら tensorflow-gpu=2.6.0 のようにバージョンを指定してください。

pip install tensorflow==2.6.0 keras==2.6.0

バージョン1.15以前はパッケージがtensorflowとtensorflow-gpuに分かれていましたが、それ以降はtensorflowに統一されています。

TensorFlowがGPUを認識できているか確認する

pythonコマンドで対話モードを起動し、下記のように実行します。

参考:https://www.tensorflow.org/guide/gpu?hl=ja

import tensorflow as tf
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))

このように1以上の値が出力されていれば認識されています。

Num GPUs Available: 1

下記のコードでも確認できます。

from tensorflow.python.client import device_lib
device_lib.list_local_devices()

いくらか情報が出力され、その中にGPUの名前が出てきていればうまくいっています。

...
physical_device_desc: "device: 0, name: NVIDIA GeForce GTX 1080 Ti, pci bus id: 0000:01:00.0, compute capability: 6.1"

bookmark_border[Keras] Cannot register 2 metrics with the same name で落ちる

Keras(2.7.0) + TensorFlow(2.6.0) を久しぶりに触ったらimportでAlreadyExistsError: Another metric with the same name already exists. と言われ落ちたのでメモ。

E tensorflow/core/lib/monitoring/collection_registry.cc:77] Cannot register 2 metrics with the same name: /tensorflow/api/keras/optimizers
...
...
tensorflow.python.framework.errors_impl.AlreadyExistsError: Another metric with the same name already exists.

TL;DR

TensorFlow2.6 なら Keras2.6 を使うこと。

pip uninstall keras
pip install keras==2.6.0

理由

Keras2.6 + TensorFlow2.7 はバージョンミスマッチのためNG。

KerasのGitHubのIssueを見ると次のような記述あり。

We believe the Keras 2.7.0 release is getting installed by pip when users install Tensorflow, even though Tensorflow 2.7 hasn’t been released to pip yet. The version mismatch (Keras 2.7 + TF 2.6.1) is probably the cause of the error.

(TensorFlow2.7.0はpipで未リリースなのに、pipでTensorFlowをインストールするときKeras2.7.0がインストールされてしまっていると考えられます。エラーはKeras2.7+TensorFlow2.6.1とバージョンが揃っていないことが原因でしょう。)

Another metric with the same name already exists in Keras 2.7.0 #1557

まさに自分のことです。(pip list したら Keras2.7.0+TensorFlow2.6.1 になっていた)

一旦Kerasを2.6.0にしたところ無事動きました。

bookmark_borderAttributeError … has no attribute ‘_TensorLike’

久しぶりにKerasを使ったら落ちたのでメモ。

TL;DR

from keras import ... ではなく from tensorflow.keras import ...

発生するエラー

AttributeError: module ‘tensorflow.python.framework.ops’ has no attribute ‘_TensorLike’

問題のコード

from keras import Sequential
from keras.layers import Conv2D, MaxPooling2D, Activation, Dropout, Flatten, Dense
import tensorflow as tf
model = Sequential()
# ここで落ちる
model.add(Conv2D(64,(3,3), padding='same', input_shape=(192,192,3))
opt = tf.keras.optimizers.rmsprop(lr=0.0001, decay=1e-6)
# ...

修正

# from keras import Sequential
from tensorflow.keras.models import Sequential
# from keras.layers import Conv2D, MaxPooling2D, Activation, Dropout, Flatten, Dense
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Activation, Dropout, Flatten, Dense
import tensorflow as tf
model = Sequential()
model.add(Conv2D(64,(3,3), padding='same', input_shape=(192,192,3))
# opt = tf.keras.optimizers.rmsprop(lr=0.0001, decay=1e-6)
opt = tf.keras.optimizers.RMSprop(lr=0.0001, decay=1e-6)
# ...