TUT HPC Cluster Wiki
ページ名: HowToRunNGCContainer

NVIDIA GPU Cloudコンテナの実行方法

NVIDIA GPU Cloud(NGC)の概要

NVIDIA GPU Cloud(NGC:https://ngc.nvidia.com) はディープラーニング、機械学習、HPC のために GPU で最適化されたソフトウェアのハブであり、最新のアプリケーションをDockerイメージでタイムリーに利用できます。

NVIDIA GPU Cloudコンテナの表示

NVIDIA GPU Cloudに登録されているコンテナを下記コマンドで確認できます。 NGCに登録されているイメージのリストは毎日更新されます。

showngcimages

showngcimagesコマンドで表示されるイメージについての詳細はNGCホームページより下記手順で確認できます。

また、NVIDIAのDeepLearningのページhttps://docs.nvidia.com/deeplearning/からも各フレームワークのリリースノートやユーザガイドが確認できます。

NGCコンテナの利用方法

DOCKER_IMAGEまたはSINGULARITY_IMAGEでshowngcimagesコマンドで表示されるイメージを指定してジョブを投入することで、ジョブスケジューラがNGCからDockerイメージを取得、プライベートレジストリへの登録、Singularityイメージへの変換を自動的に行い、指定したコンテナジョブを実行します。

qsub -q gSrchq -v DOCKER_IMAGE=<NGCのイメージ> test.sh

NGCからのDockerイメージ取得には15分程度かかります。イメージが利用可能になるまでジョブはQueue状態になります。