NVIDIA GPU Cloudコンテナの実行方法
NVIDIA GPU Cloud(NGC)の概要
NVIDIA GPU Cloud(NGC:https://ngc.nvidia.com) はディープラーニング、機械学習、HPC のために GPU で最適化されたソフトウェアのハブであり、最新のアプリケーションをDockerイメージでタイムリーに利用できます。
NVIDIA GPU Cloudコンテナの表示
NVIDIA GPU Cloudに登録されているコンテナを下記コマンドで確認できます。 NGCに登録されているイメージのリストは毎日更新されます。
showngcimages
showngcimagesコマンドで表示されるイメージについての詳細はNGCホームページより下記手順で確認できます。
(1) NVIDIA GPU Cloud(NGC:https://ngc.nvidia.com)へアクセス
(2) 左側メニューよりACCELERATED SOFTWAREを選択
(3) 表示されたイメージの中から利用したいソフトウェアを選択
(4) 選択したソフトウェアのページでOverviewタブを選択します。
(5) Suggested Readingのセクションにリリースノート(ソフトウェアのバージョン情報)とTutorialへのリンクが記載されています。
また、NVIDIAのDeepLearningのページhttps://docs.nvidia.com/deeplearning/からも各フレームワークのリリースノートやユーザガイドが確認できます。
NGCコンテナの利用方法
DOCKER_IMAGEまたはSINGULARITY_IMAGEでshowngcimagesコマンドで表示されるイメージを指定してジョブを投入することで、ジョブスケジューラがNGCからDockerイメージを取得、プライベートレジストリへの登録、Singularityイメージへの変換を自動的に行い、指定したコンテナジョブを実行します。
qsub -q gSrchq -v DOCKER_IMAGE=<NGCのイメージ> test.sh
NGCからのDockerイメージ取得には15分程度かかります。イメージが利用可能になるまでジョブはQueue状態になります。