編集不可のページ History 添付ファイル

 

ページ名: "HowToRunNGCContainer"の差分
14と15のリビジョン間の差分
2019-09-30 11:10:29時点のリビジョン14
サイズ: 2175
編集者: hitachi29
コメント:
2025-06-06 01:15:12時点のリビジョン15
サイズ: 630
編集者: hitachi26
コメント:
削除された箇所はこのように表示されます。 追加された箇所はこのように表示されます。
行 1: 行 1:
= NVIDIA GPU Cloudコンテナの実行方法 = = 深層学習コンテナを利用する方法 =
行 3: 行 3:
== NVIDIA GPU Cloud(NGC)の概要 ==
NVIDIA GPU Cloud([[https://ngc.nvidia.com/|NGC:https://ngc.nvidia.com]]) はディープラーニング、機械学習、HPC のために GPU で最適化されたソフトウェアのハブであり、最新のアプリケーションをDockerイメージでタイムリーに利用できます。
深層学習用コンテナを利用したい場合、singularity pullを利用することで、sifイメージのダウンロードやdockerイメージのsifファイル変換が可能です.
sifファイルへの変換方法は以下です。※サイトは例の2社に限定されるわけではありません。
行 6: 行 6:


== NVIDIA GPU Cloudコンテナの表示 ==
NVIDIA GPU Cloudに登録されているコンテナを下記コマンドで確認できます。
NGCに登録されているイメージのリストは毎日更新されます。
{{{
showngcimages
例:NGCのPytorch Docker イメージをsifに変換
{{{
$ singularity pull docker://nvcr.io/nvidia/pytorch:22.12-py3
行 14: 行 10:

showngcimagesコマンドで表示されるイメージについての詳細はNGCホームページより下記手順で確認できます。
<<BR>>
 (1) NVIDIA GPU Cloud([[https://ngc.nvidia.com/|NGC:https://ngc.nvidia.com]])へアクセス<<BR>>
 (2) 左側メニューよりACCELERATED SOFTWAREを選択<<BR>>
 (3) 表示されたイメージの中から利用したいソフトウェアを選択<<BR>>
 (4) 選択したソフトウェアのページでOverviewタブを選択します。<<BR>>
 (5) Suggested Readingのセクションにリリースノート(ソフトウェアのバージョン情報)とTutorialへのリンクが記載されています。<<BR>>

また、NVIDIAのDeepLearningのページ[[https://docs.nvidia.com/deeplearning/]]からも各フレームワークのリリースノートやユーザガイドが確認できます。
<<BR>>
== NGCコンテナの利用方法 ==
DOCKER_IMAGEまたはSINGULARITY_IMAGEでshowngcimagesコマンドで表示されるイメージを指定してジョブを投入することで、ジョブスケジューラがNGCからDockerイメージを取得、プライベートレジストリへの登録、Singularityイメージへの変換を自動的に行い、指定したコンテナジョブを実行します。

{{{
qsub -q gSrchq -v DOCKER_IMAGE=<NGCのイメージ> test.sh
例:ROCmのPyTorch Dockerイメージをsifに変換
{{{
$ singularity pull docker://rocm/pytorch:latest
行 31: 行 14:

NGCからのDockerイメージ取得には15分程度かかります。イメージが利用可能になるまでジョブはQueue状態になります。

深層学習コンテナを利用する方法

深層学習用コンテナを利用したい場合、singularity pullを利用することで、sifイメージのダウンロードやdockerイメージのsifファイル変換が可能です. sifファイルへの変換方法は以下です。※サイトは例の2社に限定されるわけではありません。

例:NGCのPytorch Docker イメージをsifに変換

$ singularity pull docker://nvcr.io/nvidia/pytorch:22.12-py3

例:ROCmのPyTorch Dockerイメージをsifに変換

$ singularity pull docker://rocm/pytorch:latest