編集不可のページ History 添付ファイル

 

ページ名: "HowToRunNGCContainer"の差分
5と25のリビジョン間の差分 (その間の編集: 20回)
2019-09-30 10:40:52時点のリビジョン5
サイズ: 1274
編集者: hitachi29
コメント:
2025-07-09 04:00:56時点のリビジョン25
サイズ: 959
編集者: yi041
コメント:
削除された箇所はこのように表示されます。 追加された箇所はこのように表示されます。
行 1: 行 1:
= NVIDIA GPU Cloudコンテナの実行方法 = = Singularityイメージファイルの入手 =
行 3: 行 3:
== NVIDIA GPU Cloud(NGC)の概要 ==
NVIDIA GPU Cloud([[https://ngc.nvidia.com/|NGC]]) はディープラーニング、機械学習、HPC のために GPU で最適化されたソフトウェアのハブであり、最新のアプリケーションをDockerイメージでタイムリーに利用できます。
Singularityイメージファイル(sif)を/work以下に置き,HPCクラスタのバッチジョブやインタラクティブジョブで指定することができます.
行 6: 行 5:
== NVIDIA GPU Cloudコンテナの表示 ==
NVIDIA GPU Cloudに登録されているコンテナを下記コマンドで確認できます。
NGCに登録されているイメージのリストは毎日更新されます。
各ユーザの環境にてsingularity pullを利用することで,公開されているDockerイメージを変換してsifを入手できます.公開されているDockerイメージは [[https://hub.docker.com/|Docker Hub]] や [[https://catalog.ngc.nvidia.com/containers|NVIDIA NGC]] などで検索できます.

例:ROCmのTensorflow Dockerイメージをsifに変換
行 10: 行 9:
showngcimages $ nohup singularity pull docker://rocm/tensorflow &
行 13: 行 12:
== NGCコンテナの利用方法 ==
DOCKER_IMAGEまたはSINGULARITY_IMAGEでshowngcimagesコマンドで表示されるイメージを指定してジョブを投入することで、ジョブスケジューラがNGCからDockerイメージを取得、プライベートレジストリへの登録、Singularityイメージへの変換を自動的に行い、指定したコンテナジョブを実行します。
例:ROCmのPyTorch Dockerイメージをsifに変換
行 17: 行 14:
qsub -q gSrchq -v DOCKER_IMAGE=<NGCのイメージ> test.sh $ nohup singularity pull docker://rocm/pytorch:latest &
行 20: 行 17:
NGCからのDockerイメージ取得には15分程度かかります。イメージが利用可能になるまでジョブはQueue状態になります。 例:NVIDIA NGCのPytorch Dockerイメージをsifに変換
{{{
$ nohup singularity pull docker://nvcr.io/nvidia/pytorch:22.12-py3 &
}}}

Singularityイメージファイルの入手

Singularityイメージファイル(sif)を/work以下に置き,HPCクラスタのバッチジョブやインタラクティブジョブで指定することができます.

各ユーザの環境にてsingularity pullを利用することで,公開されているDockerイメージを変換してsifを入手できます.公開されているDockerイメージは Docker HubNVIDIA NGC などで検索できます.

例:ROCmのTensorflow Dockerイメージをsifに変換

$ nohup singularity pull docker://rocm/tensorflow &

例:ROCmのPyTorch Dockerイメージをsifに変換

$ nohup singularity pull docker://rocm/pytorch:latest &

例:NVIDIA NGCのPytorch Dockerイメージをsifに変換

$ nohup singularity pull docker://nvcr.io/nvidia/pytorch:22.12-py3 &