3と25のリビジョン間の差分 (その間の編集: 22回)
サイズ: 1261
コメント:
|
← 2025-07-09 04:00:56時点のリビジョン25 ⇥
サイズ: 959
コメント:
|
削除された箇所はこのように表示されます。 | 追加された箇所はこのように表示されます。 |
行 1: | 行 1: |
= NVIDIA GPU Cloudコンテナの実行方法 = | = Singularityイメージファイルの入手 = |
行 3: | 行 3: |
== NVIDIA GPU Cloud(NGC)の概要 == NVIDIA GPU Cloud(!NGC) はディープラーニング、機械学習、HPC のために GPU で最適化されたソフトウェアのハブであり、最新のアプリケーションをDockerイメージでタイムリーに利用できます。 |
Singularityイメージファイル(sif)を/work以下に置き,HPCクラスタのバッチジョブやインタラクティブジョブで指定することができます. |
行 6: | 行 5: |
== NVIDIA GPU Cloudコンテナの表示 == NVIDIA GPU Cloudに登録されているコンテナを下記コマンドで確認できます。 NGCに登録されているイメージのリストは毎日更新されます。 |
各ユーザの環境にてsingularity pullを利用することで,公開されているDockerイメージを変換してsifを入手できます.公開されているDockerイメージは [[https://hub.docker.com/|Docker Hub]] や [[https://catalog.ngc.nvidia.com/containers|NVIDIA NGC]] などで検索できます. 例:ROCmのTensorflow Dockerイメージをsifに変換 |
行 10: | 行 9: |
showngcimages | $ nohup singularity pull docker://rocm/tensorflow & |
行 13: | 行 12: |
== NGCコンテナの利用方法 == (!調整中) DOCKER_IMAGEまたはSINGULARITY_IMAGEでshowngcimagesコマンドで表示されるイメージを指定してジョブを投入することで、ジョブスケジューラがNGCからDockerイメージを取得、プライベートレジストリへの登録、Singularityイメージへの変換を自動的に行い、指定したコンテナジョブを実行します。 |
例:ROCmのPyTorch Dockerイメージをsifに変換 |
行 18: | 行 14: |
qsub -q gSrchq -v DOCKER_IMAGE=<NGCのイメージ> test.sh | $ nohup singularity pull docker://rocm/pytorch:latest & |
行 21: | 行 17: |
NGCからのDockerイメージ取得には15分程度かかります。イメージが利用可能になるまでジョブはQueue状態になります。 | 例:NVIDIA NGCのPytorch Dockerイメージをsifに変換 {{{ $ nohup singularity pull docker://nvcr.io/nvidia/pytorch:22.12-py3 & }}} |
Singularityイメージファイルの入手
Singularityイメージファイル(sif)を/work以下に置き,HPCクラスタのバッチジョブやインタラクティブジョブで指定することができます.
各ユーザの環境にてsingularity pullを利用することで,公開されているDockerイメージを変換してsifを入手できます.公開されているDockerイメージは Docker Hub や NVIDIA NGC などで検索できます.
例:ROCmのTensorflow Dockerイメージをsifに変換
$ nohup singularity pull docker://rocm/tensorflow &
例:ROCmのPyTorch Dockerイメージをsifに変換
$ nohup singularity pull docker://rocm/pytorch:latest &
例:NVIDIA NGCのPytorch Dockerイメージをsifに変換
$ nohup singularity pull docker://nvcr.io/nvidia/pytorch:22.12-py3 &