4.2.3. ジョブのキャンセルコマンド(scancel)
4.2.4. ジョブステータス情報表示コマンド(sstat)
4.2.5. 実行ジョブ情報表示コマンド(sacct)
▲このページの先頭へ
4.2.ジョブの実行方法(SLURMコマンド編)
ジョブを実行するには、フロントエンドサーバからコマンドを実行します。
ジョブ管理のためのコマンドは次のとおりです。
表4.2 ジョブ管理コマンド一覧(SLURMコマンド編)
コマンド用途
sinfo -s
キュー(パーティション)の情報を表示する
4.1.2.キュー情報の確認方法
squeues
キューのノード実行状況を表示する
freenodes
空ノード数を表示する
4.1.3. 利用可能なノード数の確認方法
sbatch
ジョブを投入する
4.2.1.ジョブ投入コマンド(sbatch)
squeue
ジョブの状態を表示する
4.2.2.ジョブ情報表示コマンド(squeue)
scancel
ジョブをキャンセルする
4.2.3.ジョブのキャンセルマンド(scancel)
▲このページの先頭へ
4.2.1.ジョブ投入コマンド(sbatch)
ジョブを実行するために、ジョブ投入スクリプトを事前に作成します。
sbatch
コマンドにジョブ投入スクリプトを指定することで、ジョブがキューイングされ実行されます。
【
sbatch
コマンドの書式】
sbatch ジョブ投入スクリプト
注)
bsub
と異なり、リダイレクトではなく、引数でジョブ投入スクリプトを渡します。
【
sbatch
コマンドの例(スクリプトファイルが
run.sh
の場合)】
$ sbatch run.sh
ジョブ投入コマンド(
sbatch
)について、以下に主なオプションを示します。
表 4.2.1
sbatch
オプション
オプション
sbatch -o ./out_%j.log
(※)
out_ジョブIDという名前のファイルに標準出力を出力します。
-e
オプションが指定されていない場合は、標準エラー出力もこのファイルに出力されます。
sbatch -e ./err_%j.log
(※)
err_ジョブIDという名前のファイルに標準エラー出力を出力します。
※シンボル「
%j
」はジョブIDに置換されます。
▲このページの先頭へ
4.2.2.ジョブ情報表示コマンド(squeue)
ジョブの各種情報を表示するときは、
squeue
コマンドを実行します。
squeue
注)他の利用者の情報は表示されません。
【
squeue
コマンド例】
$ squeue
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
xxxx d024h testrun u***0001 R 4:58 60 d[007-066]
xxxx c006m testrun u***0001 CG 0:39 1 c001
<出力説明>
NODELIST(REASON)
ジョブが実行されるホスト名のリスト (ジョブ状態に対する理由があれば表示されます)
ジョブ状態がPD(PENDING)の場合のREASONを下記に示します。
(Resources) リソースが利用可能になるのを待っています。
(Priority) パーティション内の優先度の高いジョブが完了するのを待っています。
(Dependency) このジョブが依存する他のジョブが完了するのを待っています。
(InvalidQOS) Resources と同義です。
表 4.2.2 ジョブ状態(
squeue
コマンド-STフィールド)
▲このページの先頭へ
4.2.3.ジョブのキャンセルマンド(scancel)
ジョブをキャンセルするにはscancelコマンドを用います。
squeue
コマンドなどで確認したジョブIDを指定します。
scancel
の後に、ジョブIDをスペース区切りで指定すると、複数のジョブを一度にキャンセルすることができます。
scancel ジョブID ジョブID ジョブID
▲このページの先頭へ
4.2.4.ジョブステータス情報表示コマンド(sstat)
ジョブの各種情報(メモリ使用量やディスクI/O量など)を表示するときは、
sstat
コマンドを実行します。ジョブを実行中に実行する必要があります。
sstat –j ジョブID[.ステップID] [-o 項目[,項目]]
注)他の利用者の情報は表示されません。
ジョブが使用中のメモリ量につきましては、下記のコマンドで確認いただけます。
sstat –j ジョブID[.ステップID] -o JobID,MaxVMSize,MaxRSS
注)他の利用者の情報は表示されません。
ステップID は
squeue -s
コマンドで確認することができます。
ステップID は省略可能ですが、逐次処理の場合はステップID として「
batch
」を指定します。
仮想メモリサイズは
MaxVMSize
、物理メモリ消費サイズは
MaxRSS
を指定します。
ジョブステータス情報表示コマンド(
sstat
)について、以下に主なオプションを示します。
表 4.2.4 sstatオプション
オプション
-j ジョブID[.ステップID]
ジョブIDを指定します。必須のオプションです。ステップIDは省略可能です。
ステップIDは
squeue -s
コマンドで確認することができます。
※逐次処理の場合はステップIDとして「
batch
」を指定します。
–o 項目[,項目]...
出力する項目をカンマ区切りで指定します。指定しない場合、全ての項目が表示されます。
一部、FOCUS環境では取得できない項目もあります。
出力項目例
JobID ジョブに割り当てられたジョブIDが表示されます。
MaxVMSize ジョブの全てのタスクでの仮想メモリサイズの最大値です。
MaxRSS ジョブの全てのタスクでの物理メモリ消費サイズの最大値です。
【
sstat
コマンド例1】
$ sstat -j 45643 -o JobID,MaxVMSize,MaxRSS,MaxPages,MaxDiskRead,MaxDiskWrite
JobID MaxVMSize MaxRSS MaxPages MaxDiskRead MaxDiskWrite
------------ ---------- ---------- -------- ------------ ------------
45643.0 1332496K 39276K 293K 1M 0.29M
【
sstat
コマンド例2】
$ sstat -j 45638.0
JobID MaxVMSize MaxVMSizeNode MaxVMSizeTask AveVMSize MaxRSS MaxRSSNode MaxRSSTask AveRSS MaxPages MaxPagesNode MaxPagesTask AvePages MinCPU MinCPUNode MinCPUTask AveCPU NTasks AveCPUFreq ReqCPUFreq ConsumedEnergy MaxDiskRead MaxDiskReadNode MaxDiskReadTask AveDiskRead MaxDiskWrite MaxDiskWriteNode MaxDiskWriteTask AveDiskWrite
------------ ---------- -------------- -------------- ---------- ---------- ---------- ---------- ---------- -------- ------------ -------------- ---------- ---------- ---------- ---------- ---------- -------- ---------- ---------- -------------- ------------ --------------- --------------- ------------ ------------ ---------------- ---------------- ------------
45638.0 1579688K g002 1 912640K 38696K g002 1 26118K 279K g002 1 214K 00:00.000 g001 0 00:00.000 2 2.50G 0 0.96M g002 1 0.68M 0.02M g002 1 0.02M
<出力説明>
4.2.5.実行ジョブ情報表示コマンド(sacct)
実行が完了したジョブの情報を表示するには
sacct
コマンドを用います。
sacct -j ジョブID -o 項目[,項目,...] –X
注)他の利用者の情報は表示されません。
実行が完了したジョブのメモリ量につきましては、下記のコマンドで確認いただけます。
sacct -j ジョブID -o JobID,MaxVMSize,MaxRSS
注)他の利用者の情報は表示されません。
sacct
コマンドについて、以下に主なオプションを示します。
表 4.2.5
sacct
オプション
オプション
出力する項目をカンマ区切りで指定します。指定しない場合、
-o 'JobID,JobName,Partition,Account,AllocCPUS,State,ExitCode'
を指定した場合と同様の結果となります。
一部、FOCUS環境では取得できない項目もあります。
-o
オプションで指定できる項目を表示します。
ジョブ情報のみ表示し、ステップ毎の情報は表示しません。
-S, --starttime
指定の日時以降の情報を表示します。指定しない場合当日の0:00 が設定されます。
-E, --endtime
指定の日時以前の情報を表示します。
【
sacct
コマンド例1】
$ sacct -j xxxxxx -o User,JobID,Partition,NNodes,Submit,Start,End,Elapsed,State -X
User JobID Partition NNodes Submit Start End Elapsed
State
--------- ------------ ---------- -------- ------------------- ------------------- ------------------- ---------- ----------
uxxx000X xxxxxx c006m 1 2015-11-10T09:24:27 2015-11-10T09:24:31 2015-11-10T09:24:35 00:00:04 COMPLETED
<出力説明>
5.インターネット高速転送システムの使用方法
5.1.Skeed Silver Bullet の利用申請
5.2.専用クライアント(SkeedSilverBullet GUI)の使用方法
5.3.Webブラウザベースの使用方法
付録A.FOCUSスパコンシステム各種サーバ・ストレージ概要
付録B.コマンド比較表(SLURMとLSF)
付録C. プログラムとジョブ投入スクリプトのサンプル
最近の投稿
2023年度 AI/機械学習講習会(PC実習あり)基礎編
2023年6月22日
2023年度 AI/機械学習講習会(PC実習あり)入門編
2023年6月22日
[予定プログラム]AI/機械学習講習会(PC実習あり)基礎編
2023年6月22日
[予定プログラム]2023年度 AI/機械学習講習会(PC実習あり)入門編
2023年6月22日
2023年度 Ansys EnSight 活用講習会
2023年6月15日