添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
相关文章推荐
儒雅的遥控器  ·  Sana Sunomiya | ...·  5 月前    · 
豪爽的饭盒  ·  Télécharger Photoshop ...·  1 年前    · 
听话的核桃  ·  Meet my partner... - ...·  1 年前    · 
4.2.3.  ジョブのキャンセルコマンド(scancel)
4.2.4.  ジョブステータス情報表示コマンド(sstat)
4.2.5.  実行ジョブ情報表示コマンド(sacct)

▲このページの先頭へ

4.2.ジョブの実行方法(SLURMコマンド編)

ジョブを実行するには、フロントエンドサーバからコマンドを実行します。
ジョブ管理のためのコマンドは次のとおりです。

表4.2 ジョブ管理コマンド一覧(SLURMコマンド編)

コマンド用途 sinfo -s キュー(パーティション)の情報を表示する 4.1.2.キュー情報の確認方法 squeues キューのノード実行状況を表示する freenodes 空ノード数を表示する 4.1.3. 利用可能なノード数の確認方法 sbatch ジョブを投入する 4.2.1.ジョブ投入コマンド(sbatch) squeue ジョブの状態を表示する 4.2.2.ジョブ情報表示コマンド(squeue) scancel ジョブをキャンセルする 4.2.3.ジョブのキャンセルマンド(scancel)

▲このページの先頭へ

4.2.1.ジョブ投入コマンド(sbatch)

ジョブを実行するために、ジョブ投入スクリプトを事前に作成します。 sbatch コマンドにジョブ投入スクリプトを指定することで、ジョブがキューイングされ実行されます。
sbatch コマンドの書式】

sbatch ジョブ投入スクリプト

注) bsub と異なり、リダイレクトではなく、引数でジョブ投入スクリプトを渡します。

sbatch コマンドの例(スクリプトファイルが run.sh の場合)】

$ sbatch run.sh

ジョブ投入コマンド( sbatch )について、以下に主なオプションを示します。
表 4.2.1 sbatch オプション

オプション sbatch -o ./out_%j.log (※) out_ジョブIDという名前のファイルに標準出力を出力します。 -e オプションが指定されていない場合は、標準エラー出力もこのファイルに出力されます。 sbatch -e ./err_%j.log (※) err_ジョブIDという名前のファイルに標準エラー出力を出力します。
※シンボル「 %j 」はジョブIDに置換されます。

▲このページの先頭へ

4.2.2.ジョブ情報表示コマンド(squeue)

ジョブの各種情報を表示するときは、 squeue コマンドを実行します。

squeue

注)他の利用者の情報は表示されません。

squeue コマンド例】

$ squeue
JOBID PARTITION NAME     USER     ST  TIME  NODES NODELIST(REASON)
xxxx d024h     testrun  u***0001  R  4:58     60 d[007-066]
xxxx c006m     testrun  u***0001 CG  0:39      1 c001

<出力説明>

NODELIST(REASON) ジョブが実行されるホスト名のリスト (ジョブ状態に対する理由があれば表示されます)
ジョブ状態がPD(PENDING)の場合のREASONを下記に示します。
(Resources) リソースが利用可能になるのを待っています。
(Priority) パーティション内の優先度の高いジョブが完了するのを待っています。
(Dependency) このジョブが依存する他のジョブが完了するのを待っています。
(InvalidQOS) Resources と同義です。

表 4.2.2 ジョブ状態( squeue コマンド-STフィールド)

▲このページの先頭へ

4.2.3.ジョブのキャンセルマンド(scancel)

ジョブをキャンセルするにはscancelコマンドを用います。 squeue コマンドなどで確認したジョブIDを指定します。 scancel の後に、ジョブIDをスペース区切りで指定すると、複数のジョブを一度にキャンセルすることができます。

scancel ジョブID ジョブID ジョブID

▲このページの先頭へ

4.2.4.ジョブステータス情報表示コマンド(sstat)

ジョブの各種情報(メモリ使用量やディスクI/O量など)を表示するときは、 sstat コマンドを実行します。ジョブを実行中に実行する必要があります。

sstat –j ジョブID[.ステップID] [-o 項目[,項目]]

注)他の利用者の情報は表示されません。

ジョブが使用中のメモリ量につきましては、下記のコマンドで確認いただけます。

sstat –j ジョブID[.ステップID] -o JobID,MaxVMSize,MaxRSS

注)他の利用者の情報は表示されません。

  • ステップID は squeue -s コマンドで確認することができます。
  • ステップID は省略可能ですが、逐次処理の場合はステップID として「 batch 」を指定します。
  • 仮想メモリサイズは MaxVMSize 、物理メモリ消費サイズは MaxRSS を指定します。
  • ジョブステータス情報表示コマンド( sstat )について、以下に主なオプションを示します。

    表 4.2.4 sstatオプション

    オプション -j ジョブID[.ステップID] ジョブIDを指定します。必須のオプションです。ステップIDは省略可能です。
    ステップIDは squeue -s コマンドで確認することができます。
    ※逐次処理の場合はステップIDとして「 batch 」を指定します。 –o 項目[,項目]... 出力する項目をカンマ区切りで指定します。指定しない場合、全ての項目が表示されます。
    一部、FOCUS環境では取得できない項目もあります。
    出力項目例
    JobID             ジョブに割り当てられたジョブIDが表示されます。
    MaxVMSize   ジョブの全てのタスクでの仮想メモリサイズの最大値です。
    MaxRSS        ジョブの全てのタスクでの物理メモリ消費サイズの最大値です。

    sstat コマンド例1】

    $ sstat -j 45643 -o JobID,MaxVMSize,MaxRSS,MaxPages,MaxDiskRead,MaxDiskWrite
    JobID  MaxVMSize     MaxRSS MaxPages  MaxDiskRead MaxDiskWrite
    ------------ ---------- ---------- -------- ------------ ------------
    45643.0        1332496K     39276K     293K           1M        0.29M

    sstat コマンド例2】

    $ sstat -j 45638.0
    JobID  MaxVMSize  MaxVMSizeNode  MaxVMSizeTask  AveVMSize     MaxRSS MaxRSSNode MaxRSSTask     AveRSS MaxPages MaxPagesNode   MaxPagesTask   AvePages     MinCPU MinCPUNode MinCPUTask     AveCPU   NTasks AveCPUFreq ReqCPUFreq ConsumedEnergy  MaxDiskRead MaxDiskReadNode MaxDiskReadTask  AveDiskRead MaxDiskWrite MaxDiskWriteNode MaxDiskWriteTask AveDiskWrite
    ------------ ---------- -------------- -------------- ---------- ---------- ---------- ---------- ---------- -------- ------------ -------------- ---------- ---------- ---------- ---------- ---------- -------- ---------- ---------- -------------- ------------ --------------- --------------- ------------ ------------ ---------------- ---------------- ------------
    45638.0        1579688K           g002              1    912640K     38696K       g002          1     26118K     279K         g002              1       214K  00:00.000       g001          0  00:00.000        2      2.50G                         0        0.96M            g002               1        0.68M        0.02M             g002                1        0.02M

    <出力説明>

    4.2.5.実行ジョブ情報表示コマンド(sacct)

    実行が完了したジョブの情報を表示するには sacct コマンドを用います。

    sacct -j ジョブID -o 項目[,項目,...] –X

    注)他の利用者の情報は表示されません。

    実行が完了したジョブのメモリ量につきましては、下記のコマンドで確認いただけます。

    sacct -j ジョブID -o JobID,MaxVMSize,MaxRSS

    注)他の利用者の情報は表示されません。

    sacct コマンドについて、以下に主なオプションを示します。

    表 4.2.5 sacct オプション

    オプション 出力する項目をカンマ区切りで指定します。指定しない場合、
    -o 'JobID,JobName,Partition,Account,AllocCPUS,State,ExitCode'
    を指定した場合と同様の結果となります。
    一部、FOCUS環境では取得できない項目もあります。 -o オプションで指定できる項目を表示します。 ジョブ情報のみ表示し、ステップ毎の情報は表示しません。 -S, --starttime 指定の日時以降の情報を表示します。指定しない場合当日の0:00 が設定されます。 -E, --endtime 指定の日時以前の情報を表示します。 sacct コマンド例1】
    $ sacct -j xxxxxx -o User,JobID,Partition,NNodes,Submit,Start,End,Elapsed,State -X
    User JobID Partition NNodes Submit Start End Elapsed
    State
    --------- ------------ ---------- -------- ------------------- ------------------- ------------------- ---------- ----------
    uxxx000X xxxxxx c006m 1 2015-11-10T09:24:27 2015-11-10T09:24:31 2015-11-10T09:24:35 00:00:04 COMPLETED

    <出力説明>

  • 5.インターネット高速転送システムの使用方法
  • 5.1.Skeed Silver Bullet の利用申請
  • 5.2.専用クライアント(SkeedSilverBullet GUI)の使用方法
  • 5.3.Webブラウザベースの使用方法
  • 付録A.FOCUSスパコンシステム各種サーバ・ストレージ概要
  • 付録B.コマンド比較表(SLURMとLSF)
  • 付録C. プログラムとジョブ投入スクリプトのサンプル
  • 最近の投稿

    2023年度 AI/機械学習講習会(PC実習あり)基礎編 2023年度 AI/機械学習講習会(PC実習あり)入門編 [予定プログラム]AI/機械学習講習会(PC実習あり)基礎編 [予定プログラム]2023年度 AI/機械学習講習会(PC実習あり)入門編 2023年度 Ansys EnSight 活用講習会