0. 概要

NVMe SSDローカルディスクにファイルシステムを作成する方法は、搭載するドライブ数が異なる BM.Optimized3.36BM.GPU4.8/BM.GPU.A100-v2.8 、及び、 BM.GPU.H100.8 でその手順が異なり、以降ではそれぞれの手順を解説します。

本テクニカルTipsが前提とするOSは、 Oracle Linux です。

なお 、ここで解説するファイルシステム作成手順は、 OCI HPCチュートリアル集 で紹介する構築手順に含まれるため、これらチュートリアルの手順に従ってHPCクラスタやGPUクラスタを構築する場合は、改めて実施する必要はありません。


1. BM.Optimized3.36用ファイルシステム作成手順

BM.Optimized3.36 は、3.84 TBのNVMe SSDローカルディスクを1ドライブ内蔵するため、以下の手順を該当するノードのopcユーザで実行し、ファイルシステムを作成・マウントします。

$ sudo parted -s /dev/nvme0n1 mklabel gpt
$ sudo parted -s /dev/nvme0n1 -- mkpart primary xfs 1 -1
$ sudo mkfs.xfs -L localscratch /dev/nvme0n1p1
$ sudo mkdir -p /mnt/localdisk
$ echo "LABEL=localscratch /mnt/localdisk/ xfs defaults,noatime 0 0" | sudo tee -a /etc/fstab
$ sudo mount /mnt/localdisk

作成後、以下のコマンドを該当するノードのopcユーザで実行し、作成したファイルシステムを確認します。

$ df -h /mnt/localdisk
Filesystem      Size  Used Avail Use% Mounted on
/dev/nvme0n1p1  3.5T   33M  3.5T   1% /mnt/localdisk
$

この手順は、NVMe SSDローカルディスク全領域を1パーティションで区画し、ラベル名 localscratch でXFSファイルシステムにフォーマットし、OS再起動時に自動的にマウントされる設定で /mnt/localdisk にマウントします。


2. BM.GPU4.8/BM.GPU.A100-v2.8用ファイルシステム作成手順

BM.GPU4.8/BM.GPU.A100-v2.8 は、6.4 TBのNVMe SSDローカルディスクを4ドライブ内蔵するため、以下の手順を該当するノードのopcユーザで実行し、ファイルシステムを作成・マウントします。

$ sudo vgcreate nvme /dev/nvme0n1 /dev/nvme1n1 /dev/nvme2n1 /dev/nvme3n1
$ sudo lvcreate -l 100%FREE nvme
$ sudo mkfs.xfs -L localscratch /dev/nvme/lvol0
$ sudo mkdir -p /mnt/localdisk
$ echo "LABEL=localscratch /mnt/localdisk/ xfs defaults,noatime 0 0" | sudo tee -a /etc/fstab
$ sudo mount /mnt/localdisk

作成後、以下のコマンドを該当するノードのopcユーザで実行し、作成したファイルシステムを確認します。

$ df -h /mnt/localdisk
Filesystem              Size  Used Avail Use% Mounted on
/dev/mapper/nvme-lvol0   25T   34M   25T   1% /mnt/localdisk
$

この手順は、4ドライブのNVMe SSDローカルディスクをまとめて1個の論理ボリュームとして作成し、ラベル名 localscratch でXFSファイルシステムにフォーマットし、OS再起動時に自動的にマウントされる設定で /mnt/localdisk にマウントします。


3. BM.GPU.H100.8用ファイルシステム作成手順

3-0. 概要

BM.GPU.H100.8 は、3.84 TBのNVMe SSDローカルディスクを16ドライブ内蔵するため、これらのディスクを以下2種類の構成でファイルシステムとする方法を解説します。

  • 全てのディスクをミラーリング・ストライピングせずにファイルシステムを作成(総容量64 TB)
  • ソフトウェアRAIDによるRAID10でファイルシステムを作成(総容量32 TB)

なお最初の方法は、16ドライブのうちの少なくとも1ドライブの故障で、ファイルシステム内の全てのファイルを消失します。

3-1. 全てのディスクをミラーリング・ストライピングせずにファイルシステムを作成

以下の手順を該当するノードのopcユーザで実行し、ファイルシステムを作成・マウントします。

$ sudo vgcreate nvme /dev/nvme0n1 /dev/nvme1n1 /dev/nvme2n1 /dev/nvme3n1 /dev/nvme4n1 /dev/nvme5n1 /dev/nvme6n1 /dev/nvme7n1 /dev/nvme8n1 /dev/nvme9n1 /dev/nvme10n1 /dev/nvme11n1 /dev/nvme12n1 /dev/nvme13n1 /dev/nvme14n1 /dev/nvme15n1
$ sudo lvcreate -l 100%FREE nvme
$ sudo mkfs.xfs -L localscratch /dev/nvme/lvol0
$ sudo mkdir -p /mnt/localdisk
$ echo "LABEL=localscratch /mnt/localdisk/ xfs defaults,noatime 0 0" | sudo tee -a /etc/fstab
$ sudo mount /mnt/localdisk

作成後、以下のコマンドを該当するノードのopcユーザで実行し、作成したファイルシステムを確認します。

$ df -h /mnt/localdisk
Filesystem              Size  Used Avail Use% Mounted on
/dev/mapper/nvme-lvol0   61T   34M   61T   1% /mnt/localdisk
$

この手順は、16ドライブのNVMe SSDローカルディスクをまとめて1個の論理ボリュームとして作成し、ラベル名 localscratch でXFSファイルシステムにフォーマットし、OS再起動時に自動的にマウントされる設定で /mnt/localdisk にマウントします。

3-2 ソフトウェアRAIDによるRAID10でファイルシステムを作成

以下の手順を該当するノードのopcユーザで実行し、ファイルシステムを作成・マウントします。

$ sudo mdadm --create /dev/md0 --raid-devices=16 --level=10 --chunk=8M --layout=f2 --assume-clean /dev/nvme0n1 /dev/nvme1n1 /dev/nvme2n1 /dev/nvme3n1 /dev/nvme4n1 /dev/nvme5n1 /dev/nvme6n1 /dev/nvme7n1 /dev/nvme8n1 /dev/nvme9n1 /dev/nvme10n1 /dev/nvme11n1 /dev/nvme12n1 /dev/nvme13n1 /dev/nvme14n1 /dev/nvme15n1
$ sudo pvcreate /dev/md0
$ sudo vgcreate nvme /dev/md0
$ sudo lvcreate -y -l 100%FREE -n nvme_raid nvme
$ sudo mkfs.xfs -L localscratch /dev/nvme/nvme_raid
$ sudo mkdir -p /mnt/localdisk
$ echo "LABEL=localscratch /mnt/localdisk/ xfs defaults,noatime 0 0" | sudo tee -a /etc/fstab
$ sudo mount /mnt/localdisk

作成後、以下のコマンドを該当するノードのopcユーザで実行し、作成したファイルシステムを確認します。

$ df -h /mnt/localdisk
Filesystem                  Size  Used Avail Use% Mounted on
/dev/mapper/nvme-nvme_raid   31T   34M   31T   1% /mnt/localdisk
$

この手順は、16ドライブのNVMe SSDローカルディスクをソフトウェアRAIDによるRAID10で1個の論理ボリュームとして作成し、ラベル名 localscratch でXFSファイルシステムにフォーマットし、OS再起動時に自動的にマウントされる設定で /mnt/localdisk にマウントします。

更新日時: