0. 概要
NVMe SSDローカルディスクにファイルシステムを作成する方法は、搭載するドライブ数が異なる BM.Optimized3.36 、 BM.GPU4.8/BM.GPU.A100-v2.8 、及び、 BM.GPU.H100.8 でその手順が異なり、以降ではそれぞれの手順を解説します。
本テクニカルTipsが前提とするOSは、 Oracle Linux です。
なお 、ここで解説するファイルシステム作成手順は、 OCI HPCチュートリアル集 で紹介する構築手順に含まれるため、これらチュートリアルの手順に従ってHPCクラスタやGPUクラスタを構築する場合は、改めて実施する必要はありません。
1. BM.Optimized3.36用ファイルシステム作成手順
BM.Optimized3.36 は、3.84 TBのNVMe SSDローカルディスクを1ドライブ内蔵するため、以下の手順を該当するノードのopcユーザで実行し、ファイルシステムを作成・マウントします。
$ sudo parted -s /dev/nvme0n1 mklabel gpt
$ sudo parted -s /dev/nvme0n1 -- mkpart primary xfs 1 -1
$ sudo mkfs.xfs -L localscratch /dev/nvme0n1p1
$ sudo mkdir -p /mnt/localdisk
$ echo "LABEL=localscratch /mnt/localdisk/ xfs defaults,noatime 0 0" | sudo tee -a /etc/fstab
$ sudo mount /mnt/localdisk
作成後、以下のコマンドを該当するノードのopcユーザで実行し、作成したファイルシステムを確認します。
$ df -h /mnt/localdisk
Filesystem Size Used Avail Use% Mounted on
/dev/nvme0n1p1 3.5T 33M 3.5T 1% /mnt/localdisk
$
この手順は、NVMe SSDローカルディスク全領域を1パーティションで区画し、ラベル名 localscratch でXFSファイルシステムにフォーマットし、OS再起動時に自動的にマウントされる設定で /mnt/localdisk にマウントします。
2. BM.GPU4.8/BM.GPU.A100-v2.8用ファイルシステム作成手順
BM.GPU4.8/BM.GPU.A100-v2.8 は、6.4 TBのNVMe SSDローカルディスクを4ドライブ内蔵するため、以下の手順を該当するノードのopcユーザで実行し、ファイルシステムを作成・マウントします。
$ sudo vgcreate nvme /dev/nvme0n1 /dev/nvme1n1 /dev/nvme2n1 /dev/nvme3n1
$ sudo lvcreate -l 100%FREE nvme
$ sudo mkfs.xfs -L localscratch /dev/nvme/lvol0
$ sudo mkdir -p /mnt/localdisk
$ echo "LABEL=localscratch /mnt/localdisk/ xfs defaults,noatime 0 0" | sudo tee -a /etc/fstab
$ sudo mount /mnt/localdisk
作成後、以下のコマンドを該当するノードのopcユーザで実行し、作成したファイルシステムを確認します。
$ df -h /mnt/localdisk
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/nvme-lvol0 25T 34M 25T 1% /mnt/localdisk
$
この手順は、4ドライブのNVMe SSDローカルディスクをまとめて1個の論理ボリュームとして作成し、ラベル名 localscratch でXFSファイルシステムにフォーマットし、OS再起動時に自動的にマウントされる設定で /mnt/localdisk にマウントします。
3. BM.GPU.H100.8用ファイルシステム作成手順
3-0. 概要
BM.GPU.H100.8 は、3.84 TBのNVMe SSDローカルディスクを16ドライブ内蔵するため、これらのディスクを以下2種類の構成でファイルシステムとする方法を解説します。
- 全てのディスクをミラーリング・ストライピングせずにファイルシステムを作成(総容量64 TB)
- ソフトウェアRAIDによるRAID10でファイルシステムを作成(総容量32 TB)
なお最初の方法は、16ドライブのうちの少なくとも1ドライブの故障で、ファイルシステム内の全てのファイルを消失します。
3-1. 全てのディスクをミラーリング・ストライピングせずにファイルシステムを作成
以下の手順を該当するノードのopcユーザで実行し、ファイルシステムを作成・マウントします。
$ sudo vgcreate nvme /dev/nvme0n1 /dev/nvme1n1 /dev/nvme2n1 /dev/nvme3n1 /dev/nvme4n1 /dev/nvme5n1 /dev/nvme6n1 /dev/nvme7n1 /dev/nvme8n1 /dev/nvme9n1 /dev/nvme10n1 /dev/nvme11n1 /dev/nvme12n1 /dev/nvme13n1 /dev/nvme14n1 /dev/nvme15n1
$ sudo lvcreate -l 100%FREE nvme
$ sudo mkfs.xfs -L localscratch /dev/nvme/lvol0
$ sudo mkdir -p /mnt/localdisk
$ echo "LABEL=localscratch /mnt/localdisk/ xfs defaults,noatime 0 0" | sudo tee -a /etc/fstab
$ sudo mount /mnt/localdisk
作成後、以下のコマンドを該当するノードのopcユーザで実行し、作成したファイルシステムを確認します。
$ df -h /mnt/localdisk
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/nvme-lvol0 61T 34M 61T 1% /mnt/localdisk
$
この手順は、16ドライブのNVMe SSDローカルディスクをまとめて1個の論理ボリュームとして作成し、ラベル名 localscratch でXFSファイルシステムにフォーマットし、OS再起動時に自動的にマウントされる設定で /mnt/localdisk にマウントします。
3-2 ソフトウェアRAIDによるRAID10でファイルシステムを作成
以下の手順を該当するノードのopcユーザで実行し、ファイルシステムを作成・マウントします。
$ sudo mdadm --create /dev/md0 --raid-devices=16 --level=10 --chunk=8M --layout=f2 --assume-clean /dev/nvme0n1 /dev/nvme1n1 /dev/nvme2n1 /dev/nvme3n1 /dev/nvme4n1 /dev/nvme5n1 /dev/nvme6n1 /dev/nvme7n1 /dev/nvme8n1 /dev/nvme9n1 /dev/nvme10n1 /dev/nvme11n1 /dev/nvme12n1 /dev/nvme13n1 /dev/nvme14n1 /dev/nvme15n1
$ sudo pvcreate /dev/md0
$ sudo vgcreate nvme /dev/md0
$ sudo lvcreate -y -l 100%FREE -n nvme_raid nvme
$ sudo mkfs.xfs -L localscratch /dev/nvme/nvme_raid
$ sudo mkdir -p /mnt/localdisk
$ echo "LABEL=localscratch /mnt/localdisk/ xfs defaults,noatime 0 0" | sudo tee -a /etc/fstab
$ sudo mount /mnt/localdisk
作成後、以下のコマンドを該当するノードのopcユーザで実行し、作成したファイルシステムを確認します。
$ df -h /mnt/localdisk
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/nvme-nvme_raid 31T 34M 31T 1% /mnt/localdisk
$
この手順は、16ドライブのNVMe SSDローカルディスクをソフトウェアRAIDによるRAID10で1個の論理ボリュームとして作成し、ラベル名 localscratch でXFSファイルシステムにフォーマットし、OS再起動時に自動的にマウントされる設定で /mnt/localdisk にマウントします。