ディープラーニングリグ作成方法

独自のディープラーニングマシンを作りたいが

ビルドプロセスを恐れている人のためのものです

 

ディープラーニングマシンを作成するように設定されていて

後で互換性がない高価なハードウェアを誤って買わないようにするために

ガイドとして役立ちます

 

 

CPU

 

最近のほとんどのディープラーニングモデルはGPU上で動作するため

CPUの使用は主にデータの前処理に使用されます

 

GB単位のデータを頻繁に処理していて

必要な洞察を得るために

多くのクエリを作成する必要がある分析部分に多大な労力を費やしている場合は

優れたCPUに投資することをお勧めします

 

そうでなければGPUがトレーニングをしている間

CPUはバッチスケジューリングや他の小さなプロセスにしか役立ちませんので

中レベルのものに投資しても何の問題もありません

 

AMDのthreadripperシリーズは非常に強力で

適正な価格で高性能を発揮します

 

ストレージ

3つの利用可能なオプションがあります

 

HDD(ハードディスクドライブ)

SSD(ソリッドステートドライブ)

NVME SSD(不揮発性メモリエクスプレス)

 

ハードディスクは書き込み及び読み出しビットで回転する磁気ディスクです

 

機械的で完全に電動化されているので

パフォーマンスは遅くより多くのスペースを取り

データの損傷や破損をより起こしやすいです

 

SSDは小さく速く可動部分がありません

 

SSDストレージの上にロードするとOSはバタースムーズになります

 

毎回GBのデータを扱うときファイル転送は非常に速い

 

SATA 3スロットはAHCIドライバーで600 Mbpsの最大転送を与えます

 

 

NVMe SSD

 

SATAバスを使用するのではなく

PCIeを使用するとパフォーマンスが大幅に向上します

 

使用される転送プロトコルはAHCIではなくNVMeであるため

非常に効率的な並列処理が可能です

 

データがRAMまたはGPU VRAMに常駐することを考えると

ストレージは問題になりません

 

性能比に対する価格を見てHDDよりSSDに投資する方が良いです

 

非常に高速だと思われるNVMe SSDは高価で

互換性のあるマザーボードも必要です

 

マザーボード

 
 

サイズはさまざまで必要性に従って

以下の数をチェックできます

 

RAM用のDIMMスロット

GPU用のPCIeスロット

NVMe SSD用のM2スロット

SSD用のSATAポート

必要に応じてThunderbolt 3 / USB 3.0 / 2.0

 

将来のアップグレードのために追加のスロットがあるのは良いことです

 

一般的に高いRAMにアップグレードし

将来的には複数のGPUを追加します

 

選択は人によって変わり

将来のアップグレードに十分なスロットがないマザーボードを使用することで

コストを削減します

 

PCIEスロットあたりのレーン数を気にしますが

GPUではまったく問題ありません

 

将来さらに多くのGPUを追加する予定の場合は

PCIEスロットが十分に大きいことを確認してください

 

NVIDIAがますます多くのコアを追加し続けるにつれて

最近のGPUがマルチファン構造を持つ事実を考えると

ほとんどのGPUは2つのPCIEスロットのスペースを取ります

 
 


冷却

クールに保つ必要がある2つの要素はCPUとGPUで

ファンにはさまざまなサイズがあります

 
 
最近最も一般的なのは120mmです

240/360 mmファン設定は

2/3 120 mmファンが隣り合って取り付けられていることを意味します

 

CPUの冷却

 

ミッドレベルからハイエンドレベルのCPUを目指しているのなら

CPUクーラーが必要になるでしょう

 

最近のCPUの冷却は問題なく

CPUファンを購入しても大きな問題にはなりません

 

 

 
 
2種類のCPUクーラー
ファンクーラー
オールインワン液体冷却

 

ファンと一緒に見ることができるように

液体冷却は管のまわりで水を循環させるポンプを備えています

 

マザーボードによっては

CPUファンとポンプ用に別々のコネクタが付いています

 

ファンポートでも使用でき従来のものでは

熱が銅管を使ってファンに伝えられます

 

つまりファンに使用されるコネクタは1つだけです

 

どちらも似たようなパフォーマンスを示しますが

それぞれ独自の浮き沈みがあります

 

GPU冷却

 
 
1つ目は野外で2番目は送風機スタイルの設定です

GPU冷却は作り付けであり

GPUと一緒に箱から出てくる構成は以下のとおりです

 

屋外クーラー

送風ファン

 
 

外気はあらゆる方向に空気を送り最大3つのファンを持っているので

単一のGPU PCに適しており

さらに優れたオーバークロック結果をもたらします

 

マルチGPUシステムでは問題になります

 

あるGPUから排出された空気は他のGPUによって消費され

温度が上昇します

 

システム全体が非常に高温になるまでループで続きます

 

したがってマルチGPU構成ではPCケースから熱を奪い

GPU内に新鮮な空気が入るため送風機のスタイルが優れています。

 
 
GPU上の液体冷却ハードウェア

液冷は存在しますが

GPUを開けて別のハードウェアに取り付ける必要があります

 

 

 

1台のGPUで問題ありませんがほとんどの場合

温度は80度を超えません

 

しかしマルチGPUシステムでは冷却が大きな問題になります

 

SLIブリッジまたはNVLinkが複数のGPUを一緒に接続するためにあるとしても

最適化はひどく影響を受けます

 

2つのGPUを接続すると理想的には2倍のパフォーマンスが得られますが

ほとんどの場合

1つのGPUを使用するよりも40%の追加バンプしか得られません

 

より多くの電力を引き出すだけでなく

より高い電気代をもたらすだけでなく暖房の問題が問題を悪化させます

 

 

オールインワン液冷

 
 

非常に高価なオールインワン液体冷却が存在します

 

部品はほとんどの国では簡単に入手できず

また購入しようとしているPCケースの互換性がわからない場合は

購入してセットアップするのが危険で漏れる可能性があります

 

そして取り替えは大きい問題である場合もあります

 

全体として余分な努力も

パフォーマンスや価格に見合う価値はありません

 

 
 
 
 

RAM

 
 

画像やログデータのような大規模なデータセットを扱う場合

データがRAMに完全に収まるので

処理時間を大幅に短縮することができます

 

CPUがL1またはL2にデータを受け取らなかった後に使用するメモリです

 

通常VRAMに収まらないデータセットの場合

転送はRAMとGPU VRAMの間で行われます

 

他のストレージソリューションと比較して非常に高速で

転送速度は約20 Gbpsです

 

マシンには十分な量のRAMがあるはずですが

実行する前処理がたくさんある場合は8〜16 GBで十分です

 

XMPまたはExtreme Memoryプロファイル設定では

RAMをより高速にオーバークロックすることができます

 

3000 MHzのクロック速度のRAMは

2400 MHzより少し速く動作しますが

それほど注目に値するほどの改善ではないので

コスト対パフォーマンスの比率の性能は本当に悪いです

 

一般的にあなたのRAM速度はシステムをボトルネックにしないので

17 Gbpsの転送速度を持つことは20 GbpsのものよりPCを遅くするでしょう

 

マザーボードと互換性のあるDDR4 RAMを取っていることを確認してください

 

ほとんどのマザーボード製造元は

サポートされているハードウェアのリストも提供しています

 

複数のRAMスティックを取り付ける場合は

異なるクロック速度と製造元を混在させないでください

 

まったく同じタイプのRAMを使用することをお勧めします

 

 
 
 
 
 
 

PSU

 
 

PSUを入手する際に気をつけることが2つあります

 

PSUの電源

PSUポート

 

システムの総電力使用量を調べる必要があります

 

小電力消費機用の高出力を持っていても大丈夫ですが

その逆はできません

 

PSUのほとんどは以下のとおりです

 

CPUスロット 明らかにCPU用

周辺機器スロット  GPUやその他のもの。

SATAスロット ストレージソリューション用

24ピンATXスロット マザーボードへの電源供給用

 

電源装置は必須でファンの数が少なくても通気はよくなりますが

システムにはクリーンで十分な電力を供給するようにしてください

 

PSUソケット用の変換プラグを絶対に付けないでください

 

アダプタはプラグと軽度の接触をしているため

大量の熱が発生します

 

アダプタの材料はほとんど安く

指定されたアンプの容量を持ってこれを超えると

ソケットが焼けてしまいます

 

インドの電源ソケットは5アンペアと15アンペアをサポートしているので

ディープラーニングリグでは

15アンペア容量のより大きなソケットに入れる必要があります

 

モニターとワイヤレスキーボード

 

マルチモニター設定はより生産的にするでしょう

 

最近のディスプレイの価格が安くなっていることを考えると

24インチまたは27インチの画面を持つLCDよりもLEDを選ぶのは簡単です

 

RGB照明と長いキー移動を伴う

メカニカルスイッチを備えたゲーム用は必要ありません

 

 

サポートしているディスプレイの数については

GPUの仕様を参照してください

 

複数のディスプレイをサポートするには

hdmi / VGAドングル用のディスプレイポートを購入する必要があります

 

GPU

 
 

ディープラーニングマシンリグの核心です

 

RTX 2080 Tiまたは

RTX 2070(これはNVLinkをサポートしていません)

 

スピードアップするために利用可能な16ビット精度オプションを持っています

 

新しいアーキテクチャではパフォーマンスが大幅に向上しています

 

CUDNNとCUDAのツールキットは

現在のディープラーニングライブラリ、Keras、Tensorflow、PyTorch

その他のライブラリとの互換性が高いので

NVIDIA GPUのみをディープラーニングに使用をお勧めします

 

 

OSのインストール

 

ディープラーニングソフトウェアは

Linuxベースのマシンと最初に互換性があります

 

 

 

最終的な考え

 

最後に確実に楽しむことが刺激的なプロセスで

過去に機械を製造したことがなくても大丈夫です

 

複雑なことは何もありません

 

なぜならどうやって実現するかを見るのが純粋な至福だからです