GPUコンピューティング「Tesla」シリーズの性能とクリエイティブ系GPGPUの効果を探る

昨今は２D/３D問わずクリエイティブ系の作業でもGPGPUを活用するケースが多くなっている。大抵は「Quadro」や「Titan」、「Geforce GTX」の複数枚差しのマルチGPU構成で対応している。

しかし「計算させるだけであれば専用製品の方が良いのではないか」という事でGPGPU専用機であるNVIDAの「Tesla」の検討を行った際にメモした情報をまとめた。また、安価に流通している「Tesla m2050」を入手したのでテスト動作し、レビューしている。

1 クリエイティブ作業用途におけるTeslaシリーズ
2 歴代Teslaライナップの仕様一覧
3 GPGPUベンチマーク性能比較
4 「Tesla M2050」レビュー
5 Tesla M2050 外観特徴
6 取り付け方法
7 セットアップ
8 ベンチマーク
9 消費電力
10 Tesla m 2050レビューまとめ

クリエイティブ作業用途におけるTeslaシリーズ

「Quadro」、「Geforce GTX」、「Titan」シリーズ

一般的にはクリエイティブ目的のGPGPUにおいては「Quadro」「Titan」「Geforce」シリーズを利用しているケースが多いと思われる。必要とする性能が倍精度が単精度か、OpenGLかDirect Xか、長時間動作か短時間のピーク性能が必要か、予算は？・・等用途によって使い分ける。

Geforce：ゲーム用途、一般PC、開発、VR等

Titan:GeforceとQuadroの中間くらい

Quadro:開発、CAD、医療、ワークステーション

Tesla：サーバー、データセンター、ECCサポート

クリエイティブ系のアプリケーションのGPGPU活用

従来はCPUに頼っていた計算をGPUに肩代わりさせようという流れはクリエイティブ系のアプリケーションでも広まってきた。２D/3D問わず、多くのソフトで対応されている。CPUの数倍の速度で計算が完了するGPGPUは作業効率の向上に繋がる。

そして、GPUの計算速度は作業速度＝コストに直結するので性能は高いに越したことはない。

「Nvidia Tesla」シリーズはクリエイティブ用途の実用性はあるのか

プライマリのGPUはモニター出力やアプリケーションの動作チェックで利用するので、通常のグラフィックボードを用いるしかない。しかし、GPGPUの計算量を増量する目的でセカンダリ以降に配置するのであれば、専用機の「Tesla」シリーズという選択肢はないのだろうか。

というい事でTeslaシリーズの系譜と一般的なクリエイティブ系で用いられるOpenCL，CUDA性能に迫っていく

歴代Teslaライナップの仕様一覧

Volta世代

最新アークテクチャのVolta版。現時点ではTeslaはデータセンター用のV100のみリリースされており、コンシュマー用途の「Titan V」が発売されている。CUDAコア数はついに5000を超え、倍精度サポートも復活した。ゲーム用途のGeforce やTitanは未だ発表されておらず、「TitanV」のディープラーニング・開発向けといった趣である。

Pascal世代

最新のPascalアーキテクチャのGP100。GeforceではGTX1000シリーズが該当する。

「Tesla P100」ではHBM2を採用し、倍精度サポートが復活。ディープラーニングの需要を受けて半精度にも最適化。GP102の「Tesla P40」以下では倍精度はサポートされてない模様。GP104の「Tesla P4」は低消費電力で30万円前後。いずれもサーバー・組み込み機器向き

Maxwell世代

Geforceでは「GTX900」シリーズおよび「GTX750Ti」が該当するMaxwell。

倍精度ユニットなし。単精度重視。いずれも組み込み機器向き。M4がGM206，M40がGM200で12GBに加えて24GBが存在する。M60がデュアルGPU構成。この世代でワークステーション向けのシリーズが消える。

Kepler世代

GeforceではGTX700、GTX680シリーズが該当するKepler世代。

倍精度ではMaxwell世代を上回るため、用途によっては最近まで現役だった模様。Tesla K40，K8がワークステーション向き。K80がGK 201のデュアルGPU構成。Ferimi世代ほどではないが、未だクリエイティブ用途の営業アピールも見られていた。

Ferimi世代

GeforceではGTX400、GTX500シリーズが該当するFermi世代。

m2070,2050が組込タイプ。C2070，2080がワークステーション用。当時の資料では３Dやクリエイティブ用途のアピールも盛んだった。以降数年でディープラーニング需要が高まり、そちらに舵を切っていった様だ。

備考・メモ

・各アーキテクチャの名前は著名な科学者から由来。

・２GPU構成のものはアプリ側もマルチGPU対応している必要がある

・Tesla製品マニュアル

・GPUアクセラレーター対応アプリケーション

http://images.nvidia.com/content/pdf/tesla/nvidia-gpu-application-catalog.pdf

Amazonで「Tesla」を検索する。
楽天でPCパーツ「Telsa」を検索する。

GPGPUベンチマーク性能比較

各世代のTeslaとGeforceとのOpenGL、CudaによるGPGPUの性能比較。単機で見ると、本来の用途と外れるためか同世代の同GPUコアを搭載している機種でも性能が落ちる。世代間の性能差は大きい。恐らくPascal世代でもTesla P40=Titan XP ＞=GTX1080TI程度の結果に収まると思われる。

ベンチマーク結果を見る限り、今のところクリエイティブ系のGPGPUの計算速度アップを狙ってTeslaを積極的に選択する意味は薄そうだ。Kepler世代までは、3DソフトやAdboeのクリエイティブ系の活用もアピールされていたがMaxwell世代以降はメーカー側の宣伝・展開も息を潜めている。

Pascal世代も最低価格の「Tesla P4」でも30万円以上という価格なので、一般的なクリエイティブ系作業のGPGPU用途であれば「Titan XP」を2~４枚差すか「Titan V」を導入した方が、実用度は高いだろう。（ECC,倍精度が必要な場合はTeslaも意味がありそうだが）

Teslaシリーズはワークステーション用モデルが終息している事から、クリエイティブ用途での利用は想定から徐々に外れていったのかもしれない。

「Tesla M2050」レビュー

Teslaは業務用途から取り外された中古品が大量に流通している。Kepler世代の取引価格は未だ高価だが、Femir世代の「Tesla M2050」なら安価に手に入る。今回はTeslaがWindows上でどのようにセットアップでき、各種アプリケーションで用いれるのか検証を行うため入手してみた。

Fermi世代のコアGF100という事で、GTX480にスペックは近い。GF100からシェーダー数を削ったGTX480から更にシェーダー数は削減されており、コアクロックもかなり低い。代わりにメモリは倍の3GB搭載しており、6GB搭載したm2070も存在する。

Tesla m2050（Amazon）
Tesla m2050（楽天）

Tesla M2050 外観特徴

Tesla M2050はパッシブ仕様という事でGPUクーラーは備えていない。もちろんファンレス動作するわけではなく、別途システム全体で冷却する仕組みが必要となる。

＊C2050はCPUクーラーが内蔵されている。

爆熱Fermiがベースとだけあって。ヒートシンクも巨大で頼もしい。2スロットギリギリまで専有する分厚さとなっている。

補助電源は6ピン＋8ピン構成。補助電源が一般的なビデオボードと同様のピンが用いられており、普通のPC構成でも利用しやすくなっている。

後方とサイドの二箇所に分かれて配置されている。単体で利用する場合はどちらかに纏まっていた方が便利なのだが、複数・大量に配置する場合は、この方が便利なのだろうか。

分厚いヒートシンクと相まって結構な重量であり、バックプレートは保護板で補強されている。

取り付け方法

PCIブラケットを装着する

さてTesla m2050は一般のPCケースに組み込む事は余り想定されていない。PCIスロットに固定するにはPCIブラケットを別途装着する必要がある。今回は兄弟GPUとなるFermiのGTX480についているPCIブラケットを流用した。

固定するネジ穴は一般的なグラフィックボード同様の位置にあるため、普通にPCIブラケットがTesla m2050に装着する事ができた。

GPUクーラーを装着する

Tesma m2050はTDP238Wと結構な電力食いだ。爆熱で有名なFermiだけあって、GPUクーラーも相応のモノが必要になる。ヒートシンクに装着しても良いのだが、今回はよりお手軽にGPUクーラーをPCIスロットに増設できるVGAクーラー自作キットを利用した。

VGA自作キットとあわせて、12cmのケースファンを2個用意し、組み立てる事で以下のとおり、VGAクーラーが出来上がる。自分で組み立てるのが面倒な場合は既製品も存在する。

結果合計4スロット占有の超重量級GPUシステムとなった。爆熱のNVIDA黒歴史Fermiだ。けっして大げさではないだろう。

なお「m2050」はグラフィック出力機能を備えていないため、モニタにはCPU内蔵GPUのiGPUを用いて出力している。

セットアップ

セットアップは一般的なグラフィックボードと大差ない。NVIDIAから対応ドライバをダウンロードして実行するだけで無事完了した。

尚最新のTeslaドライバではm2050は正常にインストールできなかった。当時の旧バージョンを用いてインストールを行っている。

ドライバをインストールすると、CUDAに対応した各種アプリケーションから普通にTesla M2050がGPUで設定可能になっており、動作する事が確認できた。

ベンチマーク

というわけでドライバーさえインストール出来てしまえば、Teslaも一般的なグラフィックボードと同様にCUDAが利用できる事が分かった。Windowsから見た感じはグラフィックのモニタ出力のないGPUという感じだ。

8年前のFermi世代のGPUを最新GPUと比較するのは酷だが、せっかくなのでベンチマーク結果を見てみよう。

Compbench2.0

Tesla m2050でもCompBench2.0が正しく動作したのでベンチマークを取ってみた。「Tesla m2050」は「GTX480」からカットした性能どおりのスコアとなっており、最新GPUのローエンドGT1030と勝ったり負けたりと良い勝負を演じている。

一応CPU内蔵GPUであるintel HD530よりは高速に動作しており、かつてのハイエンドの意地は見せてくれた。とはいえ後述する消費電力を踏まえると極めてワットパフォーマンスは悪い。

GTX1060以上のGPUと比較した図が以下。テクノロジーの進化を感じる事ができる。倍精度や特殊な計算を伴わない限りは概ねGPU性能に比例したスコアとなっており、ここから最新Teslaのクリエイティブアプリケーションのおけるパフォーマンスも推測する事ができる。

V-rayベンチ

レンダリングでも昨今はCPUではなくGPUを用いた高速プレビューが流行っており、作業の効率化につながっている。TeslaでもCUDA対応アプリケーションであれば動作している。ｍ2050は３GBのビデオメモリを備えており要件を満たしている。

VrayベンチではTesla m2050はGTX750Tiを凌ぐ大健闘を見せている。最新ローエンドのGT1030の半分近い速度でレンダリングを完了させている。Kepler世代のミドルレンジ「GTX760」と比較しても遜色はない。

消費電力

さてここからは電力消費に着目して見てみよう。

システム全体の消費電力のリアルタイムログが以下。（左:アイドル　右:フルロード）

アイドル時のシステム全体の消費電力

最新のGPUはアイドル時のクロックは低く、消費電力は低い。旧世代となるTesla m2050はアイドル時でも70Wを越える推移を見せる。とはいえFermiの暴れ馬GTX480と比較するとマシに見える。

高負荷時のシステム全体の消費電力

高負荷時はGTX480からシェーダー数が削減され、GPUクロックも低いためか、想像以上に消費電力が低い。パッシブ仕様という事で複数のTesla m2050を装着運用する事から、１基あたりの消費電力はGTX480と比較すれば大人しい。

Tesla m 2050レビューまとめ

さて、Tesla m2050をテストで導入して動作させてみた。今回は性能目的というより、Windows上でどのようにTeslaが認識され、クリエイティブアプリケーションで正しくCUDAが認識するかの確認の趣が強い。

一応、OS上からは一般的なグラフィックボードと大差なく見える事から、Fermi以降のTeslaでも問題なく扱える可能性が高い事が分かった。しかし、Titan Vで高い倍精度が復活しており、あえてTeslaを選ぶ理由が個人ではECCサポート程度となっている。

ゲーム制作や３DCG制作の現場でTeslaを導入するケースは今のところ少なそうだ。

Amazonで「Tesla」を検索する。
楽天でPCパーツ「Telsa」を検索する。

https://androgamer.net/2017/04/22/post-4534/