GPUコンピューティング「Tesla」シリーズの性能とクリエイティブ系GPGPUの効果を探る

昨今は2D/3D問わずクリエイティブ系の作業でもGPGPUを活用するケースが多くなっている。大抵は「Quadro」や「Titan」、「Geforce GTX」の複数枚差しのマルチGPU構成で対応している。

しかし「計算させるだけであれば専用製品の方が良いのではないか」という事でGPGPU専用機であるNVIDAの「Tesla」の検討を行った際にメモした情報をまとめている

クリエイティブ系のアプリケーションのGPGPU活用

従来はCPUに頼っていた計算をGPUに肩代わりさせようという流れはクリエイティブ系のアプリケーションでも広まってきた。2D/3D問わず、多くのソフトで対応されている。CPUの数倍の速度で計算が完了するGPGPUは作業効率の向上に繋がる。

そして、GPUの計算速度は作業速度=コストに直結するので性能は高いに越したことはない。

「Quadro」、「Geforce GTX」、「Titan」シリーズ

一般的にはクリエイティブ目的のGPGPUにおいては「Quadro」「Titan」「Geforce」シリーズを利用しているケースが多いと思われる。必要とする性能が倍精度が単精度か、OpenGLかDirect Xか、長時間動作か短時間のピーク性能が必要か、予算は?・・等用途によって使い分ける。


Geforce:ゲーム用途、一般PC、開発、VR等

Titan:GeforceとQuadroの中間くらい

Quadro:開発、CAD、医療、ワークステーション

Tesla:サーバー、データセンター、ECCサポート

「Nvidia Tesla」シリーズはクリエイティブ用途の実用性はあるのか

プライマリのGPUはモニター出力やアプリケーションの動作チェックで利用するので、通常のグラフィックボードを用いるしかない。しかし、GPGPUの計算量を増量する目的でセカンダリ以降に配置するのであれば、専用機の「Tesla」シリーズという選択肢はないのだろうか。

というい事でTeslaシリーズの系譜と一般的なクリエイティブ系で用いられるOpenCL,CUDA性能に迫っていく

主なTeslaライナップと性能

Volta世代

Pascalの次世代。昨年自動車のAI用にVolotaアーキテクチャが採用されたと発表。Pascal世代の倍程度の性能らしい。

スペック:20TFOS 、HBM2 or 遅れるようならHBM3の可能性も?

製造プロセス:12nm or 10nm?

発表予想:2017年 5月のGTCで発表の模様。判明次第、随時追記。

発売開始予想:2017年末?

Pascal世代

最新のPascalアーキテクチャのGP100の「Tesla P100」ではHBM2を採用し、倍精度サポートが復活。ディープラーニングの需要を受けて半精度にも最適化。GP102の「Tesla P40」以下では倍精度はサポートされてない模様。GP104の「Tesla P4」は低消費電力で30万円前後。いずれもサーバー・組み込み機器向き

「GTX1080TI」はGP102「Tesla P40」のカット版。「Titan XP」はフルスペック版となっている

Maxwell世代

倍精度ユニットなし。単精度重視。いずれも組み込み機器向き。M4がGM206,M40がGM200で12GBに加えて24GBが存在する。M60がデュアルGPU構成。この世代でワークステーション向けのシリーズが消える。

Kepler世代

倍精度ではMaxwell世代を上回るため、用途によっては最近まで現役だった模様。Tesla K40,K8がワークステーション向き。K80がGK 201のデュアルGPU構成。Ferimi世代ほどではないが、未だクリエイティブ用途の営業アピールも見られていた。

Ferimi世代

m2070,2050が組込タイプ。C2070,2080がワークステーション用。当時の資料では3Dやクリエイティブ用途のアピールも盛んだった。以降数年でディープラーニング需要が高まり、そちらに舵を切っていった様だ。

備考・メモ

・各アーキテクチャの名前は著名な科学者から由来。

・2GPU構成のものはアプリ側もマルチGPU対応している必要がある

・Tesla製品マニュアル

NVIDIA Tesla - 製品概要と技術説明のダウンロード|NVIDIA

・GPUアクセラレーター対応アプリケーション

http://images.nvidia.com/content/pdf/tesla/nvidia-gpu-application-catalog.pdf

GPGPUベンチマーク性能比

各世代のTeslaとGeforceとのOpenGL、CudaによるGPGPUの性能比較。単機で見ると、本来の用途と外れるためか同世代の同GPUコアを搭載している機種でも性能が落ちる。世代間の性能差は大きい。恐らくPascal世代でもTesla P40=Titan XP >=GTX1080TI程度の結果に収まると思われる。

ベンチマーク結果を見る限り、今のところクリエイティブ系のGPGPUの計算速度アップを狙ってTeslaを積極的に選択する意味は薄そうだ。Kepler世代までは、3DソフトやAdboeのクリエイティブ系の活用もアピールされていたがMaxwell世代以降はメーカー側の宣伝・展開も息を潜めている。

Pascal世代も最低価格の「Tesla P4」でも30万円以上という価格なので、一般的なクリエイティブ系作業のGPGPU用途であれば「Titan XP」を2~4枚差した方が実用度は高いだろう。(ECC,倍精度が必要な場合はTeslaも意味がありそうだが)

Teslaシリーズはワークステーション用モデルが終息している事から、クリエイティブ用途での利用は想定から徐々に外れていったのかもしれない。

Teslaは業務用途から取り外された中古品が大量に流通している。Kepler世代の取引価格は未だ高価だが、Femir世代の「Tesla M2050」なら安価に手に入る様だ。オモチャとして試して見ようかなと思案中である。一応、普通のWindows10 PCで動くらしいが、組み込み用でファンが付いてないので、追加ファンは必須になりそうだ。

こいつ意外と動くぞ 「Geforce GT 1030」レビュー 低価格・低消費電力の最新GPU搭載グラフィックボード
こいつ意外と動くぞ 「Geforce GT 1030」レビュー 低価格・低消費電力の最新GPU搭載グラフィックボード
PascalアーキテクチャのNVIDIAのローエンドGPU「GEFORCE GT1030」が「GTX 1080」から約1年という時間...
補助電源なし 低消費電力 「Radeon RX 560」レビュー フルスペックPolaris11の省電力モデル
補助電源なし 低消費電力 「Radeon RX 560」レビュー フルスペックPolaris11の省電力モデル
殆どリネームかと思われたRX500シリーズ。しかし意外な所から伏兵が現れた。シェーダー数がフルスペックとなった「AMD Radeon...
魅惑のファンレスグラフィックボードの世界「Geforce GTX 1050Ti Kalm X」
魅惑のファンレスグラフィックボードの世界「Geforce GTX 1050Ti Kalm X」
完全ファンレスなのにゲーミング。そんな欲求に答えてくれるPalitの「GeForce GTX1050 Ti 4GB KalmX」は家...

シェアする

  • このエントリーをはてなブックマークに追加