PRODUCT

NVIDIA L40S

Ada Lovelace Architecture
AI and Graphics

  • 48GB GDDR6 Memory
  • MPC 350W

NVIDIA L40S は、AI コンピューティングとグラフィックス、メディア高速化を組み合わせたハイエンド GPUです。生成 AI や LLM (大規模言語モデル) の推論、トレーニングから 3D グラフィックス、レンダリングやビデオまで次世代のマルチワークロードを高速化します。詳しくは担当営業までお気軽にお問い合わせください。

Ada Lovelace Architecture

Ada Lovelace アーキテクチャベース CUDAコア

単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。

第 3世代 RTコア

スループットとコンカレントレイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーションブラーを高速化し、驚異的なリアルタイムアニメーションを実現しています。

第4世代 Tensorコア

構造的なスパース性と最適化された TF32形式のハードウェア サポートによるパフォーマンス向上で、AIとデータサイエンスのモデルトレーニングが高速化します。AIで強化するグラフィックス機能を DLSSで加速させ、一部のアプリケーションで解像度を格段にアップさせます。

Transformer Engine

Transformer Engineは AIパフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。Ada Lovelaceの第 4世代 Tensorコアのパワーを利用する Transformer Engineは、Transformerアーキテクチャニューラルネットワークの層をインテリジェントにスキャンし、FP8と FP16の精度を自動的に再構築してより高速な AIパフォーマンスを実現し、トレーニングと推論を加速します。

効率性とセキュリティ

L40S GPUは、24時間 365日稼動するエンタープライズ データ センター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIAによって設計、構築、テスト、サポートされています。L40S GPUは最新のデータ センター標準を満たし、NEBS (Network Equipment-Building System) レベル 3に対応し、Root of Trust技術によるセキュアブートを備え、データセンターにさらなるセキュリティ層を提供します。

DLSS 3

L40S GPUは、NVIDIA DLSS 3により超高速のレンダリングと滑らかなフレームレートを可能にします。この画期的なフレーム生成技術は、Ada Lovelaceアーキテクチャと L40S GPUのディープラーニングと最新のハードウェアイノベーション (第 4世代 Tensorコアやオプティカルフローアクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。

マルチワークロードの高速化

生成 AI

新しいサービス、インサイト、オリジナル コンテンツを開発します。
次世代の AI、グラフィックス、メディアの高速化機能を備えた L40S は、前世代の NVIDIA A40 と比較して最大 5倍の推論性能と、NVIDIA HGX™ A100の 1.2倍の性能を実現します。‌画期的な性能と 48ギガバイト (GB) のメモリ容量を備え、マルチモーダルの生成 AIワークロードを高速化するのに理想的なプラットフォームです。

LLM のトレーニングと推論

AI のトレーニングと推論のワークロードを高速化します。
FP8をサポートする第 4世代 Tensorコアは、卓越した AIコンピューティングパフォーマンスを提供し、最先端の LLMと生成 AIモデルのトレーニングと推論を高速化します。

レンダリングと 3Dグラフィックス

NVIDIA RTX™ グラフィックスで忠実度の高いクリエイティブ ワークフローにパワーを与えます。
第 3世代 RTコアは、前世代の最大 2倍のリアルタイムレイトレーシングパフォーマンスを提供し、インタラクティブレンダリングからリアルタイムの仮想制作まで、驚異的なビジュアルコンテンツと忠実度の高いクリエイティブワークフローの制作にパワーを与えます。

NVIDIA Omniverse

メタバースアプリケーションの作成と運用をします。
NVIDIA Omniverse™は、次世代の産業デジタル化アプリケーションの接続、開発、運用を可能にします。パワフルな RTXグラフィックスと AI機能を備えた L40S は、Omniverseで構築された Universal Scene Description (OpenUSD)ベースの 3Dワークフローとシミュレーションワークフローに優れたパフォーマンスを提供します。

NVIDIA L40S データシート

NVIDIA L40S GPU Accelerator – Product Brief

L40S / A100 80GB SXM 仕様比較

L40S A100 80GB SXM
Best For Universal GPU for Gen AI Highest Perf Multi-Node AI
GPU Architecture NVIDIA Ada Lovelace NVIDIA Ampere
FP64 N/A 9.7 TFLOPS
FP32 91.6 TFLOPS 19.5 TFLOPS
RT Core 212 TFLOPS N/A
TF32 Tensor Core 366 TFLOPS

312 TFLOPS

FP16/BF16 Tensor Core 733 TFLOPS 624 TFLOPS
FP8 Tensor Core 1466 TFLOPS N/A
INT8 Tensor Core 1466 TOPS 1248 TFLOPS
GPU Memory 48 GB GDDR6 80 GB HBM2e
GPU Memory Bandwidth 864 GB/s 2039 GB/s
L2 Cache 96 MB 40 MB
Media Engines 3 NVENC(+AV1)
3 NVDEC
4 NVJPEG
0 NVENC
5 NVDEC
5 NVJPEG
Power Up to 350 W Up to 400 W
Form Factor 2-slot FHFL 8-way HGX
Interconnect PCle Gen4 x16 PCle Gen4 x16

弊社では、科学技術計算や解析などの各種アプリケーションについて動作検証を行い、
すべてのセットアップをおこなっております。
お客様が必要とされる環境にあわせた最適なシステム構成をご提案いたします。