zurück zum Artikel

Übernächste Nvidia-GPU-Generation "Pascal" mit schnellem Interconnect

| Christof Windeck

Kurz nachdem die ersten Maxwell-Grafikchips auf den Markt gekommen sind, kündigt Nvidia Details der 2016 erwarteten Pascal-Generation an, etwa NVlink und Stapel-DRAM.

Nvidia

Pascal-Modul mit Speicher-Stacks, präsentiert von Nvidia-Chef Jen-Hsun Huang.

(Bild: Nvidia)

Nvidia sucht neue Märkte für die hauseigene GPU-Technik und setzt auf immer höhere und flexibler nutzbare Rechenleistung – also GPGPU-Computing. Erfolgreich sind die Tesla-Rechenbeschleuniger [1] in Supercomputern [2], viele technische GPU-Neuerungen zielen deshalb weniger auf bessere 3D-Performance für Spiele, sondern auf noch schnellere Parallelverarbeitung von Daten.

In diese Kategorie fallen auch zwei Neuerungen der 2016 erwarteten GPU-Generation Pascal: Der schnelle Interconnect NVlink und Stacked Memory, also SDRAM-Chip-Stapel mit extrem hoher Datentransferleistung. Diese beiden Neuerungen kündigte Nvidia-Chef Jen-Hsun Huang auf der hauseigenen GTC [3] an.

Beim Stapel-RAM setzt Nvidia anscheinend nicht auf den Hybrid Memory Cube [4] (HMC), den ein Industriekonsortium um Micron spezifiziert – mit Datentransferraten von bis zu 480 GByte/s pro HMC-2.0-Stack. Zum Vergleich: Eine GeForce Titan Black [5] kann über ihre 384 Datensignalleitungen auf 12 GDDR5-SDRAMs gleichzeitig zugreifen, die zusammen bis zu 336 GByte pro Sekunde liefern. Der vierkanalige DDR3-1866-Hauptspeicher (PC3-14900 [6]) aktueller Xeon-E5-Plattformen liefert höchstens etwa 60 GByte/s, PCIe 3.0 x16 [7] schafft 16 GByte/s (1 GByte/s pro Lane und Richtung).

Nvidia

NVlink kommt als schneller Interconnect zwischen GPUs zusätzlich zu PCIe zum Einsatz.

(Bild: Nvidia)

Den PCIe-Engpass soll NVlink auf bis zu 80 GByte/s weiten – das ist deutlich mehr, als etwa Intels QuickPath-Interconnect [8] (QPI) schafft. Allerdings verrät Nvidia nicht genau, ob es sich um die aggregierte Datentransferrate in beide Richtungen gleichzeitig handelt – dann würde PCIe 3.0 x16 ja auf 32 GByte/s kommen – oder um die Datentransferrate pro Richtung. Mit PCIe 4.0 [9] sind jedenfalls 2 GByte/s pro Lane und Richtung geplant.

Mit GeForce GTX 750 und GTX 750 Ti [10] hat Nvidia im Februar die ersten Maxwell-GPUs vorgestellt. Die aktuelle GeForce Titan Black und das ebenfalls auf der GTC vorgestellte neue Flaggschiff GeForce Titan Z verwenden noch Kepler-Technik [11]. Im vergangenen Jahr auf der GTC2013 hatte Nvidia Pascal noch nicht erwähnt, sondern den Maxwell-Nachfolger Volta [12]: ebenfalls mit Stacked-DRAM, aber ohne konkreten Termin. Anscheinend sind Volta-GPUs weiterhin geplant, sie sollen zwischen Maxwell- und Pascal-Typen erscheinen.

Zunächst bleiben viele Fragen offen, etwa ob Volta und Pascal außer aufgestapelten SDRAM-Dice [13] alternativ oder gleichzeitig auch zusätzliche Speicherchips auf der Grafikkarte ansteuern können. Bisher ist der Grafikkarten-Markt bekanntlich von vielen Varianten geprägt, die sich gerade bei der Speicherbestückung unterscheiden, also in der Kapazität, den Chip-Typen (DDR3 oder GDDR5) und der RAM-Frequenz. Wenn Nvidia künftig den GPU-DRAM-Stapel aus einer Hand liefert, müssen sich die bisherigen Grafikkarten-Hersteller neu aufstellen. Aber vielleicht geht es bei Stacked DRAM zunächst nur um High-End-, Profi- oder Tesla-Versionen. (ciw [14])


URL dieses Artikels:
https://www.heise.de/-2154878

Links in diesem Artikel:
[1] https://www.heise.de/news/Nachbrenner-fuer-Supercomputer-Nvidia-stellt-Tesla-K40-vor-2048493.html
[2] https://www.heise.de/news/Top500-der-Supercomputer-Schweizer-Supercomputer-als-Europas-Spitzenreiter-unter-den-Top10-2048325.html
[3] https://www.heise.de/news/Big-Data-Analysen-mit-GPU-Beschleunigung-2154336.html
[4] https://www.heise.de/news/Stapel-Speicher-Hybrid-Memory-Cube-schafft-320-GByte-pro-Sekunde-1834540.html
[5] https://www.heise.de/news/Nvidias-neuer-Grafikkarten-Koenig-GeForce-GTX-Titan-Black-2116958.html
[6] http://heise.de/-2072413
[7] https://www.heise.de/news/Server-Vernetzung-per-PCI-Express-1909316.html
[8] https://www.heise.de/news/IDF-Details-zu-QuickPath-Interconnect-196062.html
[9] https://www.heise.de/news/PCI-Express-4-0-kommt-langsam-voran-1387566.html
[10] https://www.heise.de/news/Nvidia-Maxwell-GeForce-GTX-750-und-750-Ti-hoechst-effizient-2116645.html
[11] https://www.heise.de/news/GeForce-GTX-680-3D-Performance-vier-Monitore-und-bessere-Kantenglaettung-1473840.html
[12] https://www.heise.de/news/GTC-2013-Nvidia-kuendigt-Next-Gen-GPU-Volta-mit-Stacked-DRAM-an-1826130.html
[13] http://www.heise.de/glossar/entry/Die-398061.html
[14] mailto:ciw@ct.de