Revolusi AI: Nvidia Memperkenalkan GPU Blackwell, Tercepat dan Paling Canggih

GPU terbaru dan paling canggih dari Nvidia, yang dikenal dengan kode nama Blackwell, kini telah resmi diluncurkan. Diharapkan, GPU ini akan menjadi tonggak penting dalam rencana perusahaan untuk mengembangkan kecerdasan buatan (AI) tahun ini. Chip ini tidak hanya menawarkan peningkatan kinerja yang signifikan dari pendahulunya, termasuk GPU yang sangat diminati seperti H100 dan A100, tetapi juga telah menarik perhatian pelanggan dengan permintaan yang semakin tinggi untuk kinerja AI yang lebih unggul.

Ian Buck, Wakil Presiden HPC dan Hyperscale di Nvidia, menyatakan dalam sebuah konferensi pers bahwa GPU ini memiliki kemampuan untuk melatih model dengan parameter sebesar 1 triliun. Selain itu, sistem yang dilengkapi dengan hingga 576 unit GPU Blackwell dapat dipasangkan untuk melatih model-parameter dalam skala triliunan.

Dengan 208 miliar transistor, chip ini dibuat menggunakan proses teknologi 4-nanometer dari TSMC. Jumlah transistor yang jauh lebih besar dari pendahulunya, seperti GPU H100, memberikan petunjuk pertama terhadap potensi peningkatan kinerja yang signifikan.

Diketahui bahwa proses kecerdasan buatan (AI) memerlukan penggunaan memori yang sangat intensif, di mana data harus disimpan secara sementara di dalam RAM. Oleh karena itu, GPU Blackwell dilengkapi dengan memori HBM3E sebesar 192GB, yang sama dengan kapasitas memori GPU H200 tahun sebelumnya.

Nvidia juga telah menunjukkan fokusnya pada peningkatan jumlah GPU Blackwell untuk menangani tugas-tugas AI yang semakin besar. Ian Buck menyatakan bahwa langkah ini akan memperluas skala pusat data AI hingga melebihi 100.000 unit GPU.

Dalam hal kinerja, GPU Blackwell menawarkan “20 petaflop kinerja AI pada satu unit GPU,” demikian yang diungkapkan oleh Ian Buck. Meskipun data kinerja aktual belum tersedia, Nvidia kemungkinan menggunakan jenis data baru yang dikenal sebagai FP4 untuk mengukur kinerja dan mencapai angka 20 petaflop tersebut. Dalam perbandingan dengan pendahulunya, GPU H100 mampu menyediakan kinerja sebesar 4 teraflop untuk jenis data FP8 dan sekitar 2 petaflop untuk FP16.

CEO Nvidia, Jensen Huang, secara pribadi memperlihatkan chip Blackwell dalam acara GTC pada tanggal 18 Maret 2024. Dia menggarisbawahi bahwa jenis data FP4, yang digunakan untuk inferensi, akan memungkinkan komputasi yang lebih cepat dari paket data yang lebih kecil, meskipun dengan presisi yang lebih rendah. Jenis data FP64 dan FP32, di sisi lain, menyediakan komputasi yang lebih presisi tetapi tidak dirancang khusus untuk kecerdasan buatan.

GPU Blackwell sendiri terdiri dari dua die yang dikemas bersama. Keduanya berkomunikasi melalui antarmuka yang dikenal sebagai NV-HBI, yang mampu mentransfer informasi pada kecepatan 10 terabita per detik. Untuk mendukung memori HBM3E sebesar 192GB, GPU ini dilengkapi dengan bandwidth memori sebesar 8 TB per detik.

Nvidia tidak hanya merilis GPU terbaru, Blackwell, tetapi juga menghadirkan sistem-sistem canggih yang menggunakan GPU tersebut bersama dengan CPU Grace. Pertama, mereka memperkenalkan superchip GB200, yang menggabungkan dua GPU Blackwell dengan CPU Grace. Kedua, Nvidia meluncurkan sistem rak penuh yang diberi nama GB200 NVL72, dilengkapi dengan pendinginan cair, yang terdiri dari 36 superchip GB200 dan 72 GPU yang tersambung dalam format grid.

GB200 NVL72 mampu memberikan kinerja pelatihan sebesar 720 petaflop dan kinerja inferensi sebesar 1,4 exaflop. Sistem ini dapat menangani model-parameter hingga 27 triliun, dengan dukungan dari koneksi NVLink baru yang memiliki bandwidth mencapai 1,8TB/dtk.

Sistem GB200 NVL72 dijadwalkan akan tersedia tahun ini untuk penyedia cloud, termasuk Google Cloud, Oracle Cloud, Microsoft Azure, dan AWS. Selain itu, Nvidia tengah mengembangkan superkomputer AI bersama AWS yang disebut Project Ceiba, yang diproyeksikan mampu memberikan kinerja AI sebesar 400 exaflop. “Impian kami adalah membuat sistem Grace-Blackwell, mendukung 20.000 GPU, dan akan memberikan lebih dari 400 exaflop AI,” kata Ian Buck.

Perusahaan juga mengumumkan superkomputer AI lainnya, DGX SuperPOD, yang terdiri dari delapan sistem GB200—atau 576 GPU—mampu memberikan kinerja AI FP4 sebesar 11,5 exaflop. Koneksi NVLink memungkinkan sistem-sistem GB200 terhubung dengan kecepatan tinggi di jarak pendek. DGX SuperPOD juga dapat menghubungkan puluhan ribu GPU menggunakan jaringan Nvidia Quantum InfiniBand dengan bandwidth mencapai 1.800 gigabita per detik.

Selain itu, Nvidia memperkenalkan sistem DGX B200, yang menggunakan chip Intel Xeon Generasi ke-5 bernama Emerald Rapids. Sistem ini menggabungkan delapan GPU B200 dengan dua chip Emerald Rapids. DGX B200 dapat digunakan dalam sistem SuperPod berbasis x86 dan mampu memberikan kinerja AI hingga 144 petaflop dengan memori GPU sebesar 1,4TB dan bandwidth memori mencapai 64TB/dtk. Seluruh sistem DGX diharapkan akan tersedia pada akhir tahun ini.

Dengan peluncuran ini, Nvidia menegaskan posisinya sebagai pemimpin inovasi dalam teknologi kecerdasan buatan, menjanjikan kemajuan besar dalam pelatihan dan inferensi model AI yang akan mendukung berbagai aplikasi masa depan.

Kesimpulan

Nvidia telah mengumumkan peluncuran GPU Blackwell, produk terbaru dan paling canggih yang menjanjikan untuk menjadi tonggak penting dalam rencana pengembangan kecerdasan buatan (AI) tahun ini. Dengan kapasitas luar biasa untuk melatih model AI dengan parameter hingga triliunan dan dilengkapi dengan 208 miliar transistor serta teknologi memori HBM3E sebesar 192GB, Blackwell menetapkan standar baru dalam kinerja AI. Sistem yang inovatif seperti GB200 NVL72 dan proyek bersama dengan AWS, Project Ceiba, menunjukkan komitmen Nvidia untuk memimpin inovasi dalam AI, menawarkan kemampuan pelatihan dan inferensi yang belum pernah ada sebelumnya. Melalui kemajuan ini, Nvidia tidak hanya memperkuat posisinya di pasar tetapi juga memberikan kontribusi signifikan untuk kemajuan teknologi kecerdasan buatan di masa depan.

Glosarium

AI (Kecerdasan Buatan): Simulasi dari kecerdasan manusia dalam mesin yang dirancang untuk belajar dan menyelesaikan masalah.
Bandwidth Memori: Kecepatan maksimum data yang dapat ditransfer melalui memori dalam satuan waktu, diukur dalam TB/dtk (terabyte per detik).
CPU (Central Processing Unit): Unit pemrosesan utama dalam komputer yang menjalankan instruksi program.
DGX SuperPOD: Superkomputer AI dari Nvidia yang terdiri dari beberapa sistem GB200, menawarkan kinerja AI yang sangat tinggi.
FP4, FP8, FP16, FP32, FP64: Format presisi titik floating yang berbeda, dengan FP4 menawarkan presisi yang lebih rendah namun kecepatan yang lebih tinggi, sementara FP64 menawarkan presisi yang sangat tinggi.
GPU (Graphics Processing Unit): Perangkat keras yang dirancang untuk mempercepat pembuatan gambar dalam buffer frame untuk ditampilkan.
HBM3E: Generasi terbaru dari High Bandwidth Memory, menawarkan bandwidth lebih tinggi dan kapasitas lebih besar untuk GPU.
NV-HBI (Nvidia High Bandwidth Interconnect): Antarmuka koneksi antar die dalam GPU yang mendukung transfer data berkecepatan tinggi.
NVLink: Teknologi konektivitas buatan Nvidia yang memungkinkan komunikasi berkecepatan tinggi antar GPU atau antara GPU dan CPU.
Parameter: Dalam konteks AI, ini mengacu pada variabel dalam model yang dibentuk melalui proses pembelajaran.
Quantum InfiniBand: Jaringan komunikasi yang menyediakan transfer data berkecepatan tinggi dan latensi rendah antara komputer dalam jaringan.
TSMC (Taiwan Semiconductor Manufacturing Company): Perusahaan yang memproduksi semikonduktor dan merupakan salah satu pemasok utama untuk chip Nvidia.
Transistor: Komponen semikonduktor yang berfungsi sebagai saklar untuk mengontrol aliran listrik dalam sirkuit elektronik.