Nvidia kini menawarkan opsi sewa superkomputer AI ciptaannya yang dilengkapi dengan GPU teranyar di cloud untuk mereka yang ingin mengakses paket hardware dan software-nya.
Servis DGX Cloud ini dilengkapi dengan hardware AI berkinerja tinggi, termasuk GPU H100 dan A100 yang saat ini cukup langka di pasaran. Pengguna dapat menyewa sistem ini baik melalui infrastruktur cloud milik Nvidia atau melalui cloud service milik Oracle.
“DGX Cloud dapat diakses hampir di seluruh dunia kecuali di wilayah yang terkena dampak kontrol ekspor AS,” kata Tony Paikeday, direktur senior di DGX Platforms, Nvidia.
Cloud ini hadir dalam infrastruktur Nvidia, yang mencakup sistem DGX yang berada di AS dan UK. DGX Cloud juga dapat diakses melalui Oracle Cloud.
Setelah pertama kali diperkenalkan di konferensi GTC pada bulan Maret, Nvidia kembali mengumumkan ketersediaan luas dari servis DGX Cloud ini. Pengumuman ini datang setelah berbagai berita penting lainnya mengenai AI di cloud pekan lalu.
Perusahaan saingan, Cerebras Systems, kini memasang sistem AI mereka di cloud service yang dijalankan oleh provider asal Timur Tengah, G42, yang menjanjikan performa hingga 36 exaflops. Sementara itu, Tesla baru saja memulai produksi superkomputer Dojo mereka yang berbasis chip D1 buatan sendiri, dengan target performa mencapai 100 exaflops pada akhir tahun depan.
Elon Musk, CEO Tesla, baru-baru ini mengungkapkan kekurangan GPU Nvidia untuk hardware AI mereka, dan Tesla pun sedang menunggu pasokan. Meski demikian, pengguna dapat mengamankan akses ke hardware dan software Nvidia melalui DGX Cloud, namun dengan tarif yang cukup mahal.
Sewa DGX Cloud menawarkan akses ke komputer cloud Nvidia yang dilengkapi dengan GPU H100 atau A100 dan memiliki memori GPU sebesar 640GB. Visi Nvidia adalah menjalankan infrastrukturnya seperti sebuah pabrik: data dimasukkan sebagai input, dan outputnya adalah informasi berharga yang dapat digunakan oleh perusahaan.
Dalam hal harga, DGX Cloud dibanderol dengan tarif mulai dari $36,999 per instance selama sebulan.
Itu hampir dua kali lipat dari harga yang ditawarkan oleh Microsoft Azure dengan instance ND96asr-nya yang dilengkapi delapan GPU Nvidia A100, 96 CPU cores, dan RAM sebesar 900GB, yang dibanderol dengan harga $19,854 per bulan.
Semua provider cloud utama memiliki GPU Nvidia H100 dan A100, namun tentu saja berbeda dengan apa yang ditawarkan oleh DGX Cloud.
Sebagai catatan, Google beberapa waktu lalu mengumumkan superkomputer A3 mereka yang dilengkapi dengan 26,000 GPU Nvidia H100 Hopper.
“Kami optimis DGX Cloud akan menarik lebih banyak pelanggan AI generatif ke cloud partner kami,” tambah Paikeday.
Sebagai langkah strategis, Nvidia berupaya untuk mengikat pelanggan agar menggunakan teknologi hardware dan software AI eksklusif mereka. Meskipun mungkin memerlukan investasi awal yang besar, Nvidia meyakini bahwa investasi di AI akan memberikan penghematan operasional jangka panjang bagi perusahaan.
Walaupun komunitas AI saat ini lebih cenderung mendukung model open-source dan beroposisi terhadap model eksklusif, Nvidia tetap memiliki dominasi di pasar hardware AI. Minat yang tinggi terhadap hardware AI Nvidia menunjukkan potensi besar dari AI generatif, seperti yang sudah ditunjukkan oleh ChatGPT dari OpenAI, dan model baru yang muncul di berbagai sektor seperti kesehatan, asuransi, dan keuangan.
Kesimpulan
Nvidia telah memperkenalkan layanan penyewaan superkomputer AI melalui platform DGX Cloud dengan GPU terbaru yang saat ini langka. Layanan ini tersedia di seluruh dunia, kecuali di wilayah yang terkena dampak kontrol ekspor AS, dan dapat diakses melalui infrastruktur cloud Nvidia atau Oracle. Pemberitahuan ini muncul setelah serangkaian pengumuman lainnya tentang AI di cloud, dengan beberapa pesaing seperti Cerebras Systems dan Tesla juga memperkenalkan inovasi mereka. Meskipun tarif penyewaan DGX Cloud terbilang mahal, Nvidia menjanjikan performa tinggi dan akses ke teknologi AI mutakhir. Di sisi lain, walaupun tren industri umumnya menuju model open-source, Nvidia tetap mendominasi dengan teknologi eksklusif mereka di pasar hardware AI.
FAQS
- Apa yang ditawarkan Nvidia melalui servis DGX Cloud? Nvidia menawarkan opsi sewa superkomputer AI dengan GPU teranyar di cloud melalui servis DGX Cloud, yang memungkinkan pengguna untuk mengakses paket hardware dan software ciptaan Nvidia.
- Dimana DGX Cloud dapat diakses? DGX Cloud dapat diakses hampir di seluruh dunia kecuali di wilayah yang terkena dampak kontrol ekspor AS. Ini tersedia dalam infrastruktur Nvidia di AS dan UK, serta melalui Oracle Cloud.
- Berapa biaya sewa DGX Cloud per bulan? Sewa DGX Cloud dibanderol dengan tarif mulai dari $36,999 per instance selama sebulan.
- Bagaimana Nvidia melihat strategi bisnis mereka dalam konteks AI? Sebagai langkah strategis, Nvidia berupaya untuk mengikat pelanggan agar menggunakan teknologi hardware dan software AI eksklusif mereka. Meskipun memerlukan investasi awal yang besar, Nvidia percaya bahwa investasi di AI akan memberikan penghematan operasional jangka panjang bagi perusahaan. Mereka tetap memiliki dominasi di pasar hardware AI meskipun ada kecenderungan dukungan terhadap model open-source.
Glosari
- Chatbot: Sebuah program komputer yang dirancang untuk berkomunikasi dengan manusia dalam bentuk teks atau suara. Biasanya digunakan untuk layanan pelanggan atau sebagai asisten virtual.
- Cloud / Cloud Service: Sumber daya komputasi yang disediakan melalui internet. Ini memungkinkan pengguna untuk mengakses daya komputasi tanpa harus memiliki perangkat keras fisik.
- CUDA: Sebuah platform paralel komputasi dan model pemrograman dari Nvidia. Ini memungkinkan developer untuk menggunakan GPU Nvidia untuk pemrosesan umum (selain grafis).
- DGX: Sebuah platform dari Nvidia yang dirancang khusus untuk komputasi AI. Ini adalah kombinasi perangkat keras dan perangkat lunak yang dioptimalkan untuk pemrosesan AI berkinerja tinggi.
- Exaflops: Satuan pengukuran kinerja komputer. FLOPS adalah singkatan dari “Floating Point Operations Per Second” yang berarti operasi titik mengambang per detik. Exaflops menunjukkan kemampuan komputer untuk melakukan satu triliun triliun (atau 10^18) operasi titik mengambang per detik. Sebagai perbandingan, komputer dengan kinerja 1 exaflops sangat cepat dan termasuk kategori superkomputer.
- Generative AI: Subkategori dari AI yang berfokus pada penciptaan sesuatu yang baru, seperti teks, gambar, atau musik. Sebagai contoh, model AI yang dapat menghasilkan teks atau gambar baru yang sebelumnya tidak ada.
- GPU (Graphics Processing Unit): Sebuah jenis chip komputer yang awalnya dirancang untuk mempercepat grafik untuk game dan desain visual. Namun, kini GPU juga sering digunakan dalam pemrosesan tugas-tugas berat seperti deep learning dan analisis data besar karena kemampuannya untuk melakukan banyak operasi secara paralel.
- Node: Dalam konteks jaringan atau komputasi kluster, node merujuk pada komputer individual atau perangkat lain yang terhubung ke jaringan. Setiap node memiliki tugas sendiri dalam pemrosesan data.
- Open-source: Perangkat lunak dengan kode sumber yang tersedia untuk umum. Ini memungkinkan siapa pun untuk melihat, memodifikasi, dan mendistribusikan perangkat lunak tersebut.
- Proprietary: Lawan dari open-source. Perangkat lunak atau perangkat keras yang dikendalikan oleh perusahaan atau individu tertentu, dan biasanya tidak bisa dimodifikasi atau didistribusikan tanpa izin.
- RDMA (Remote Direct Memory Access): Teknologi yang memungkinkan komputer di jaringan untuk bertukar data di memori tanpa melibatkan prosesor, cache, atau sistem operasi komputer masing-masing.
