Kinetica Luncurkan Native LLM: Konversi Natural Language ke SQL pada Data Enterprise

Elan Su
7 Min Read
7 Min Read

Kinetica baru saja mengumumkan sebuah native Large Language Model (LLM) yang dikombinasikan dengan arsitektur inovatif Kinetica yang memungkinkan pengguna untuk melakukan analisis data ad-hoc pada data terstruktur secara real-time dan cepat menggunakan bahasa alami. Berbeda dengan LLM publik, di Kinetica tidak diperlukan pemanggilan API eksternal dan data tidak pernah keluar dari lingkungan pelanggan. Pengumuman ini mengikuti inovasi Kinetica sebelumnya sebagai database analitik pertama yang terintegrasi dengan OpenAI.

Seiring antusiasme mengenai LLM, perusahaan dan agensi pemerintah sedang mencari cara inovatif untuk mengotomatisasi beberapa tugas bisnis, sambil menjaga informasi sensitif yang mungkin terungkap melalui fine-tuning atau augmentasi prompt supaya tetap aman. LLM publik, seperti GPT 3.5 dari OpenAI, menimbulkan pertanyaan seputar privasi dan keamanan. Namun, hal ini dapat diatasi dengan solusi khusus yang telah terintegrasi dalam penerapan Kinetica dan berada di dalam lingkungan perimeter jaringan pelanggan.

Selain lebih aman, Kinetica native LLM dirancang khusus sesuai dengan sintaksis dan definisi data di berbagai industri seperti telekomunikasi, layanan keuangan, otomotif, logistik, dan lain-lain, menciptakan generasi SQL yang lebih andal dan akurat. Kemampuan ini melampaui SQL standar, memastikan penanganan tugas-tugas kompleks untuk pengambilan keputusan yang lebih baik dalam pertanyaan time-series, grafik, dan spasial. Pendekatan Kinetica untuk fine-tuning lebih mengutamakan optimasi generasi SQL untuk memastikan hasil yang konsisten dan akurat, ketimbang teknik-teknik lainnya yang mengutamakan kreativitas yang menghasilkan respons yang beragam tetapi tidak dapat diprediksi. Hal ini menjamin fungsionalitas berkelanjutan untuk bisnis dan pengguna, memberikan ketenangan pikiran dalam hasil query SQL.

“Kinetica telah memimpin pasar dengan kemampuan tingkat lanjut untuk menganalisis data sensor dan mesin dengan database analitik real-time kami yang divektorisasi,” kata Nima Negahban, Cofounder dan CEO, Kinetica. “Dengan integrasi SQL-GPT, kami memperluas kemampuan ini ke cakrawala yang sepenuhnya baru, memberdayakan organisasi untuk melepaskan potensi sebenarnya dari data terstruktur real-time mereka seperti belum pernah ada sebelumnya.”

Angkatan Udara AS telah bekerja sama dengan Kinetica, memanfaatkan analitik canggih pada data sensor untuk dengan cepat mengidentifikasi dan merespons ancaman potensial, membantu menjaga langit tetap aman dan terjamin untuk semua pengguna sistem ruang udara nasional. Angkatan Udara AS kini menggunakan embedded LLM Kinetica untuk mendeteksi ancaman di ruang udara dan mengidentifikasi anomali menggunakan bahasa alami.

“Di Kinetica, kami sangat menghargai keterbukaan dan selalu terbuka terhadap keanekaragaman model generative AI,” ujar Amit Vij, salah satu pendiri sekaligus Presiden Kinetica. “Kami menantikan kemunculan beragam platform LLM dan berkeinginan untuk memberi pelanggan kami lebih banyak pilihan. Meski kini kami hanya mendukung dua model, kami tetap berkomitmen untuk selalu memperkaya pilihan, agar sesuai dengan keinginan klien dan bisa berintegrasi dengan baik bersama model-model inovatif di masa depan. Sejalan dengan visi tersebut, Kinetica berencana mengintegrasikan platform LLM lainnya, seperti NVIDIA NeMo, ke dalam layanan kami nanti di tahun ini, terutama dalam konversi bahasa ke SQL, seiring dengan kemunculan model-model canggih yang mendefinisikan standar baru.”

Database Kinetica mengonversi query bahasa alami ke SQL, dan mengembalikan jawaban dalam hitungan detik, bahkan untuk pertanyaan yang kompleks dan tidak diketahui. Lebih lanjut, Kinetica menggabungkan berbagai mode analitik seperti time series, spasial, grafik, dan machine learning yang memperluas jenis pertanyaan yang dapat dijawab. Yang membuat Kinetica mampu memberikan query percakapan adalah penggunaan native vectorization.

Dalam vectorized query engine, data disimpan dalam blok-blok berukuran tetap yang disebut vektor, dan operasi query dilakukan pada vektor ini secara paralel, bukan pada elemen data individu. Ini memungkinkan query engine untuk memproses beberapa elemen data secara bersamaan, menghasilkan eksekusi query yang jauh lebih cepat pada jejak komputasi yang lebih kecil. Vektorisasi dimungkinkan oleh GPU dan kemajuan terbaru dalam CPU, yang melakukan perhitungan simultan pada beberapa elemen data,mempercepat tugas-tugas yang intensif dalam perhitungan dengan memungkinkan mereka diproses secara paralel di berbagai inti atau thread.

Tentang Kinetica

Kinetica adalah pencipta database analitik real-time revolusioner untuk data sensor dan mesin. Menawarkan native vectorized analytics dalam generative AI, spasial, time-series, dan grafik. Banyak perusahaan terbesar di dunia dari sektor publik, layanan keuangan, telekomunikasi, energi, kesehatan, ritel, otomotif, dan lainnya mengandalkan Kinetica untuk menciptakan solusi time-series dan spasial baru, termasuk Angkatan Udara AS, Citibank, Ford, T-Mobile, dan beberapa lainnya.

Kesimpulan

Kinetica adalah perusahaan yang bergerak dalam bidang teknologi informasi, khususnya dalam pengembangan database analitik real-time. Mereka telah menciptakan solusi inovatif untuk menganalisis data sensor dan mesin dengan teknologi vektorisasi. Kinetica baru-baru ini mengumumkan integrasi dengan Large Language Model (LLM) yang memungkinkan analisis data terstruktur secara real-time dengan natural language. Keunggulan lain dari Kinetica adalah kemampuannya untuk menjaga data pelanggan tetap aman di dalam lingkungan mereka sendiri tanpa perlu pemanggilan API eksternal. Selain itu, mereka juga berfokus pada optimalisasi generasi SQL untuk memastikan hasil yang konsisten dan akurat. Kinetica telah bekerja sama dengan berbagai entitas besar, termasuk Angkatan Udara AS, dalam menerapkan solusi mereka.


Glosari

  • API (Application Programming Interface): Sebuah set perintah, fungsi, protokol, dan objek yang dapat digunakan oleh programmer saat membangun perangkat lunak untuk sistem operasi tertentu. API memungkinkan dua aplikasi berbeda untuk berkomunikasi satu sama lain.
  • Database Analitik Real-time: Sebuah database yang dirancang untuk memproses query dan transaksi dalam waktu nyata, memungkinkan pengguna untuk mengakses dan menganalisis data seketika.
  • Generative AI: Sebuah subbidang kecerdasan buatan (AI) yang melatih model untuk menghasilkan konten baru, seperti teks, gambar, atau musik, yang sejalan dengan data yang telah diberikan sebelumnya.
  • Large Language Model (LLM): Model bahasa berukuran besar yang dilatih dengan data teks besar untuk memahami dan menghasilkan teks dalam bahasa alami.
  • Native Vectorized Analytics: Analitik yang menggunakan vektorisasi, yaitu teknik pemrosesan data yang memungkinkan operasi pada data yang lebih besar sekaligus, meningkatkan kecepatan dan efisiensi analisis.
  • SQL (Structured Query Language): Bahasa standar untuk mengelola dan meminta informasi dari database relasional.
  • SQL-GPT: Integrasi antara bahasa SQL dengan model bahasa GPT untuk memungkinkan query dengan bahasa alami.
  • Vektorisasi: Teknik dalam komputasi yang memproses data dalam vektor atau blok data sekaligus daripada elemen per elemen, meningkatkan kecepatan pemrosesan.