Dalam pembahasan kali ini, Kita akan menyelami proses pembuatan hingga deployment model Machine Learning khususnya untuk klasifikasi Bunga Iris. Pembuatannya melibatkan beberapa langkah penting, termasuk penggunaan framework Streamlit untuk membuat aplikasi interaktif, Exploratory Data Analysis (EDA) dengan library python ydata-profiling, dan deployment aplikasi menggunakan Hugging Face Space. Mari kita lihat lebih dalam tentang bagaimana cara pembuatannya.
Mengenal Dataset Iris
Pertama-tama, kita perlu memahami dataset Iris. Dataset Iris merupakan salah satu dataset paling populer di dunia Machine Learning yang memiliki tiga kelas target: Setosa, Versicolor, dan Virginica. Tujuan kita adalah membangun model yang dapat mengklasifikasikan bunga Iris ke salah satu dari tiga kelas ini berdasarkan fitur-fitur mereka.
Membuat Aplikasi Streamlit
Streamlit menjadi pilihan Saya untuk membuat aplikasi interaktif yang memungkinkan pengguna untuk menguji model klasifikasi secara langsung. Dengan Streamlit, pengguna dapat memasukkan nilai fitur dan melihat hasil prediksi dengan mudah.
Exploratory Data Analysis (EDA)
EDA adalah langkah kunci dalam memahami dataset. Saya menggunakan ydata-profiling, sebuah alat yang kuat untuk menganalisis dataset dengan cepat. Ini membantu saya memahami statistik dasar, distribusi fitur, dan pola dalam data Iris.
Melatih dan Mengevaluasi Model
Setelah EDA, saya membagi dataset menjadi data training dan testing. Saya melakukan komparasi beberapa algoritma klasifikasi yang sesuai untuk melatih model dengan data training. Kemudian, saya mengevaluasi kinerja model untuk mencari yang terbaik menggunakan metrik yang relevan.
Deploy di Hugging Face Space
Langkah terakhir adalah mendeploy model dan aplikasi Streamlit di Hugging Face Space. Ini memungkinkan akses mudah untuk pengguna lain yang ingin menguji model atau melihat hasilnya.
Berikut ini merupakan tampilan aplikasinya:
Silakan download untuk source code dibawah ini atau ingin clone dari existing Hugging Face Space:
Kesimpulan
Dalam perjalanan membangun model klasifikasi berbasis dataset Bunga Iris, kita menemukan pentingnya setiap langkah dalam siklus pengembangan Machine Learning. Mulai dari pemahaman mendalam tentang dataset yang digunakan, Bunga Iris, hingga penerapan teknik eksplorasi data dengan ydata-profiling untuk mendapatkan wawasan tentang data. Framework Streamlit memungkinkan kita untuk menghadirkan model ke pengguna dalam bentuk aplikasi interaktif, memberikan pengalaman langsung dalam menguji klasifikasi. Dan dengan Hugging Face Space, model tidak hanya berhenti pada tahap pengembangan, tetapi dapat diakses dan diuji oleh komunitas luas. Ini adalah contoh nyata bagaimana teknologi modern memudahkan dan mempercepat proses dari ide hingga implementasi dalam dunia Machine Learning.
Glosari
- Aplikasi Streamlit: Framework Python yang digunakan untuk membuat aplikasi web interaktif dengan cepat, cocok untuk menampilkan model Machine Learning kepada pengguna.
- Bunga Iris: Dataset yang digunakan dalam artikel, terkenal dalam dunia Machine Learning, dan memiliki tiga kelas target: Setosa, Versicolor, dan Virginica.
- Deployment: Proses memindahkan model Machine Learning dan aplikasinya ke lingkungan yang dapat diakses oleh pengguna, seperti Hugging Face Space.
- Exploratory Data Analysis (EDA): Langkah penting dalam pemahaman dataset, yang melibatkan analisis statistik dasar dan visualisasi data untuk mengungkap pola dan wawasan.
- Hugging Face Space: Platform yang digunakan untuk deployment model Machine Learning dan aplikasi, memungkinkan akses mudah bagi pengguna lain.
- Klasifikasi: Proses mengategorikan data ke dalam kelas atau kategori tertentu berdasarkan fitur-fitur yang ada.
- Machine Learning (ML): Cabang dari kecerdasan buatan yang memungkinkan komputer untuk belajar dari data dan membuat prediksi atau keputusan tanpa pemrograman eksplisit.
- Model Machine Learning: Representasi matematis dari suatu sistem yang belajar dari data untuk membuat prediksi atau mengambil tindakan.
- Pengujian Model: Langkah penting dalam pembuatan model Machine Learning yang melibatkan penggunaan data tes untuk mengevaluasi kinerja model.
- Ydata-profiling: Alat yang digunakan dalam EDA untuk menganalisis dataset dengan cepat dan menghasilkan wawasan tentang data.
