Sains data merupakan ilmu terapan yang sedang marak dikembangkan. Bidang ini secara khusus mempelajari dan menganalisis bagaimana cara untuk mendapatkan masukan dari set data yang ada. Pada Rabu (27/10/2021), Kelompok Keahlian Agroteknologi dan Teknologi Bioproduk (KK ATB) SITH ITB mengundang Dr. Juro Miyasaka dari Kyoto University sebagai pemateri dalam acara Visiting Professor Program: International Guest Lecture.
Kuliah tamu yang dibawakan olehnya pada hari ini bertajuk “Basic of Data Science and Applications to Agricultural Production”. Pemaparan ini dibuka dengan pemberian pemahaman mengenai proses standar dalam penambangan data, yaitu cross industry standard process for data mining atau yang lebih lazim disingkat menjadi CRISP-DM.
“Umumnya, CRISP-DM digunakan untuk penambangan data pada sektor bisnis sehingga memiliki tahap awal berupa memahami bisnis. Sedangkan pada penerapan di bidang agrikultur, maka tahap pertama adalah untuk memahami produksi agrikultur itu sendiri,” kata Dr. Juro Miyasaka. Ia menambahkan, sains data dapat digunakan untuk machine learning, baik itu supervised learning maupun unsupervised learning bagi pengembangan bidang agrikultur.
Penggunaan metode dari sains data lainnya adalah regresi linear. Metode ini biasa digunakan untuk memprediksi jumlah berdasarkan data yang ada dengan melatih model terlebih dahulu, contohnya adalah ketika memprediksi jumlah produksi beras berdasarkan perolehan data beberapa tahun sebelumnya.
“Membuat model dari data yang ada merupakan hal yang mudah namun hasil yang didapatkan belum tentu optimum,” katanya. Dr. Juro kemudian mengingatkan bahwa pada tahap pelatihan model, yang harus diperhatikan secara seksama adalah mengenai peristiwa over fitting; ketika data yang digunakan untuk melatih model hanya diambil yang terbaik saja sehingga ketika dilakukan tes menggunakan data yang berbeda, akurasinya menjadi sangat rendah.
Penggunaan model prediksi berdasarkan set data pada bidang agrikultur, menurut Dr. Juro, dapat digunakan untuk memprediksi kemungkinan terjadinya suatu penyakit. Sebagai contoh penyakit Coleosporium plectranthi Barclay pada tanaman Perilla, data yang perlu dikumpulkan sebelum model prediksi dapat diibuat adalah temperatur dan kelembaban tanaman, temperatur media tanam, serta tinggi dari tanaman. Data didapatkan dari pengambilan data secara manual maupun menggunakan sensor yang dilakukan dalam selang 10 menit. “Prediksi penyakit pada tanaman ini diolah menggunakan metode support vector machine dan random forest,” ujarnya.
Contoh lainnya yang diberikan pada pemaparan ini adalah prediksi laju tumbuh tanaman Mizuna menggunakan data lingkungan. Tidak seperti model prediksi penyakit pada tanaman Perilla, metode yang digunakan untuk laju tumbuh adalah korelasi serta Adaboost k-nearest neighbor. Data yang dikumpulkan pun jauh lebih kompleks, yakni rata-rata temperatur dan kelembaban media tanam, rata-rata temperatur lingkungan, rata-rata temperatur lingkungan saat malam hari, rata-rata konsentrasi karbondioksida lingkungan, dan rata-rata kelembaban lingkungan. Data ini juga diambil dari ukuran tinggi tanaman yang berbeda.
Sebagai penutup, Dr. Juro Miyasaka menekankan bahwa metode pada bidang sains data masih sangat luas untuk dieksplorasi dan diaplikasikan pada produksi agrikultur.
Reporter: Athira Syifa P. S. (Teknologi Pascapanen, ITB)
Baca Juga : Mahasiswa UMG Raih Prestasi Tingkat Nasional & Internasional
Discussion about this post