Mengenal Implementasi Analisis Data lewat Kuliah Umum Matematika ITB
Oleh Anggun Nindita
Editor Anggun Nindita
BANDUNG, itb.ac.id – Kuliah Umum Matematika ITB bertema "Implementasi Analisis Data di Industri" dilaksanakan di gedung CAS ITB dan secara daring, Kamis (14/09/2023). Kuliah ini diisi oleh pembicara dari PT Dua Empat Tujuh, Sigit Prasetyo, dan VP Knowledge Management Office, Dana Annisa Riefina (Matematika, 2015), salah satu data scientist di perusahaan tersebut. Dalam kegiatan tersebut, mahasiswa dan dosen yang datang dikenalkan selayang pandang tentang berharganya data, proses analisis data, dan tentang PT Dua Empat Tujuh.
Sigit Prasetyo memulai kuliah dengan menjelaskan big data yang bagaikan minyaknya zaman sekarang. Beliau menyebutnya sebagai sesuatu yang “happening” karena segala sesuatu membutuhkan data. Google menjadi salah satu perusahaan terkuat karena mengakuisisi banyak data. Selain itu, tanpa disadari, ketergantungan manusia pada telepon genggam pun bisa dijadikan data.
Sigit menekankan bahwa cara mengolah data dengan cepat dan akurat serta memprosesnya menjadi informasi yang berguna adalah sebuah tantangan. Kebanyakan pengguna data tidak memiliki latar belakang analisis data. Oleh karena itu, seorang analis harus mampu menerjemahkan data sehingga bisa bermanfaat bagi pengguna data untuk mengambil keputusan. Salah satu contohnya saat masa pandemi, data terkait Covid-19 cepat berubah, analisis data cepat dan akurat menjadi suatu urgensi.
Di sisi lain, Dana menjelaskan proses analisis data, khususnya metode yang diterapkan di Solusi247, salah satu bagian dari PT Dua Empat Tujuh. Data yang diprosesnya adalah big data yang memiliki karakteristik volume, velocity, variety, veracity, dan value yang besar. Beliau mengaku, saking besarnya ukuran data, komputernya kesulitan untuk memuatnya. Beliau menekankan pentingnya pembersihan sebelum pemrosesan data. Dengan demikian, jika yakin data telah bersih, kebergunaan hasil analisis akan meningkat.
Proses analisis data secara garis besar terdiri atas empat tingkatan, yaitu deskripsi, diagnosis, prediksi, dan preskripsi. Semakin tinggi tingkatan, besar pula kesulitan dan nilai luarannya. Pada tahap deskripsi dan diagnosis, analis mencari tahu informasi serta sebab-akibat yang terjadi di dalam data, luarannya berupa laporan atau dasbor. Pada tahap prediksi dan preskripsi, analis memberikan prediksi data di masa depan serta rekomendasi tindakan yang harus dilakukan. Produk dari data inilah yang menjadi luarannya.
Dana menjelaskan pula perihal prosedur penambangan data yang disebut CRISP-DM (Cross Industry Standard Processing for Data Mining). Prosedur ini diterapkan pula oleh Solusi247. Secara umum, prosedur ini terdiri atas beberapa tahapan: business understanding, yaitu mengonversi tujuan-tujuan bisnis menjadi permasalahan penambangan data; data understanding, yaitu mengumpulkan data; data preparation, yaitu pembuatan himpunan data yang siap untuk pemodelan; modeling, yaitu menerapkan model yang dipilih; evaluation, yaitu menilai hasil pemodelan; dan deployment, yaitu mempresentasikan model kepada pengguna.
Adapun PT Dua Empat Tujuh adalah perusahaan yang bergerak di bidang informasi dan teknologi data. Terdapat empat “pilar” dalam perusahaan ini. Setiap bagiannya memiliki tujuannya masing-masing. Solusi247 untuk pelayanan konsultasi terkait solusi database dan data warehouse, Labs247 untuk pembuatan perangkat big data, Insights247 untuk penyedia pakar dalam data sains, dan DataLearns247 untuk pelatihan dan sertifikasi.
Reporter: Reza Pahlawan (Aktuaria, 2020)
Dokumentasi: Edy Tri Baskoro
Editor: M. Naufal Hafizh