Dosen ITB Kembangkan Teknologi Natural Language Processing

Oleh Adi Permana

Editor Adi Permana

*Dr. Eng. Ayu Purwarianti, S.T., M.T. (Foto: Adi Permana/Humas ITB)


BANDUNG, itb.ac.id - Manusia sebagai makhluk sosial melakukan satu hal yang mendasar yaitu berkomunikasi secara verbal maupun nonverbal (tulisan). Adanya internet di kehidupan sehari-hari membuat berkomunikasi menjadi lebih mudah sehingga kita dapat menerima informasi atau berita dengan cepat. 

Salah satu perkembangan teknologi dalam bidang linguistik adalah Natural Language Processing (NLP) atau Pemprosesan Bahasa Alami (PBA). Beberapa aplikasi dari ilmu tersebut yang tidak asing dalam kehidupan kita sehari-hari adalah search engine, virtual assistance, maupun online machine translation. 

NLP merupakan bagian dari artificial intelligence yang bersifat multidisiplin antara computer science dan linguistics. Salah satu dosen Program Studi Teknik Informatika, Sekolah Teknik Elektro dan Informatika (STEI) ITB yang mendalami perkembangan NLP berbahasa Indonesia adalah Dr. Eng. Ayu Purwarianti, S.T., M.T. Menurut Dr. Ayu, NLP merupakan salah satu ilmu artificial intelligence yang mengolah bahasa manusia.

“Targetnya adalah membuat komputer untuk mengerti bahasa manusia. Salah satu contoh NLP yang kerap kita gunakan adalah search engine. Kita melakukan riset atau penelusuran dengan search engine, kita akan memasukkan kata kunci sehingga search engine tersebut akan mencari dokumen yang kira-kira relevan dengan kata kunci yang kita masukan. Perkembangan NLP menjadi pesat karena dua latar belakang yaitu semakin banyaknya data yang ada di internet serta manusia ingin menggunakan teknologi secara mudah dan sederhana atau user friendly,” ungkapnya.

Ayu telah mengembangkan NLP berbahasa Indonesia sejak 1998 saat ia masih S1 dan melanjutkannya dengan pengembangan cross-language question answering dalam Bahasa Jepang dan Inggris saat kuliah S3 di Jepang. Dia menjelaskan, cross-language question answering adalah sebuah sistem pencarian jawaban otomatis di mana pertanyaan user dan kumpulan dokumen sumber jawaban itu ditulis dalam bahasa yang berbeda.

*Foto: Dok. Pribadi

Dalam NLP, terdapat beberapa alat dasar NLP yang perlu dibangun terlebih dahulu untuk memperoleh sebuah modul pemrosesan NLP lainnya yang akurat seperti sentences splitter yaitu memotong paragraf menjadi kalimat, tokenization atau pemotongan kalimat menjadi kata (rumah sakit, rumah makan, orang tua) yang harus digabung sebagai sebuah istilah.

“Setelah terpisah menjadi kata-kata, maka alat selanjutnya adalah syntax analysis. Analisis ini mengategorikan kata dalam beberapa jenis kata seperti kata sifat, kata benda, kata kerja, dan lain-lain. Analisis ini juga menghasilkan pohon kalimat yang menunjukkan hubungan terstruktur antar kata pada sebuah kalimat. Setelah itu, kata-kata yang telah diklasifikasikan tersebut harus membentuk arti jika digabung satu sama lain. Alat ini disebut juga dengan semantic analysis,” jelasnya.

Terdapat dua pendekatan umum dalam NLP yaitu machine learning based dan rule based. Pada pendekatan yang bersifat rule based, seluruh aturan pemrosesan dalam sebuah NLP module itu ditetapkan secara manual oleh manusia sedangkan pada machine learning based peran manusia hanya memberi inputan berupa training data sebagai sumber pembelajaran bagi mesin untuk memperoleh pola aturan pemrosesan bahasa. “Sebagian besar NLP yang saya kembangkan adalah machine learning based yang salah satu kelebihannya dibanding rule based adalah kemampuannya yang secara otomatis menangani kata baru atau kata yang tidak ada pada training data sehingga jika ada kata yang asing bagi mesin tersebut maka sistem akan otomatis menebak hasilnya berdasar pola yang telah dipelajari melalui training data,” ungkap Ketua Program Doktoral Teknik Elektro dan Informatika STEI ITB ini.

Perkembangan NLP berguna dalam berbagai aspek di kehidupan manusia, contoh selain search engine adalah machine translation seperti Google Translate atau virtual assistant seperti Siri. Selain itu, NLP juga berguna di dunia akademisi seperti deteksi plagiarisme. “Jadi sebenarnya dalam kehidupan sehari-hari, kita ini sudah banyak berinteraksi dengan NLP,” tutur Ayu. 

Salah satu aplikasi NLP yang sedang dikembangkan oleh Ayu adalah sentiment analysis yang berguna untuk mengetahui opini orang-orang di internet sehingga kita dapat mengetahui apa yang dibicarakan oleh pengguna media sosial. Beberapa pelaku usaha menggandeng Ayu untuk mengembangkan sentiment analysis yang menyangkut badan usaha yang tengah mereka jalankan. 

“Dalam praktiknya, sebuah pengusaha ingin tahu tentang sentimen masyarakat terhadap perusahaannya. Hal tersebut berkaitan dengan reputasi perusahaan tersebut yang memengaruhi sudut pandang masyarakat atau investor,” jelas Ayu. 

Selain sentiment analysis, Ayu juga bekerja sama dengan perusahaan mengenai hoax classifier yang dapat mengecek apakah sebuah informasi yang beredar di aplikasi pengiriman pesan itu hoax atau bukan.

Di tengah kesibukannya mengajar, salah satu pengembangan NLP yang tengah Ayu kembangkan adalah chatbot. Chatbot adalah program komputer yang dirancang untuk menyimulasikan percakapan antara yang bertanya dan komputer. Chatbot memungkinkan perusahaan untuk melayani pertanyaan konsumen secara 24 jam. Jawaban untuk pertanyaan konsumen tersebut bahkan dapat dipelajari sistem secara otomatis dari dokumen, bukan hanya dari skenario yang dituliskan chatbot designer.

“Sehingga perusahaan bisa memasukkan dokumen apapun untuk menambah pengetahuan chatbot. Selain itu, chatbot juga dapat bersifat hybrid yaitu dengan melibatkan agen manusia atas pertanyaan baru yang chatbot belum memiliki pengetahuan untuk menjawabnya, dan hasil tanya jawab antara agen manusia dan konsumen tersebut berikutnya dapat dimasukkan sebagai pengetahuan baru bagi chatbot secara otomatis.  Hal ini mempermudah perusahaan terutama yang membuka layanan 24 jam,” jelasnya.

Reporter: Billy Akbar Prabowo (Teknik Metalurgi, 2016)