Kompas Articles

Menyongsong Era “Big Data” dengan “Data Science”

Digital-capabilities-and-facilities-at-the-University-of-South-Australia
[Artikel tentang ilmu dan profesi masa depan ini dimuat di Kompas KLASS pada Jumat, Desember 2015. Karena panjang, artikel ini kami sajikan dalam dua bagian. Untuk membaca bagian kedua, silakan klik di sini.]

Mengapa Google mampu menciptakan mobil tanpa pengemudi? Mengapa jaringan ritel Target bisa mendeteksi kehamilan pelanggannya sekaligus menawarkan aneka produk ibu hamil?

 

(Foto-foto dok.: University of South Australia)
(Foto-foto dok.: University of South Australia)

Semua ini fenomena big data. Sejak munculnya platform untuk berbagi cerita, foto, dan video, jumlah data naik luar biasa. Jika ditambah data dari alat, kamera, dan sensor di jalan, gedung, fasilitas umum, dan pabrik, ukuran data melonjak berkali-kali lipat. Kalau hard disk kita masih di bilangan giga atau tera, data yang dihimpun Facebook, Google, Youtube, Twitter, dan Linkedin sudah di tingkat petabyte.

Di mata seorang ilmuwan data (data scientist), lautan data bagaikan harta karun yang jika diolah akan mengungkap banyak hal, bahkan mengubah cara kita bekerja di berbagai bidang.

Data Scientist: The Sexiest Job of the 21st Century. Harvard Business Review

Begitu ampuhnya data science sampai Harvard Business Review memuat tulisan Data Scientist: The Sexiest Job of the 21st Century. Ini bukan tanpa dasar. Pada tahun 2011, McKinsey Global Institute memprediksi adanya kekurangan hampir 200 ribu ilmuwan data pada 2018. Ini baru di Amerika Serikat saja. Pantas saja kalau perusahaan mengiming-imingi mereka dengan gaji ukuran “jumbo”.

Program studi Data Science

Disiplin ilmu yang relatif baru ini adalah pertemuan ilmu komputer dan ilmu statistik. Tujuannya, menggali pengertian baru dari data yang jumlahnya sangat besar melalui analisis kuantitatif untuk mengambil keputusan di berbagai bidang. Ada data yang terstruktur seperti data keuangan atau demografi, tetapi ada yang tidak beraturan, seperti e-mail, video, foto, media sosial, dan konten lainnya. Keduanya bisa dimanfaatkan.

Pada tahap awal, yakni datafication, berbagai data dari aneka sumber harus “disiapkan” agar bisa dibaca program komputer. Tahap ini membutuhkan keahlian di bidang ilmu komputer. Contoh materi ilmu komputer misalnya Advanced Database, Data Warehouses, Algorithm beserta pemrograman dengan Python, R, Hadoop, berikut aneka tools-nya.

Advanced-Computing-Research-Centre-Lab-at-the-University-of-South-Australia

Setelah datanya siap, tugas berikutnya lebih banyak melibatkan ilmu statistika, optimasi, dan penalaran matematis. Tak heran, mahasiswa harus menguasai Statistics for Data Science, Bayesian Decision Theory, Predictive Analytics, serta Probabilities and Data. Penguasaan berbagai materi statistik inilah yang akan mengungkap “rahasia” di balik lautan data.

Manfaat big data sangat beragam. Contoh sederhana, di Amerika, ada sekitar 25 juta penderita asma. Lewat Social Media Data Analytics ditemukan bahwa mereka yang asmanya kambuh biasanya menulis twit, bahkan sebelum menghirup inhaler-nya.

Seperti kita ketahui, Twitter merekam data waktu dan lokasi dari setiap “kicauan”. Dengan menyaring puluhan juta twit menurut tagar (hashtags), tautan, dan kata kunci tertentu, lokasi banyak penderita kambuh bisa dipetakan. Jadi, rumah sakit di wilayah tersebut punya waktu untuk menyiapkan dokter, obat-obatan asma, tempat tidur atau kamar, sebelum penderita berdatangan.

“The internet of things”

Ketika penulis bertemu pakar wireless engineering dari Macquarie University Australia, Prof Eryk Dutkiewics, ia menyebut tak lama lagi teknologi 5G akan dirilis. Dengan teknologi ini, tidak hanya data percakapan yang meningkat, tetapi juga data dari jutaan sensor, kamera, maupun alat elektronik. Pada era internet of things, banyak alat terkoneksi via internet dan mengirim data. Analisis terhadap machine-generated data ini bisa mengungkap banyak hal baru.

Berbagai alat yang terpasang di tubuh pasien akan memasok jutaan data penting yang mustahil dipahami tanpa data science

Di bidang kesehatan, misalnya, data kondisi ribuan pasien tersaji di komputer lengkap dengan prediksinya. Dokter bisa mengetahui mengapa obat yang satu efektif pada seseorang, tetapi tidak pada pasien lain. Berbagai alat yang terpasang di tubuh pasien akan memasok jutaan data penting yang mustahil dipahami tanpa data science.

Memintarkan mesin

Dengan algoritma tertentu, data yang satu dikaitkan dengan data lain secara statistik. Ketika jumlah data bertambah, komputer menghasilkan lebih banyak korelasi. Intinya, komputer jadi makin pintar jika disuplai lebih banyak data. Ini yang disebut machine learning. Aplikasinya banyak, dari yang sederhana sampai mobil tanpa sopir dan layanan Google Translate.

Pada Google Translate, Google tidak menerjemahkan kata demi kata. Diambil dari konferensi internasional, publikasi ilmiah, dan koleksi perpustakaan, aneka teks disandingkan dengan terjemahannya, lalu disimpan dalam bentuk digital. Tiap frasa dan kalimat dikaitkan dengan terjemahannya, lalu dicari korelasinya.

MM-Theatre-in-the-Round-at-the-Mawson-Lakes-Campus_UniSA

Seiring waktu, terhimpun puluhan juta teks. Komputer pun makin pintar menghasilkan terjemahan yang lebih baik. Itu sebabnya, machine learning termasuk materi pokok di perkuliahan data science. Kelak Google bisa menghasilkan terjemahan yang akurat, termasuk menerjemahkan percakapan, dan membuat profesi penerjemah memudar, seperti yang akan menimpa banyak profesi lain akibat teknologi.

Singkatnya, data science mampu menghasilkan optimasi, misalnya untuk merancang kampanye pemasaran yang paling efisien. Aplikasinya juga bisa membuahkan predictive analytics, misalnya meramal kejadian atau mengantisipasi permintaan barang tertentu pada masa depan.

Dengan data science, kita juga bisa lebih dalam memahami perilaku konsumen, seperti Amazon yang sukses mengembangkan sistem rekomendasi pembelian beberapa macam item lain kepada pengunjung situsnya. Hal yang tak kalah menarik adalah kemampuan data science mendeteksi penggelapan keuangan, bahkan mengotomatisasi mobil tanpa pengemudi seperti yang dilakukan Google.

Isu privasi

Salah satu perusahaan asuransi besar, Aviva, mengukur risiko pemohon asuransi dari gaya hidupnya. Datanya diambil dari data hobi, laman apa yang sering dikunjungi, berapa sering menonton televisi, acara apa yang ditonton, perkiraan penghasilan, dan banyak lagi. Dengan cara ini, Aviva hanya mengeluarkan 5 dollar AS. Padahal, kalau melalui tes darah dan sampel urine, perusahaan harus menanggung biaya 125 dollar AS per nasabah. Sebuah penghematan luar biasa.

Aviva bukan satu-satunya “pengorek” data pribadi. Amazon, INRIX, Netflix, Target, dan banyak lainnya melakukan hal serupa. Pertanyaan terbesar bagi para pelaku di bidang big data adalah aspek kerahasiaan dan privasi. Sampai seberapa jauh perusahaan atau organisasi berhak mengaduk-aduk data pribadi orang lain?

Untuk itu, di Columbia University, Amerika, ada mata kuliah Data Science Capstone and Ethics dalam program Master of Science in Data Science. Di sini, mahasiswa mengaplikasikan semua ilmunya untuk mengatasi masalah di industri, pemerintahan, dan sektor nirlaba. Proyek satu semester ini menyatukan problema statistik, komputasi, rekayasa teknik, dan persoalan sosial untuk mengatasi masalah dunia nyata secara etis.

Bagian kedua dari artikel ini bisa dibaca di sini.

Ads 2-04

About the author

Ina Liem

Ina Liem

Ina Liem sudah belasan tahun berkecimpung di dunia pendidikan, terutama pendidikan di luar negeri. Ia telah memberi konsultasi, seminar, dan presentasi di hadapan puluhan ribu pelajar dan orang tua murid di banyak kota dan di beberapa negara tetangga. Selain menjadi Kontributor rubrik EDUKASI di KOMPAS KLASS, Ina adalah penulis (author), pembicara (public speaker), dan Certified Career Direct Consultant.

Add Comment

Click here to post a comment

Your email address will not be published. Required fields are marked *

*