[Artikel tentang ilmu dan profesi masa depan ini dimuat di Kompas KLASS pada Jumat, Desember 2015. Karena panjang, artikel ini kami sajikan dalam dua bagian. Untuk membaca bagian kedua, silakan klik di sini.]
Mengapa Google mampu menciptakan mobil tanpa pengemudi? Mengapa jaringan ritel Target bisa mendeteksi kehamilan pelanggannya sekaligus menawarkan aneka produk ibu hamil?
Semua ini fenomena data besar. Sejak munculnya platform untuk berbagi cerita, foto, dan video, jumlah data naik luar biasa. Jika ditambah data dari alat, kamera, dan sensor di jalan, gedung, fasilitas umum, dan pabrik, ukuran data melonjak berkali-kali lipat. Jika harddisk kita masih dalam jumlah giga atau tera, data yang dikumpulkan oleh Facebook, Google, Youtube, Twitter, dan Linkedin sudah di tingkat petabyte.
Di mata seorang ilmuwan data (ilmuwan data), lautan data bagaikan harta karun yang jika diolah akan mengungkap banyak hal, bahkan mengubah cara kita bekerja di berbagai bidang.
Begitu ampuhnya ilmu data sampai Harvard Business Review memuat tulisan Ilmuwan Data: Pekerjaan Terseksi Abad 21. Ini bukan tanpa dasar. Pada tahun 2011, McKinsey Global Institute memprediksi adanya kekurangan hampir 200 ribu ilmuwan data pada 2018. Ini baru di Amerika Serikat saja. Pantas saja kalau perusahaan mengiming-imingi mereka dengan gaji ukuran “jumbo”.
Program studi Ilmu Data
Disiplin ilmu yang relatif baru ini adalah pertemuan ilmu komputer dan ilmu statistik. Tujuannya, menggali pengertian baru dari data yang jumlahnya sangat besar melalui analisis kuantitatif untuk mengambil keputusan di berbagai bidang. Ada data yang terstruktur seperti data keuangan atau demografi, tetapi ada yang tidak beraturan, seperti surel, video, foto, media sosial, dan konten lainnya. Keduanya bisa dimanfaatkan.
Pada tahap awal, yakni datafikasi, berbagai data dari aneka sumber harus “disiapkan” agar bisa dibaca program komputer. Tahap ini membutuhkan keahlian di bidang ilmu komputer. Contoh materi ilmu komputer misalnya Advanced Database, Gudang Data, Algorithm beserta pemrograman dengan Python, R, Hadoop, berikut aneka peralatan-dia.
Setelah datanya siap, tugas berikutnya lebih banyak melibatkan ilmu statistika, optimasi, dan penalaran matematis. Tak heran, mahasiswa harus menguasai Statistics for Data Science, Teori Keputusan Bayesian, Analisis Prediktif, serta Probabilitas dan Data. Penguasaan berbagai materi statistik inilah yang akan mengungkap “rahasia” di balik lautan data.
Manfaat data besar sangat beragam. Contoh sederhana, di Amerika, ada sekitar 25 juta penderita asma. Lewat Social Media Data Analytics ditemukan bahwa mereka yang asmanya kambuh biasanya menulis twit, bahkan sebelum menghirup penghirup-dia.
Seperti kita ketahui, Twitter merekam data waktu dan lokasi dari setiap “kicauan”. Dengan menyaring puluhan juta twit menurut tagar (tagar), tautan, dan kata kunci tertentu, lokasi banyak penderita kambuh bisa dipetakan. Jadi, rumah sakit di wilayah tersebut punya waktu untuk menyiapkan dokter, obat-obatan asma, tempat tidur atau kamar, sebelum penderita berdatangan.
“Internet hal-hal”
Ketika penulis bertemu pakar teknik nirkabel Dari Universitas Macquarie Australia, Prof.Eryk Dutkiewics, ia menyebut tak lama lagi teknologi 5G akan dirilis. Dengan teknologi ini, tidak hanya data percakapan yang meningkat, tetapi juga data dari jutaan sensor, kamera, maupun alat elektronik. Pada era Internet untuk segala, banyak alat terkoneksi via internet dan mengirim data. Analisis terhadap yang dihasilkan mesin data ini bisa mengungkap banyak hal baru.
Di bidang kesehatan, misalnya, data kondisi ribuan pasien tersaji di komputer lengkap dengan prediksinya. Dokter bisa mengetahui mengapa obat yang satu efektif pada seseorang, tetapi tidak pada pasien lain. Berbagai alat yang terpasang di tubuh pasien akan memasok jutaan data penting yang mustahil dipahami tanpa ilmu data.
Memintarkan mesin
Dengan algoritma tertentu, satu data secara statistik terkait dengan data lainnya. Ketika jumlah data bertambah, komputer menghasilkan lebih banyak korelasi. Intinya, komputer jadi makin pintar jika disuplai lebih banyak data. Ini yang disebut pembelajaran mesin. Aplikasinya banyak, dari yang sederhana sampai mobil tanpa sopir dan layanan Google Translate.
Pada Google Translate, Google tidak menerjemahkan kata demi kata. Diambil dari konferensi internasional, publikasi ilmiah, dan koleksi perpustakaan, aneka teks disandingkan dengan terjemahannya, lalu disimpan dalam bentuk digital. Tiap frasa dan kalimat dikaitkan dengan terjemahannya, lalu dicari korelasinya.
Seiring waktu, terhimpun puluhan juta teks. Komputer pun makin pintar menghasilkan terjemahan yang lebih baik. Itu sebabnya, pembelajaran mesin termasuk materi pokok di perkuliahan ilmu data. Kelak Google bisa menghasilkan terjemahan yang akurat, termasuk menerjemahkan percakapan, dan membuat profesi penerjemah memudar, seperti yang akan menimpa banyak profesi lain akibat teknologi.
Singkatnya, ilmu data mampu menghasilkan optimasi, misalnya untuk merancang kampanye pemasaran yang paling efisien. Aplikasinya juga bisa membuahkan analitik prediktif, misalnya meramal kejadian atau mengantisipasi permintaan barang tertentu pada masa depan.
Dengan ilmu data, kita juga bisa lebih dalam memahami perilaku konsumen, seperti Amazon yang sukses mengembangkan sistem rekomendasi pembelian beberapa macam barang lain kepada pengunjung situsnya. Hal yang tak kalah menarik adalah kemampuan ilmu data mendeteksi penggelapan keuangan, bahkan mengotomatisasi mobil tanpa pengemudi seperti yang dilakukan Google.
Masalah privasi
Salah satu perusahaan asuransi besar, Aviva, mengukur risiko pemohon asuransi dari gaya hidupnya. Datanya diambil dari data hobi, laman apa yang sering dikunjungi, berapa sering menonton televisi, acara apa yang ditonton, perkiraan penghasilan, dan masih banyak lagi. Dengan cara ini, Aviva hanya dikeluarkan 5 dolar AS. Padahal, kalau melalui tes darah dan sampel urine, perusahaan harus menanggung biaya 125 dolar AS per pelanggan. Sebuah penghematan luar biasa.
Aviva bukan satu-satunya "penggali" data pribadi. Amazon, INRIX, Netflix, Target, dan banyak lainnya melakukan hal serupa. Pertanyaan terbesar bagi para pelaku di bidang data besar adalah aspek kerahasiaan dan privasi. Sampai seberapa jauh perusahaan atau organisasi berhak mengaduk-aduk data pribadi orang lain?
Untuk itu, oleh Universitas Columbia, Amerika, ada mata kuliah Data Science Capstone and Ethics dalam program Master of Science in Data Science. Di Sini, mahasiswa mengaplikasikan semua ilmunya untuk mengatasi masalah di industri, pemerintahan, dan sektor nirlaba. Proyek satu semester ini menyatukan problema statistik, komputasi, rekayasa teknik, dan persoalan sosial untuk mengatasi masalah dunia nyata secara etis.
Tambahkan komentar