• Tidak ada hasil yang ditemukan

BIG DATA ANALISIS: SEBUAH PELUANG DAN TANTANGAN LULUSAN INFORMATIKA DALAM MENGHADAPI PASAR GLOBAR DI INDONESIA TIMUR

N/A
N/A
Protected

Academic year: 2017

Membagikan "BIG DATA ANALISIS: SEBUAH PELUANG DAN TANTANGAN LULUSAN INFORMATIKA DALAM MENGHADAPI PASAR GLOBAR DI INDONESIA TIMUR"

Copied!
5
0
0

Teks penuh

(1)

BIG DATA ANALISIS: SEBUAH PELUANG DAN TANTANGAN

LULUSAN INFORMATIKA DALAM MENGHADAPI PASAR GLOBAR DI

INDONESIA TIMUR

Haviluddin, S.Kom., M.Kom., Ph.D.

Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Mulawarman [email protected]; [email protected]

Abstrak - Makalah ini membahas munculnya machine learning untuk analisis big data. Pertama, machine learning dan beberapa istilah yang terkait didefinisikan dan dijelaskan secara rinci dan hal ini termasuk artificial intelligence, data mining, data science, data analytics dan knowledge discovery, statistik dan business intelligence. Definisi ini akan menunjukkan bagaimana hal ini saling terkait satu sama lain. Kemudian, definisi big data diuraikan berdasarkan tiga hal: Volume, Velocity dan Variety. Menerapkan strategi data besar yang baik sangat penting untuk menjamin keberhasilan penerapan machine learning untuk belajar big data. Sebagai hasilnya, tren di big data juga digambarkan dan didefinisikan berdasarkan lanskap data besar; Infrastruktur, Analytics, Aplikasi, Cross-Infrastruktur/Analytics, Open Sources, Data Source, dan API, Inkubator dan Sekolah. Makalah ini juga membahas beberapa fasilitas open source yang tersedia untuk publik dalam rangka untuk memastikan bahwa skala besar aplikasi machine learning dapat terwujud. Akhirnya, dalam kesimpulan, tren besar selama beberapa bulan terakhir dalam analisis big data telah meningkatnya fokus pada kecerdasan buatan untuk membantu menganalisis sejumlah besar data dan berasal wawasan prediktif. Artificial intelligence/machine learning sekarang mempercepat kecenderungan munculnya lapisan aplikasi dari big data. Kombinasi big data dan artificial intelligence akan mendorong inovasi yang luar biasa hampir di setiap industri. Dari perspektif itu, kesempatan big data mungkin bahkan lebih besar dari apa yang orang-orang pikirkan.

Kata Kunci – Big Data, AI, Data Mining, Data Analytics, Data Science, Knowledge Discovery, Business Intelligence

1. PENDAHULUAN

Saat ini, ilmu kecerdasan buatan menjadi lebih terlihat dalam industri perangkat lunak. Hal ini disebabkan banyaknya permintaan untuk analisis data yang didorong oleh pertumbuhan data itu sendiri, baik data yang bersifat terstruktur dan tidak terstruktur. Dapat dikatakan bahwa penelitian tentang kecerdasan buatan dimulai sejak adanya komputer itu sendiri. Banyak penelitian saat ini menyangkut subfield itu disebut "deep learning", di mana ia merupakan penyempurnaan modern "mesin belajar", di mana komputer belajar tentang cara mengajar diri sendiri tugas dengan pengolahan dan belajar terhadap data besar yang mencakup terstruktur dan tidak terstruktur.

Oleh karena itu, berbagai macam algoritma kecerdasan buatan banyak ditawarkan dalam analisa data besar. Tujuannya adalah untuk menjembatani kesenjangan tugas yang sulit bagi manusia tetapi mereka mudah untuk komputer.

Mesin pintar (Machine Learning) adalah cara memanfaatkan komputer untuk mengetahui hal-hal yang rumit ketika memproduksi diri mereka sendiri aturan programmer. Dengan kata lain, mesin pintar mengacu pada metodologi yang digunakan dan memungkinkan komputer untuk melakukan tugas

yang cerdas menyerupai kerja manusia, seperti menyelesaikan tugas-tugas prediksi, deteksi, klasifikasi dan klasterisasi. Ini adalah ilmu yang melibatkan pengembangan algoritma belajar mandiri. Mesin melakukan hal ini dengan tugas berat analisis statistik banyak dan banyak data.

Beberapa istilah yang terlibat dalam menggambarkan atau terkait dengan mesin pintar meliputi kecerdasan buatan/artificial intelligence (AI), data mining, data science, analisis data dan knowledge discovery, statistik dan Business Intelligence, dalam Gambar 1.

(2)

menganalisis, dan menginterpretasikan informasi numerik dari data. Di sisi lain, data mining adalah praktek menerapkan algoritma (sebagian besar algoritma machine learning) dengan data yang tersedia dari domain untuk memecahkan masalah domain terkait.

Gambar 1 Isitilah terkait machine learning

Data Mining adalah bagian dari proses penemuan pengetahuan (knowledge discovery process), dimana penemuan pengetahuan didefinisikan sebagai ilmu untuk menemukan pola dalam set data. Kecerdasan buatan (artificial intelligence) adalah kecerdasan yang ditunjukkan oleh mesin. Dengan kata lain, kecerdasan buatan adalah ilmu untuk mengembangkan sistem atau perangkat lunak dalam meniru perilaku manusia seperti merespon. Dengan demikian, machine learning dapat dianggap sebagai bagian dari kecerdasan buatan. Ketika menganalisis data dalam bisnis, business intelligence didefinisikan sebagai proses teknologi untuk menganalisis data dan menyajikan informasi kemudian ditindaklanjuti untuk membantu eksekutif perusahaan, manajer bisnis dan pengguna akhir lainnya dalam membuat keputusan bisnis yang lebih baik. Dalam profesi data science, seorang ilmuwan data sering terlibat dalam pembersihan dan manipulasi data untuk mendukung pemodelan mereka serta membutuhkan bangunan atau topologi dan mengevaluasi model desain mana yang dimaksudkan

untuk membantu perubahan panduan dalam keputusan bisnis. Di sisi lain, dalam profesi data analytics, analis data yang biasanya melakukan peran migrasi data dan visualisasi yang fokus pada menggambarkan masa lalu. Gambar 2 mengilustrasikan hubungan yang ada antara istilah yang terlibat dalam menggambarkan machine learning.

Gambar 2. Ilustrasi hubungan dalam machine learning

2. Big Data

Big data atau data besar adalah istilah yang berkembang yang menggambarkan volume secara terstruktur, semistructured dan tidak terstruktur kumpulan data yang memiliki potensi untuk ditambang/diolah menjadi informasi. Big data sering dikaitkan dengan 3Vs: kapasitas data extreme (volume), jenis/tipe data (variety), dan kecepatan proses data (velocity).

Dimana, volume berkaitan dengan semua data berasal dari berbagai sumber, seperti catatan penjualan, catatan hasil eksperimen, catatan real-time sensors IoT dan lain-lain. Data-data tersebut dilakukan preprocessed sebelum dilakukan analisa. Data mungkin juga ada di berbagai jenis file, termasuk data terstruktur, seperti SQL - toko database; data tidak terstruktur, seperti file dokumen; atau streaming data dari sensor.

(3)

lalu data penjualan, kembali data dan ulasan data pembeli online untuk produk tersebut.

Akhirnya, velocity mengacu pada kecepatan data yang besar harus dianalisa. Setiap proyek analisis data besar akan menelan, menghubungkan dan menganalisis sumber data, dan kemudian membuat jawaban atau hasil didasarkan pada permintaan menyeluruh. Ini berarti analis manusia harus memiliki pemahaman yang rinci dari data yang tersedia dan memiliki beberapa sense atas apa jawaban yang mereka cari. Velocity juga bermakna, analisis data besar berekspansi ke bidang-bidang seperti machine learning dan artificial intelligence, di mana proses analisis meniru persepsi dengan mencari dan menggunakan pola dalam data yang dikumpulkan. Gambar 3 menunjukkan big data area.

Gambar 3. Big Data area

3. Trend pada Big Data

Konsep big data diperkenalkan kembali pada tahun 2006 ketika Hadoop diciptakan. Namun, minat dalam konsep "Big Data" mencapai puncak antara tahun 2011 dan 2014. Pada 2015, orang-orang mulai melihat artificial intelligence dan machine learning. Saat ini, konsep big data mungkin menjadi topik panas namun tidak banyak peneliti bisa melihat hal-hal yang berjalan di belakang konsep big data.

Dalam rangka untuk mengadopsi teknologi big data, memerlukan proses, anggaran, manajemen proyek, pilot, penyebaran departemen, audit keamanan penuh, dan lain-lain. Semua ini diperlukan dalam rangka untuk memastikan bahwa semua departemen yang terlibat dalam mengadopsi teknologi big data tersebut. Dengan kata lain, itu membutuhkan

interaksi teknologi, orang dan proses. Anda mungkin perlu untuk memperoleh, menyimpan dan membersihkan data, query, menganalisa dan memvisualisasikan data. Beberapa dari proses ini dapat dilakukan dengan mengerahkan algoritma tetapi beberapa membutuhkan intervensi manusia. Semuanya harus terintegrasi mulus. Pada akhirnya, untuk semua konsep big data ini untuk bekerja, seluruh organisasi termasuk semua tingkat manajemen perlu berkomitmen untuk membangun budaya berbasis data berfokus pada konsep big data.

Menerapkan strategi big data yang baik sangat penting untuk menjamin keberhasilan penerapan machine learning untuk mempelajari big data. Sebagai hasilnya, tren di big data juga digambarkan dan didefinisikan berdasarkan lanskap data besar; Infrastruktur, Analytics, Aplikasi, Cross-Infrastruktur/Analytics, Open Source, sumber data dan API, Inkubator, dan sekolah. Gambar 4 mengilustrasikan lanskap big data yang dapat diintegrasikan untuk mengadopsi teknologi big data.

Gambar 4. lanskap big data

4. Open Source Machine Learning

(4)

learning ini yang meliputi SystemML, TensorFlow, GitHub, Trusted Analytics Platform (TAP) dan FAIR. SystemML dirilis oleh IBM, adalah fleksibel, scalable model sistem machine learning. Karakteristik yang membedakan SystemML adalah: Algoritma customizability melalui Bahasa pemrograman seperti R dan Python, multiple execution modes, termasuk Spark MLContext, Spark Batch, Hadoop Batch, Standalone, dan JMLC. Algoritma ini dianggap sebagai optimasi otomatis berdasarkan data dan karakteristik cluster untuk menjamin efisiensi dan skalabilitas.

TensorFlow adalah sistem machine learning terbaru dari Google dan bersifat open source. TensorFlow telah memungkinkan Googlers untuk membangun neural network semakin besar dan pelatihan untuk ribuan core dalam pusat data mereka. Microsoft juga mengumumkan rilis yaitu Distributed Machine Learning Toolkit untuk komunitas pengembang, yang tersedia di GitHub. Toolkit, tersedia sekarang di GitHub, dirancang untuk didistribusikan machine learning menggunakan beberapa komputer secara paralel untuk memecahkan masalah yang kompleks. Ini berisi parameter server-based programing framework, yang membuat tugas machine learning dalam menganalisa big data yang sangat terukur, efisien dan fleksibel. Ini juga berisi dua algoritma pembelajaran mesin didistribusikan, yang dapat digunakan untuk melatih model topik tercepat dan terbesar bahkan model superbesar di dunia.

Intel juga membuat open source yang dinamakan Trusted Analytics Platform, lebih dikenal sebagai TAP. TAP adalah perangkat lunak open source, dioptimalkan untuk kinerja dan keamanan, yang mempercepat penciptaan kolaborasi cloud-native yang diakibatkan oleh analisis big data. TAP memudahkan pengembang dan para data scientist di perusahaan, penyedia layanan cloud, dan system integrator dengan menyediakan layanan bersama, lingkungan yang fleksibel untuk analisis lanjutan di area public and private clouds.

Facebook AI Research (FAIR), dirilis ke open source merupakan modul deep-learning untuk lingkungan pengembangan open source Torch untuk numerik, machine learning, dan computer vision, dengan penekanan khusus pada deep learning dan convolutional nets. Torch banyak digunakan di sejumlah laboratorium akademik seperti di Google/DeepMind, Twitter, NVIDIA, AMD, Intel,

dan banyak perusahaan lainnya. Facebook AI Research (FAIR) juga akan merilis desain server hardware yang telah dioptimalkan dari machine learnig ke open source. Facebook telah mengajukan bahan desain sistem berbasis GPU ke Open Compute Project (OCP).

5. Kesimpulan

Tren besar selama beberapa bulan terakhir dalam analisa big data telah meningkatnya fokus pada artificial intelligence untuk membantu menganalisis sejumlah besar data dan berasal dari berbagai macam tipe data (predictive). Hubungan antara artificial intelligence dan big data adalah begitu dekat sehingga beberapa ahli industri sekarang berpikir bahwa artificial intelligence tidak dapat dipisahkan dengan big data. Pada gilirannya, artificial intelligence sekarang membantu big data memenuhi janjinya.

Dalam banyak hal, kita masih di babak awal dari fenomena big data. Beberapa tahun belakangan ini, membangun infrastruktur untuk menyimpan dan proses data dalam jumlah besar. Artificial intelligence/machine learning sekarang mempercepat kecenderungan munculnya lapisan aplikasi dari big data. Kombinasi big data dan artificial intelligence akan mendorong inovasi yang luar biasa hampir di setiap industri. Dari perspektif itu, kesempatan big data mungkin bahkan lebih besar dari apa yang orang-orang pikirkan.

Big data terus tumbuh dan berkembang, namun, istilah itu sendiri mungkin akan hilang, atau bahkan tak seorang pun akan menggunakannya lagi. Ini adalah nasib ironis teknologi memungkinkan sukses yang mereka menjadi luas, maka di mana-mana, dan akhirnya tak terlihat.

REFERENSI

(5)

[4] Dean, Jared. Big Data, Data Mining, and Machine Learning: Value Creation for Business Leaders and Practitioners. John Wiley & Sons, Inc., Hoboken, New Jersey., 2014.

[5] Fayyad, Usama, Gregory Piatetsky-Shapiro, and Padhraic Smyth. "From Data Mining to Knowledge Discovery in Databases." AI MAGAZINE, 1996, 37-54.

[6] Buchanan, Bruce G. "A (Very) Brief History of Artificial Intelligence." American Association for Artificial Intelligence, 2005.

[7] Marzban, Caren. "Basic Statistics and Basic Ai: Neural Networks." In Artificial Intelligence Methods in the Environmental Sciences. Berlin Heidelberg: © Springer-Verlag Berlin Heidelberg 2009, 2009. [8] Bakhshi, Taimur, and Bogdan Ghita. "On Internet

Traffic Classification: A Two-Phased Machine Learning Approach." Journal of Computer Networks and Communications 2016 (2016): 1-21.

[9] Larose, Daniel T. Data Mining Methods and Models. Canada: © 2006 by John Wiley & Sons, Inc. All rights reserved, 2006.

[10] Russell, Stuart J., and Peter Norvig. Artificial Intelligence a Modern Approach Second Edition. © 2003, 1995 by Pearson Education, Inc. Upper Saddle River, New Jersey 07458, 2003.

[11] What is Data Science?

http://datascience.nyu.edu/what-is-data-science/

[12] What is Data Science?

Gambar

Gambar 2. Ilustrasi hubungan dalam machine learning
Gambar 4

Referensi

Dokumen terkait

Untuk itu penelitian ini bertujuan untuk menganalisa pengaruh citra perusahaan dan promosi terhadap minat nasabah pada produk simpanan idul fitri di BMT Al-Falah Cirebon.. Penelitian

Saat ini DI Baru pengelolaannya dilaksanakan oleh Balai Besar Wilayah Sungai (BBWS) Brantas, Direktorat Jenderal Sumber Daya Air (Ditjen SDA), Kementerian

Variabel yang diamati yaitu mutu benih (daya berkecambah benih, kecepatan berkecambah), pertumbuhan tanaman (tinggi tanaman, jumlah cabang), serta produksi terna (bobot

Pekerjaan tertentu tersebut adalah sebagaimana diatur pada Pasal 59 ayat (1) Undang- undang Nomor 13 Tahun 2003 tentang Ketenagakerjaan yang berbunyi : perjanjian

Joskus maahanmuuttajatausta voi kuitenkin olla erityisten asiakasryhmien parissa työskennellessä tietynlainen rasite: ”(…) huonopuoli siinä oli se että ihmiset

ada pada perbuatan pidana secara subjektif terhadap pembuatnya. Pertanggungjawaban pidana ditentukan berdasarkan pada kesalahan pembuat dan bukan hanya dengan dipenuhinya

Semen, bahan pengikat utama beton yang disorot oleh pemerhati lingkungan sebagai salah industri yang tidak ramah lingkungan oleh karena pembakaran bahan baku semen

Kinerja pemasok-pemasok CV Prisma Raya setelah dianalisis menggunakan kriteria yang digunakan hasilnya menunjukan bahwa Pengaruh dari bagusnya kinerja pemasok untuk