Analitik tertambah

Revisi sejak 5 April 2019 16.43 oleh Rosa Reska Riskiana (bicara | kontrib) (Sejarah Perkembangan Platform Analitik)

Analitik tertambah (bahasa Inggris: augmented analytics) adalah sebuah pendekatan yang menggunakan pembelajaran mesin (machine learning) dan pemrosesan bahasa alami (Natural Language Processing) untuk mengotomatisasikan data analytic, data sharing, dan business intelligence . Konsep Augmented Intelligence yang merupakan konsep menyeluruh dari Augmented Analytic pertama kali diperkenalkan oleh perusahaan riset Gartner, dalam edisi "Hype Cycle for Emerging Technologies" pada tahun 2017. Penggunaan pemelajaran mesin dan NLP memberikan alat bagi Augmented Analytic yang memiliki kemampuan untuk memahami dan berinteraksi dengan data secara organik serta memperhatikan tren yang penting atau tidak biasa. Data analytic sendiri merupakan konsep yang sangat kompleks dan membutuhkan data scientist untuk mengekstrak nilai apapun dari big data. Diperkirakan seorang data scientist dapat menghabiskan 80% waktunya untuk mengumpulkan, mempersiapkan dan membersihkan data. Di sinilah Augmented Analytic dapat diimplementasikan, dengan bantuan pemelajaran mesin pada data analytics, waktu yang dihabiskan untuk mengumpulkan dan mempersiapkan data dapat diselesaikan dengan cepat, secara otomatis, dan dengan error yang lebih sedikit sehingga data scientist dapat menghabiskan lebih banyak waktu dalam mencari pengetahuan mendalam yang dapat ditindaklajuti[1].

Definisi

Augmented Analytics mencakup:

  • Persiapan data tertambah (Augmented data preparation), yang menggunakan otomatisasi pemelajaran mesin untuk menambah profil dan kualitas data, harmonisasi, pemodelan, manipulasi, pengayaan, pengembangan dan katalogisasi metadata [2].
  • Penemuan data tertambah (Augmented data discovery, yang sebelumnya disebut "smart data discovery"), yang memungkinkan pebisnis dan data scientist menggunakan pemelajaran mesin untuk secara otomatis menemukan, membayangkan, dan menceritakan penemuan yang relevan (seperti korelasi, pengecualian, penyaringan, hubungan dan prediksi) tanpa membuat model atau menulis algoritma. Pengguna menjelajah data menggunakan visualisasi, teknologi pencarian dan bahasa alami, didukung oleh narasi yang dihasilkan oleh bahasa alami untuk interpretasi hasil. Hasil tersebut dapat dianalisis oleh data scientist tanpa gagasan yang terbentuk sebelumnya untuk pembuatan prototipe awal dan pengembangan hipotesis dengan eksperimen yang tidak terlalu manual. Oleh karena itu, data scientists dapat memiliki banyak waktu untuk fokus membangun dan mengoperasikan model yang relevan [2].
  • Ilmu data tertambah (Augmented data science) dan Pemelajaran Mesin (Machine Learning), yang mengotomatisasikan aspek kunci dari pemodelan analitik lanjutan seperti pemilihan fitur. Hal ini mengurangi kebutuhan akan keterampilan khusus untuk menghasilkan, mengoperasikan, dan mengelola model analitik lanjutan [2].

Sejarah Perkembangan Platform Analitik

Platform Berbasis Lapisan Semantik (~1990 sampai dengan ~2000)

Konsep lapisan semantik awalnya dipatenkan oleh Business Objects pada tahun 1991 dan berhasil ditantang oleh Microstrategy pada tahun 2003 [3]. Lapisan semantik merupakan representasi bisnis dari data perusahaan yang dapat membantu pengguna mengakses data secara mandiri menggunakan istilah bisnis umum. Dengan lapisan semantik, data kompleks dapat dipetakan menjadi istilah bisnis yang familiar seperti, produk, konsumen, atau keuntungan untuk menyediakan tampilan terpadu atau gabungan data dari seluruh organisasi. Istilah bisnis tersebut disimpan sebagai objek pada lapisan semantik yang diakses melalui business view. Business Views adalah sistem multi-tier yang dirancang untuk memungkinkan perusahaan membangun objek bisnis yang komprehensif dan spesifik yang membantu perancang laporan dan pengguna mengakses informasi yang mereka butuhkan. Business views dimaksudkan untuk memungkinkan orang menambahkan konteks bisnis yang diperlukan ke data island mereka dan menautkannya ke dalam sebuah business views yang terorganisir dalam organisasi mereka [4].

Platform Penemuan Data Berbasis Visual (~2000 sampai dengan ~2015)

Selama 10 tahun terakhir, platform penemuan data berbasis visual ini sudah mengacaukan pasar BI tradisional. Alat yang mudah digunakan ini memungkinkan pengguna untuk mengumpulkan data secara cepat, memeriksa hipotesis secara visual, dan menemukan wawasan baru pada sebuah data. Platform ini mengubah bagaimana pengguna bisnis mengeksplorasi data dibandingkan dengan lapisan semantik yang berpusat pada IT. Walaupun demikian, banyak aktivitas terkait dengan persiapan data, penemuan pola dalam data yang kompleks dan berbagi wawasan tetap manual dan cenderung bias [2].

Walaupun alat penemuan data berbasis visual ini mudah digunakan, karena pengguna menganalisa data secara manual dengan membuat queries untuk menginvestigasi hipotesis, hal ini tidak memungkinkan bagi mereka untuk menemukan semua pola dan kombinasi yang mungkin, seperti apakah temuan mereka adalah yang paling relevan, signifikan dan dapat ditindaklanjuti. Bergantung pada pengguna bisnis untuk menemukan pola secara manual dapat mengakibatkan mereka bias pada hipotesis mereka sendiri, kehilangan temuan yang penting, dan menarik kesimpulan mereka sendiri yang salah atau tidak lengkap, yang dapat mempengaruhi keputusan hasil [2].

Visualisasi merupakan cara yang ampuh untuk menemukan dan mengkomunikasikan pola dalam data (lebih dari tabel atau daftar). Namun, visualiasi tidak selalu menyoroti temuan yang signifikan secara statistik. Untuk itu, diperlukan interpretasi pengguna atau analisis statistik lebih lanjut untuk menentukan apakah temuan tersebut relevan, signifikan, dan dapat ditindaklanjuti. Terlebih lagi, menemukan wawasan dari analitik lanjut memerlukan keahlian dari ilmuwan data yang sangat langka [2].

Augmented Analytics (~2015 sampai saat ini)

Pada platform penemuan data berbasis visual, eksplorasi manual interaktif menggunakan visualiasi merupakan fitur pendefinisinya. Sedangkan, pada augmented analytics, otomatisasi pembelajaran mesin pada penemuan wawasan dan proses eksplorasi merupakan fitur pendefinisinya. Alat tersebut memungkinkan pengguna dan ilmuwan data untuk menemukan , memvisualisasikan, dan menarasikan temuan yang relevan, seperti korelasi, pengecualian, pengelompokan, dan prediksi secara otomatis tanpa harus membangun model atau menulis algoritma. Pengguna mengeksplorasi data melalui visualisasi, teknologi pencarian dan natural language query, didukung oleh narasi dan interpretasi yang dihasilkan oleh bahasa alami berbasis teks dan suara, atau temuan yang paling penting secara statistik dalam konteks pengguna [2].

Augmented analytic dapat mengurangi waktu eksplorasi dan identifikasi dari wawasan yang salah atau kurang relevan. Menerapkan berbagai algoritma dan pembelajaran data secara paralel dan menjelaskan temuan yang dapat ditindaklanjuti kepada pengguna, mengurangi risiko hilangnya wawasan penting dalam data, dibandingkan dengan eksplorasi manual. Hal ini juga mengoptimalkan keputusan dan tindakan yang dihasilkan. Pergeseran paradigma ini membutuhkan investasi dalam literasi data di seluruh organisasi karena wawasan ini akan didistribusikan ke semua karyawan [2].

Catatan kaki

  1. ^ "What is augmented analytics? - Definition from WhatIs.com". WhatIs.com (dalam bahasa Inggris). Diakses tanggal 2019-04-04. 
  2. ^ a b c d e f g h "Gartner Data & Analytics Summit 2019 | Sydney, Australia". Gartner (dalam bahasa Inggris). Diakses tanggal 2019-04-04. 
  3. ^ "What is a Semantic Layer? Why Would You Want One? | AtScale". www.atscale.com. Diakses tanggal 2019-04-05. 
  4. ^ "Semantic layer". Wikipedia (dalam bahasa Inggris). 2018-05-10.