Analitik tertambah: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
HsfBot (bicara | kontrib)
k v2.04b - Fixed using Wikipedia:ProyekWiki Cek Wikipedia (Tanda baca setelah kode "<nowiki></ref></nowiki>")
k lck
Baris 1:
{{Rapikan}}'''Analitik tertambah''' ([[bahasa Inggris]]: ''augmented analytics'') adalah sebuah pendekatan yang menggunakan [[pembelajaran mesin]] ''(machine learning'') dan [[pemrosesan bahasa alami]] (''Natural Language Processing'') untuk mengotomatisasikan ''data analytic'', ''data sharing'', dan ''[[business intelligence]]''. Konsep ''Augmented Intelligence'' yang merupakan konsep menyeluruh dari ''Augmented Analytic'' pertama kali diperkenalkan oleh perusahaan riset Gartner, dalam edisi "''Hype Cycle for Emerging Technologies''" pada tahun 2017. Penggunaan pemelajaran mesin dan NLP memberikan alat bagi ''Augmented Analytic'' yang memiliki kemampuan untuk memahami dan berinteraksi dengan data secara organik serta memperhatikan tren yang penting atau tidak biasa. ''Data analytic'' sendiri merupakan konsep yang sangat kompleks dan membutuhkan ''data scientist'' untuk mengekstrak nilai apapun dari ''[[big data]]''. Diperkirakan seorang [[:en:Data science|data scientist]] dapat menghabiskan 80% waktunya untuk mengumpulkan, mempersiapkan dan membersihkan data. Di sinilah ''Augmented Analytic'' dapat diimplementasikan, dengan bantuan pemelajaran mesin pada ''data analytics'', waktu yang dihabiskan untuk mengumpulkan dan mempersiapkan data dapat diselesaikan dengan cepat, secara otomatis, dan dengan error yang lebih sedikit sehingga ''data scientist'' dapat menghabiskan lebih banyak waktu dalam mencari pengetahuan mendalam yang dapat ditindaklajuti.<ref>{{Cite web|url=https://whatis.techtarget.com/definition/augmented-analytics|title=What is augmented analytics? - Definition from WhatIs.com|website=WhatIs.com|language=en|access-date=2019-04-04}}</ref>
 
== Definisi ==
Baris 10:
 
=== Platform Berbasis Lapisan Semantik ===
Data perusahaan sering kali disimpan di dalam basis data relasional dan server OLAP. Data tersebut mengandung informasi penting, namun tidak dalam bentuk yang dapat memudahkan pengguna menjawab pertanyaan bisnis. Konsep [[:en:Semantic layer|lapisan semantik]] awalnya dipatenkan oleh Business Objects pada tahun 1991 dan berhasil ditantang oleh Microstrategy pada tahun 2003.<ref>{{Cite web|url=https://www.atscale.com/blog/what-is-a-semantic-layer-why-would-i-want-one|title=What is a Semantic Layer? Why Would You Want One? {{!}} AtScale|website=www.atscale.com|access-date=2019-04-05}}</ref> Lapisan semantik merupakan representasi bisnis dari data perusahaan yang dapat membantu pengguna mengakses data secara mandiri menggunakan istilah bisnis umum. Dengan lapisan semantik, data kompleks dapat dipetakan menjadi istilah bisnis yang familiar seperti, produk, konsumen, atau keuntungan untuk menyediakan tampilan terpadu atau gabungan data dari seluruh organisasi. Istilah bisnis tersebut disimpan sebagai objek pada lapisan semantik yang diakses melalui ''business view.'' ''Business Views'' adalah sistem ''multi-tier'' yang dirancang untuk memungkinkan perusahaan membangun objek bisnis yang komprehensif dan spesifik yang membantu perancang laporan dan pengguna mengakses informasi yang mereka butuhkan. ''Business views'' dimaksudkan untuk memungkinkan orang menambahkan konteks bisnis yang diperlukan ke [[:en:Data island|data island]] mereka dan menautkannya ke dalam sebuah ''business views'' yang terorganisir dalam organisasi mereka.<ref>{{Cite journal|date=2018-05-10|title=Semantic layer|url=https://en.wiki-indonesia.club/w/index.php?title=Semantic_layer&oldid=840595427|journal=Wikipedia|language=en}}</ref>
 
=== Platform Penemuan Data Berbasis Visual ===
Baris 33:
Daripada analis secara manual menguji semua kombinasi data, maka diimplementasikan secara otomatis algoritma untuk mendeteksi korelasi, segmen, kelompok, outlier, dan relasi pada ''augmented analytics''. Hanya hasil yang paling signifikan dan relevan secara statistiklah yang akan ditampilkan pada pengguna dalam bentuk visualisasi cerdas yang dioptimalkan untuk interpretasi pengguna. Menerapkan berbagai algoritma pada data secara paralel mengurangi risiko akan kehilangan wawasan yang penting pada data. Kebanyakan, platform penemuan data membuat model dasar terbuka untuk diinspeksi, diuji, dan divalidasi oleh ''data scientist'' spesialis. Hal ini penting untuk membangun kepercayaan dan memastikan keakuratan dari wawasan yang dihasilkan secara otomatis.<ref name=":0" />
 
Otomatisasi pembelajaran mesin juga memasuki platform ilmu data (''[[:en:Data science|data science]]'') untuk mempersingkat proses pembuatan fitur dan model. Pengguna dari ''augmented data discovery'' adalah orang bisnis atau ''citizen data scientist'', dan luarannya adalah wawasan (baik visual maupun narasi dalam bahasa alami), sedangkan luaran dari ilmu data cerdas (''smart data science'') adalah model dan penggunanya adalah pakar ''data scientist'' . Tujuannya adalah untuk membuat ''data scientist'' spesialis lebih produktif dan model yang mereka buat tidak bias. Mengingat kelangkaan dari pakar ''data scientist'' dan permintaan yang semakin meningkat akan keterampilan mereka, diharapkan produktivitas yang lebih tinggi dan lebih banyak pekerjaan analitik perlu dilakukan oleh kelas ''data scientist'' baru juga.<ref name=":0" />
 
''Augmented data discovery'' dan a''ugmented data science'', serta pembelajaran mesin sama-sama mengurangi waktu eksplorasi dan identifikasi wawasan yang salah atau tidak relevan. Diperlukan proses kolaborasi antara keduanya untuk memfokuskan analis bisnis pada hal yang penting dan memberikan prototipe awal pada ''data scientist'' untuk mengeksplorasi dan mengoperasionalkan model untuk pola yang relevan saja. Baik analis dan ''data scientist'' menjadi lebih produktif dengan mengurangi fase eksperimen dan eksplorasi awal. Hal ini berdampak pada waktu yang lebih cepat untuk menghasilkan wawasan dan mengambil tindakan.<ref name=":0" />
 
==== Perbedaan antara Platform ''Augmented Data Discovery'' dan ''Augmented Data Science'' ====
Platform ''augmented data discovery'' memberikan wawasan pada ''citizen data scientist''. Sebuah model dihasilkan dan dapat ditanamkan pada aplikasi, setelah pemeriksaan lanjut oleh ''data scientist'' spesialis. Namun, sasaran atau luarannya adalah wawasan. ''[https://docs.oracle.com/cd/E23507_01/Search.20073/ATGSearchQueryRef/html/s0202naturallanguagequeries01.html Natural Language Query]'' (NLQ) dan ''[[:en:Natural-language generation|Natural Language Generation]]'' (NLG) merupakan fitur pengalaman pengguna yang penting. Sebaliknya, platform ''augmented data science'', secara otomatis menghasilkan model baik bagi ''citizen data scientist'' maupun ''data scientist'' spesialis atau untuk ditanamkan. Platform ini membantu membangun model, mengelola siklus hidup, dan tata kelola. Perbedaan antara kedua platform hampir tidak kentara dan menyempit ke sebuah titik di mana konvergensi yang lebih besar mungkin terjadi.<ref name=":0" />
 
==== Perbedaan antara Augmented Data Discovery dan Smart Visualization ====
Baris 51:
 
==== ''Data Preparation'' ====
Sebuah perusahaan penghasil penganan, makanan hewan, dan produk makanan lainnya berhasil mengurangi kebutuhan persiapan data, dari 5 orang dalam 5 minggu, menjadi 1 orang dalam 1 jam dan memungkinkan perubahan data hanya dalam 1 kali klik. Sebelumnya, perusahaan ini memakan waktu selama 5 minggu dengan pekerja sebanyak 5 orang untuk mengakses, membersihkan, mencampurkan, menyelaraskan, memodelkan, dan menyesuaikan [[:en:Point of sale|Point of Sale]] retailnya, data [[Nielsen]], kalkulasi harga, dan data kategori/jenisnya. Perusahaan tersebut ingin menganalisis kinerja dari kategori [[:en:Granular material|granular]] musiman dan non-musiman di semua lini dan merek. Hal ini membutuhkan persiapan dan pencampuran data otomatis, sehingga pembuat keputusan bisnis dapat melihat wawasan segera setelah sumber data diperbarui. Perusahaan ini menggunakan [https://www.clearstorydata.com/ ClearStory Data] {{Webarchive|url=https://web.archive.org/web/20190502041000/https://www.clearstorydata.com/ |date=2019-05-02 }} untuk menjalankan algoritma untuk menunjukkan skor yang cocok untuk menyelaraskan sumber data. Algoritme tersebut juga menghasilkan informasi detil berdasarkan setiap nilai data dan setiap nilai kategori yang unik yang ditemukan pada kategori khusus dengan kesimpulan semantik berdasarkan semua detil konten (tidak hanya nama dari label kolom). Banyak vendor juga membuat profil data untuk masalah kualitas dan memberikan rekomendasi kepada pengguna mengenai cara meningkatkan kualitas data.<ref name=":0" />
 
=== Bidang Kesehatan ===
 
==== ''Data Discovery'' ====
Untuk seorang pasien muda penderita [[apendisitis]], perawatan tergantung pada satu pertanyaan: Apakah [[Umbai cacing|apendiks]] telah meletus? Jika sudah, perawatan konservatif perlu dipertimbangkan. Jika belum, operasi harus segera dilakukan dengan tujuan membuang apendiks sebelum meletus. Maka dari itu, sangat penting bagi dokter untuk memiliki cara yang cepat dan dapat diandalkan untuk menentukan apakah apendiks seorang pasien muda sudah meletus atau belum. Untuk menentukan kondisi dari apendix, digunakanlah [[Tomografi terkomputasi|CT scan]] dikarenakan tingkat akurasi dalam membedakan antara apendisitis perforasi dan non perforasi pada pasien muda. Namun, CT scan melibatkan sejumlah radiasi yang berpotensi membahayakan pasien muda. [[:en:Eureqa|Eureqa]] milik [https://www.datarobot.com/news/datarobot-acquires-nutonian/ DataRobot Nutonian] menemukan parameter yang berkorelasi kuat dengan perforasi dan mengungkapkan pentingnya 2 kategori dalam variabel usia. Hal ini mengarah ke sebuah formula yang aplikasinya memberikan [[Ultrasonografi medis|USG]] tingkat akurasi diagnostik yang sama dengan CT scan pada pasien anak. Sebagai hasilnya, dokter dapat mendiagnosa perforasi apendisitis dengan hanya menggunakan USG saja di beberapa kasus, dengan demikian hal tersebut mengurangi jumlah kasus yang membutuhkan paparan ke radiasi yang berpotensi membahayakan pada CT scan.<ref name=":0" />
 
==== ''Data sharing'' ====