Revisi per 1 Februari 2021 17.00 sunting InternetArchiveBot (bicara \| kontrib) Bot 695.973 suntingan Rescuing 2 sources and tagging 1 as dead.) #IABot (v2.0.8 ← Revisi sebelumnya		Revisi per 23 Juni 2021 06.50 sunting balikkan HsfBot (bicara \| kontrib) Bot 1.172.010 suntingan k v2.04b - Fixed using Wikipedia:ProyekWiki Cek Wikipedia (Tanda baca setelah kode "<nowiki></ref></nowiki>") Tag: WPCleaner Revisi selanjutnya →
Baris 13: === Platform Penemuan Data Berbasis Visual === Penemuan data (''data discovery'') adalah proses untuk mendeteksi pola dan outlier dengan menavigasi data secara visual atau menerapkan analitik tingkat tinggi dengan panduan. Penemuan data adalah proses yang berulang yang tidak memerlukan pembuatan model di awal .<ref>{{Cite web\|url=https://bi-survey.com/data-discovery\|title=Data Discovery: what it is, why it matters and what tools are used\|website=BI Survey\|language=en-US\|access-date=2019-04-06}}</ref>. Selama 10 tahun terakhir, platform penemuan data berbasis [[Visualisasi data\|visual]] ini sudah mengacaukan pasar BI tradisional. Alat yang mudah digunakan ini memungkinkan pengguna untuk mengumpulkan data secara cepat, memeriksa [[hipotesis]] secara visual, dan menemukan wawasan baru pada sebuah data. Platform ini mengubah bagaimana pengguna bisnis mengeksplorasi data dibandingkan dengan lapisan semantik yang berpusat pada IT. Walaupun demikian, banyak aktivitas terkait dengan persiapan data, penemuan pola dalam data yang kompleks dan berbagi wawasan tetap manual dan cenderung bias .<ref name=":0" />. Walaupun alat penemuan data berbasis visual ini mudah digunakan, karena pengguna menganalisis data secara manual dengan membuat ''[[Bahasa kueri\|queries]]'' untuk menginvestigasi hipotesis, hal ini tidak memungkinkan bagi mereka untuk menemukan semua pola dan kombinasi yang mungkin, seperti apakah temuan mereka adalah yang paling relevan, signifikan dan dapat ditindaklanjuti. Bergantung pada pengguna bisnis untuk menemukan pola secara manual dapat mengakibatkan mereka bias pada hipotesis mereka sendiri, kehilangan temuan yang penting, dan menarik kesimpulan mereka sendiri yang salah atau tidak lengkap, yang dapat mempengaruhi keputusan dan hasil .<ref name=":0" />. Visualisasi merupakan cara yang ampuh untuk menemukan dan mengkomunikasikan pola dalam data (lebih dari tabel atau daftar). Namun, visualiasi tidak selalu menyoroti temuan yang signifikan secara statistik. Untuk itu, diperlukan interpretasi pengguna atau analisis statistik lebih lanjut untuk menentukan apakah temuan tersebut relevan, signifikan, dan dapat ditindaklanjuti. Terlebih lagi, menemukan wawasan dari analitik lanjut memerlukan keahlian dari ''data scientist'' yang sangat langka .<ref name=":0" />. === ''Augmented Analytics'' === Pada platform penemuan data berbasis visual, eksplorasi manual interaktif menggunakan visualiasi merupakan fitur pendefinisinya. Sedangkan, pada ''augmented analytics'', otomatisasi pembelajaran mesin pada penemuan wawasan dan proses eksplorasi merupakan fitur pendefinisinya. Alat tersebut memungkinkan pengguna dan ''data scientist'' untuk menemukan, memvisualisasikan, dan menarasikan temuan yang relevan, seperti korelasi, pengecualian, pengelompokan, dan prediksi secara otomatis tanpa harus membangun model atau menulis [[Algoritme\|algoritma]]. Pengguna mengeksplorasi data melalui visualisasi, teknologi pencarian dan ''natural language query'', didukung oleh narasi dan interpretasi yang dihasilkan oleh bahasa alami berbasis teks dan suara, atau temuan yang paling penting secara statistik dalam konteks pengguna .<ref name=":0" />. ''Augmented analytic'' dapat mengurangi waktu eksplorasi dan identifikasi wawasan yang salah atau kurang relevan. Menerapkan berbagai algoritma dan pembelajaran data secara paralel dan menjelaskan temuan yang dapat ditindaklanjuti kepada pengguna, mengurangi risiko hilangnya wawasan penting dalam data, dibandingkan dengan eksplorasi manual. Hal ini juga mengoptimalkan keputusan dan tindakan yang dihasilkan. Pergeseran paradigma ini membutuhkan investasi dalam literasi data di seluruh organisasi karena wawasan ini akan didistribusikan ke semua karyawan .<ref name=":0" />. == Alur Kerja ''Augmented Analytic'' == Saat ini, dalam bidang analitik, ''data scientist'' ataupun analis melakukan aktivitas berulang yg terdiri dari: menyiapkan data, menemukan pola pada data dan membangun model, membagi dan mengoperasikan penemuan dari data. Pendekatan ''augmented analytics'' mempercepat waktu yang diperlukan untuk mendapatkan wawasan akurat bagi pengguna bisnis dan menambah analisis mereka menggunakan algoritma pembelajaran mesin untuk mengotomatisasikan 3 proses analitik utama yang saat ini digunakan pada platform penemuan data berbasis visual .<ref name=":0" />. === Menyiapkan Data ''(Augmented Data preparation)'' === Persiapan data pada ''augmented analytics'' menggunakan algoritma untuk menemukan hubungan pada data, mendeskripsikan dan merekomendasikan pendekatan yang paling baik untuk membersikan, menyesuaikan, memperkaya, memanipulasi, dan memodelkan data dengan kemampuan untuk menangkap metadata dan garis turunan agar dapat digunakan kembali dan dikelola .<ref name=":0" />. === Menemukan pola pada data ''(Augmented Data Discovery)'' === Daripada analis secara manual menguji semua kombinasi data, maka diimplementasikan secara otomatis algoritma untuk mendeteksi korelasi, segmen, kelompok, outlier, dan relasi pada ''augmented analytics''. Hanya hasil yang paling signifikan dan relevan secara statistiklah yang akan ditampilkan pada pengguna dalam bentuk visualisasi cerdas yang dioptimalkan untuk interpretasi pengguna. Menerapkan berbagai algoritma pada data secara paralel mengurangi risiko akan kehilangan wawasan yang penting pada data. Kebanyakan, platform penemuan data membuat model dasar terbuka untuk diinspeksi, diuji, dan divalidasi oleh ''data scientist'' spesialis. Hal ini penting untuk membangun kepercayaan dan memastikan keakuratan dari wawasan yang dihasilkan secara otomatis .<ref name=":0" />. Otomatisasi pembelajaran mesin juga memasuki platform ilmu data (''[[:en:Data science\|data science]]'') untuk mempersingkat proses pembuatan fitur dan model. Pengguna dari ''augmented data discovery'' adalah orang bisnis atau ''citizen data scientist'', dan luarannya adalah wawasan (baik visual maupun narasi dalam bahasa alami), sedangkan luaran dari ilmu data cerdas (''smart data science'') adalah model dan penggunanya adalah pakar ''data scientist'' . Tujuannya adalah untuk membuat ''data scientist'' spesialis lebih produktif dan model yang mereka buat tidak bias. Mengingat kelangkaan dari pakar ''data scientist'' dan permintaan yang semakin meningkat akan keterampilan mereka, diharapkan produktivitas yang lebih tinggi dan lebih banyak pekerjaan analitik perlu dilakukan oleh kelas ''data scientist'' baru juga.<ref name=":0" />. ''Augmented data discovery'' dan a''ugmented data science'', serta pembelajaran mesin sama-sama mengurangi waktu eksplorasi dan identifikasi wawasan yang salah atau tidak relevan. Diperlukan proses kolaborasi antara keduanya untuk memfokuskan analis bisnis pada hal yang penting dan memberikan prototipe awal pada ''data scientist'' untuk mengeksplorasi dan mengoperasionalkan model untuk pola yang relevan saja. Baik analis dan ''data scientist'' menjadi lebih produktif dengan mengurangi fase eksperimen dan eksplorasi awal. Hal ini berdampak pada waktu yang lebih cepat untuk menghasilkan wawasan dan mengambil tindakan.<ref name=":0" />. ==== Perbedaan antara Platform ''Augmented Data Discovery'' dan ''Augmented Data Science'' ==== Platform ''augmented data discovery'' memberikan wawasan pada ''citizen data scientist''. Sebuah model dihasilkan dan dapat ditanamkan pada aplikasi, setelah pemeriksaan lanjut oleh ''data scientist'' spesialis. Namun, sasaran atau luarannya adalah wawasan. ''[https://docs.oracle.com/cd/E23507_01/Search.20073/ATGSearchQueryRef/html/s0202naturallanguagequeries01.html Natural Language Query]'' (NLQ) dan ''[[:en:Natural-language generation\|Natural Language Generation]]'' (NLG) merupakan fitur pengalaman pengguna yang penting. Sebaliknya, platform ''augmented data science'', secara otomatis menghasilkan model baik bagi ''citizen data scientist'' maupun ''data scientist'' spesialis atau untuk ditanamkan. Platform ini membantu membangun model, mengelola siklus hidup, dan tata kelola. Perbedaan antara kedua platform hampir tidak kentara dan menyempit ke sebuah titik di mana konvergensi yang lebih besar mungkin terjadi .<ref name=":0" />. ==== Perbedaan antara Augmented Data Discovery dan Smart Visualization ==== Baris 44: === Membagi dan mengoperasikan temuan dari data ''(Sharing and Operationalizing Findings from Data)'' === Platform BI modern dan analitik telah membuat kemajuan yang signifikan dengan cara membuat visualisasi dari data pada ''dashboard'' atau ''storyboard'' interaktif dan memberikan kapabilitas untuk membantu dalam hal berbagi dan bersosialisasi mengenai temuan yang didapat. Namun, visualisasi sering kali mengaburkan apa yang benar-benar signifikan dari sebuah data dan banyak pengguna tidak memiliki kemampuan untuk sepenuhnya menginterpretasikan wawasan berbasis visual yang signifikan secara statistik. Dengan penambahan bahasa alami, platform ''augmented data discovery'' secara otomatis menyajikan temuan melalui narasi secara tertulis atau lisan, bersama dengan visualisasi yang memberi tahu pengguna tentang apa yang paling penting bagi mereka untuk ditindaklanjuti.<ref name=":0" />. == Contoh Implementasi == Baris 51: ==== ''Data Preparation'' ==== Sebuah perusahaan penghasil penganan, makanan hewan, dan produk makanan lainnya berhasil mengurangi kebutuhan persiapan data, dari 5 orang dalam 5 minggu, menjadi 1 orang dalam 1 jam dan memungkinkan perubahan data hanya dalam 1 kali klik. Sebelumnya, perusahaan ini memakan waktu selama 5 minggu dengan pekerja sebanyak 5 orang untuk mengakses, membersihkan, mencampurkan, menyelaraskan, memodelkan, dan menyesuaikan [[:en:Point of sale\|Point of Sale]] retailnya, data [[Nielsen]], kalkulasi harga, dan data kategori/jenisnya. Perusahaan tersebut ingin menganalisis kinerja dari kategori [[:en:Granular material\|granular]] musiman dan non-musiman di semua lini dan merek. Hal ini membutuhkan persiapan dan pencampuran data otomatis, sehingga pembuat keputusan bisnis dapat melihat wawasan segera setelah sumber data diperbarui. Perusahaan ini menggunakan [https://www.clearstorydata.com/ ClearStory Data] {{Webarchive\|url=https://web.archive.org/web/20190502041000/https://www.clearstorydata.com/ \|date=2019-05-02 }} untuk menjalankan algoritma untuk menunjukkan skor yang cocok untuk menyelaraskan sumber data. Algoritme tersebut juga menghasilkan informasi detil berdasarkan setiap nilai data dan setiap nilai kategori yang unik yang ditemukan pada kategori khusus dengan kesimpulan semantik berdasarkan semua detil konten (tidak hanya nama dari label kolom). Banyak vendor juga membuat profil data untuk masalah kualitas dan memberikan rekomendasi kepada pengguna mengenai cara meningkatkan kualitas data .<ref name=":0" />. === Bidang Kesehatan === ==== ''Data Discovery'' ==== Untuk seorang pasien muda penderita [[apendisitis]], perawatan tergantung pada satu pertanyaan: Apakah [[Umbai cacing\|apendiks]] telah meletus? Jika sudah, perawatan konservatif perlu dipertimbangkan. Jika belum, operasi harus segera dilakukan dengan tujuan membuang apendiks sebelum meletus. Maka dari itu, sangat penting bagi dokter untuk memiliki cara yang cepat dan dapat diandalkan untuk menentukan apakah apendiks seorang pasien muda sudah meletus atau belum. Untuk menentukan kondisi dari apendix, digunakanlah [[Tomografi terkomputasi\|CT scan]] dikarenakan tingkat akurasi dalam membedakan antara apendisitis perforasi dan non perforasi pada pasien muda. Namun, CT scan melibatkan sejumlah radiasi yang berpotensi membahayakan pasien muda. [[:en:Eureqa\|Eureqa]] milik [https://www.datarobot.com/news/datarobot-acquires-nutonian/ DataRobot Nutonian] menemukan parameter yang berkorelasi kuat dengan perforasi dan mengungkapkan pentingnya 2 kategori dalam variabel usia. Hal ini mengarah ke sebuah formula yang aplikasinya memberikan [[Ultrasonografi medis\|USG]] tingkat akurasi diagnostik yang sama dengan CT scan pada pasien anak. Sebagai hasilnya, dokter dapat mendiagnosa perforasi apendisitis dengan hanya menggunakan USG saja di beberapa kasus, dengan demikian hal tersebut mengurangi jumlah kasus yang membutuhkan paparan ke radiasi yang berpotensi membahayakan pada CT scan.<ref name=":0" />. ==== ''Data sharing'' ==== Vendor analitik kesehatan mengembangkan platform paten di atas [https://www.qlik.com/us/products/qlik-sense QlikSense] untuk membantu pembayar dan penyedia layanan untuk memvisualisasikan datanya, sehingga mereka dapat memahami kelompok populasi pasar mereka, melacak kemajuan, dan menilai kinerja. Namun, pengguna tanpa kemampuan analitik tingkat lanjut mengalami kesulitan dalam memahami dan menginterpretasi visualisasi tersebut. Vendor mengintegrasikan [https://optimalbi.com/blog/2017/07/12/narratives-for-qlik-natural-language-generation/ Narratives for Qlik] ke dalam platform analitiknya, menyesuaikan bahasa sesuai dengan domainnya. Dengan NLG dan visualisasi interaktif, pembayar dan penyedia layanan sekarang dapat segera memahami apakah tingkat pengembalian berkorelasi dengan hasil dengan kualitas tinggi, sambil mengkomunikasikan penghematan bersama dan tren dalam tingkat pengembalian.<ref name=":0" />. == Resiko ==

Analitik tertambah: Perbedaan antara revisi