Visualisasi data

Ilmu dan seni menyajikan data dalam bentuk visual
Revisi sejak 15 Desember 2014 08.51 oleh Sulhan (bicara | kontrib) (Terminologi: Perbaikan kalimat.)

Visualisasi data dilihat oleh banyak bidang ilmu sebagai komunikasi visual modern. Visualisasi data tidak berada di bawah bidang manapun, melainkan interpretasi di antara banyak bidang (misalnya, terkadang dilihat sebagai cabang modern dari statistik deskriptif oleh beberapa orang, tapi juga sebagai dasar alat pengembangan oleh yang lain). Visualisasi data mengikutkan pembuatan dan kajian dari representasi visual dari data, artinya "informasi yang telah diabstraksikan dalam bentuk skematis, termasuk atribut atau variabel dari unit informasi". [1]

Tujuan utama dari visualisasi data adalah untuk mengkomunikasikan informasi secara jelas dan efisien kepada pengguna lewat grafik informasi yang dipilih, seperti tabel dan grafik. Visualisasi yang efektif membantu pengguna dalam menganalisa dan penalaran tentang data dan bukti. Ia membuat data yang kompleks bisa diakses, dipahami dan berguna. Pengguna bisa melakukan pekerjaan analisis tertentu, seperti melakukan pembandingan atau memahami kausalitas, dan prinsip perancangan dari grafik (contohnya, memperlihatkan perbandingan atau kausalitas) mengikuti pekerjaan tersebut. Tabel pada umumnya digunakan saat pengguna akan melihat ukuran tertentu dari sebuah variabel, sementara grafik dari berbagai tipe digunakan untuk melihat pola atau keterkaitan dalam data untuk satu atau lebih variabel.

Visualisasi data adalah seni dan sains. Laju di mana data dikeluarkan telah meningkat, dipicu oleh meningkatnya ekonomi berbasis informasi. Data yang dibuat oleh aktivitas internet dan sejumlah sensor yang makin bertambah dalam lingkungan, seperti satelit dan kamera jalan, disebut sebagai "Big data". Pemrosesan, analisa dan mengkomunikasikan data tersebut menciptakan berbagai tantangan analisis bagi visualisasi data. Bidang ilmu data dan pelakunya yang disebut ilmuwan data telah muncul untuk membantu mengatasi tantangan tersebut.

Gambaran Umum

 
Visualisasi data adalah salah satu langkah dalam menganalisa data dan menyajikannya ke pengguna.

Visualisasi data mengacu pada teknik yang digunakan untuk mengkomunikasi data atau informasi dengan membuatnya sebagai objek visual (misalnya, titik, garis, atau batang) dalam grafik. Tujuannya yaitu untuk mengkomunikasikan informasi secara jelas dan efisien kepada pengguna. Ia merupakan salah satu tahap dalam analisis data atau ilmu data. Menurut Friedman (2008) "tujuan utama dari visualisasi data adalah untuk mengkomunikasikan informasi secara jelas dan efektif dengan cara grafis. Bukan berarti visualisasi data harus terlihat membosankan supaya berfungsi atau sangat canggih supaya terlihat menarik. Untuk memaparkan ide secara efektif, bentuk estetis dan fungsionalitas harus berbarengan, menyediakan wawasan bagi kumpulan data yang kompleks dan jarang dengan mengkomunikasikan aspek-aspek kunci dengan cara yang intuitif. Namun perancang terkadang gagal mencapai keseimbangan antara bentuk dan fungsi, menciptakan visualisasi data yang menawan yang gagal menyediakan tujuan utamanya -- untuk mengkomunikasikan informasi". [2]

Fernanda Viegas dan Martin M. Wattenberg menyarankan bahwa sebuah visualisasi yang ideal tidak hanya harus mengkomunikasikan secara jelas, tapi menstimulasi atensi dan keterlibatan penonton. [3]

Visualisasi data secara dekat berkaitan dengan grafik informasi, visualisasi informasi, visualisasi ilmiah, eksplorasi analisis data dan grafik statistis. Pada milenia baru, visualisasi data telah menjadi wilayah penelitian, pengajaran dan pengembangan yang aktif. Menurut Post dkk. (2002), visualisasi data telah menyatukan visualisasi informasi dan ilmiah. [4]

Karakteristik dari penampilan grafik yang efektif

 
Diagram dari Charles Joseph Minard tahun 1861 tentang Mars Napoleon - sebuah contoh awal dari grafik informasi.

Profesor Edward Tufte menjelaskan bahwa pengguna dari tampilan informasi melakukan pekerjaan analitis tertentu seperti membuat perbandingan atau menentukan kausalitas. Prinsip perancangan dari grafik informasi harus mendukung pekerjaan analitis, memperlihatkan perbandingan atau kausalitas. [5]

Dalam bukunya tahun 1983 The Visual Display of Quantitative Information, Edward Tufte mendefinisikan 'tampilan grafik' dan prinsip-prinsip dari tampilan grafik yang efektif sebagai berikut: "Keberhasilan dalam grafik statistik terdiri dari mengkomunikasikan ide yang kompleks dengan kejelasan, ketepatan dan efisiensi. Tampilan grafis seharusnya:

  • memperlihatkan data
  • mendorong penglihat untuk berpikir tentang substansi bukan metodologi, rancangan grafik, teknologi dari produksi grafik atau hal lainnya
  • menghindari pengelabuan terhadap apa yang dikatakan oleh data
  • memberikan banyak angka dalam ruang yang kecil
  • membuat kumpulan data yang besar koheren
  • mendorong mata untuk membandingkan berbagai bagian berbeda dari data
  • membuka data pada beberapa tingkat kerincian, dari gambaran umum sampai struktur terakhir
  • melayani sebuah tujuan yang jelas: deskripsi, eksplorasi, tabulasi atau dekorasi
  • secara dekat berintegrasi dengan statistik dan deskripsi verbal dari sebuah kumpulan data.

Grafik menyingkap data. Tentu saja grafik bisa lebih tepat dan membuka daripada komputasi statisik konvensional." [6]

Sebagai contohnya, diagram Minard memperlihatkan kekalahan yang dialami oleh tentara Napoleon dalam periode 1812-1813. Enam variabel dipaparkan: ukuran tentara, lokasinya dalam dua-dimensi (x dan y), waktu, arah pergerakan, dan temperatur. Tampilan multivarian tersebut dalam dua dimensi menceritakan sebuah cerita yang dapat ditangkap langsung sementara mengidentifikasi sumber data untuk membangun sebuah kredibilitas. Tufte menulis di tahun 1983 bahwa: "Ia mungkin saja grafik statistik terbaik yang pernah dilukis."[6]

Dengan tidak menerapkan prinsip-prinsip tersebut bisa menghasilkan grafik menyesatkan, yang mengganggu pesan atau mendukung kesimpulan yang salah. Menurut Tufte, sampah-grafik mengacu pada dekorasi tambahan dari grafik yang tidak meningkatkan pesan, atau efek tiga dimensi atau perspektif yang serampangan. Secara sia-sia memisahkan kunci penjelasan dari gambar itu sendiri, membuat mata berpindah dari gambar ke penjelasan, adalah suatu bentuk dari "puing administratif". Rasio dari "data ke tinta" harus dimaksimalkan, menghapus tinta-tinta yang bukan data bila memungkinkan. [6]

Congressional Budge Office menyimpulkan beberapa praktik terbaik dalam menampilkan grafik dalam presentasi bulan Juni 2014, yaitu: a) Kenali penonton anda; b) Merancang grafik yang dapat berdiri sendiri di luar konteks dari laporan; dan c) Merancang grafik yang mengkomunikasikan pesan kunci dalam laporan. [7]

Pesan Kuantitatif

 
Sebuah rangkaian waktu digambarkan dengan grafik garis memperlihatkan tren pada pengeluaran dan pendapatan A.S. sepanjang waktu.
 
Sebuah scatterplot memperlihatkan korelasi negatif antara dua variabel (inflasi dan pengangguran ) dihitung sebagai titik dalam waktu.

Penulis Stephen Few menjelaskan delapan tipe pesan kuantitatif yang pengguna coba pahami atau komunikasikan dari sekumpulan data dan grafik yang digunakan untuk membantu mengkomunikasikan pesan:

  1. Rangkaian-waktu: sebuah variabel tunggal ditangkap selama periode waktu, seperti laju pengangguran selama 10 tahun. Sebuah grafik baris bisa digunakan untuk memperlihatkan tren ini.
  2. Peringkat: Pembagian kategoris diperingkatkan secara terurut menaik atau menurun, seperti peringkat peformansi penjualan (ukuran) berdasarkan penjual (kategori, dengan setiap penjual sebagai pembagian kategoris) selama satu periode tunggal. Sebuah grafik batang bisa digunakan untuk memperlihatkan perbandingan antara penjual.
  3. Sebagian-untuk-keseluruhan: Pembagian kategoris diukur sebagai sebuah rasio terhadap keseluruhan (misalnya, sebuah persentase dari 100%). Sebuah grafik lingkaran atau grafik batang dapat memperlihatkan perbandingan rasio, seperti kepemilikan saham direpresentasikan oleh kompetitor dalam sebuah pasar.
  4. Deviasi: Pembagian kategori dibandingkan dengan sebuah referensi, seperti perbandingan pengeluaran aktual terhadap anggaran untuk beberapa departemen dari sebuah bisnis pada periode waktu tertentu. Grafik batang dapat memperlihatkan perbandingan nilai aktual terhadap jumlah yang diacu.
  5. Distribusi frekuensi: Memperlihatkan jumlah observasi dari variabel tertentu terhadap rentang waktu tertentu, seperti jumlah tahun di mana pasar saham menguntungkan adalah antara interval seperti 0-10%, 11-20%, dll. Sebuah histogram, tipe dari grafik batang, bisa digunakan untuk analisis ini.
  6. Korelasi: Perbandingan antara observasi direpresentasikan oleh dua variabel (X, Y) untuk menentukan apakah mereka condong bergerak ke arah yang sama atau berlawanan. Sebagai contohnya, memplotkan pengangguran (X) dan inflasi (Y) untuk sampel beberapa bulan. Sebuah scatter plot biasanya digunakan untuk menyampaikan pesan tersebut.
  7. Perbandingan nominal: Membandingkan pembagian kategori tanpa urutan tertentu, seperti jumlah penjualan berdasarkan kode produk. Grafik batang bisa digunakan untuk pembandingan ini.
  8. Geografis atau geospasial: Perbandingan dari sebuah variabel di peta atau letak, seperti laju pengangguran berdasarkan negara bagian atau jumlah orang pada lantai di sebuah bangunan. Bagan yang digunakan biasanya adalah sebuah cartogram. [8][9]

Analis yang meninjau sekumpulan data bisa mempertimbangkan apakah beberapa atau semua pesan dan tipe grafik di atas bisa diterapkan pada pekerjaan atau penonton mereka. Proses uji coba untuk mengidentifikasi keterkaitan dan makna pesan pada data adalah bagian dari eksplorasi analisis data.

Persepsi visual dan visualisasi data

Seseorang bisa membedakan perbedaan antara panjang dua garis, orientasi bentuk, dan warna (corak) tanpa usaha pemrosesan yang signifikan; hal ini disebut sebagai "atribut pra-atensi." Sebagai contohnya, mungkin membutuhkan waktu dan usaha ("pemrosesan atensi") untuk mengidentifikasi berapa kali angka "5" muncul dalam sekumpulan angka; tapi jika angka tersebut berbeda dalam ukuran, orientasi, atau warna, instan dari angka tersebut dapat dilihat lebih cepat lewat pemrosesan pra-atensi. [10]

Grafik yang efektif menggunakan kelebihan pemrosesan pra-atensi dan atribut dan kekuatan relatif dan atribut tersebut. Sebagai contohnya, secara manusia dapat dengan mudah memroses perbedaan panjang garis daripada wilayah permukaan, akan lebih efektif menggunakan grafik batang (yang mengambil keuntungan panjang garis untuk memperlihatkan perbandingan) daripada grafik lingkaran (yang menggunakan wilayah permukaan). [11]

Terminologi

Visualisasi data mengikutkan terminologi khusus, beberapa diturunkan dari statistik. Sebagai contohnya, penulis Stephen Few mendefinisikan dua tipe data, yang digunakan secara kombinasi untuk mendukung analisis atau visualisasi yang bermakna:

  • Kategorial: label teks menjelaskan sifat dari data, seperti "Nama" atau "Umur". Istilah ini melingkupi data kualitatif (bukan angka).
  • Kuantitatif: Pengukuran angka, seperti "25" untuk merepresentasikan umur dalam tahun.

Dua tipe utama dari tampilan informasi adalah tabel dan bagan.

  • Sebuah tabel mengandung data kuantitatif diatur dalam baris dan kolom dengan label kategorial. Secara umum digunakan untuk melihat nilai ilmiah. Pada contoh di atas, tabel bisa memiliki label kolom kategorial merepresentasikan nama (sebuah variabel kualitatif) dan umur (variabel kuantitatif) dengan setiap baris dari data merepresentasikan satu orang (unit eksperimental atau pembagian kategori dari sampel).
  • Sebuah bagan biasanya digunakan untuk memperlihatkan keterkaitan antara data dan menggambarkan nilai yang dikodekan sebagai objek visual (misalnya, garis, batang, atau titik). Nilai numerik ditampilkan dalam sebuah wilayah yang digambarkan dengan satu atau lebih sumbu. Sumbu tersebut menyediakan skala (kuantitatif dan kategorial) yang digunakan untuk label dan memberi nilai ke objek visual. Banyak grafik disebut juga sebagai bagan.[12]

Perpustakaan KPI telah mengembangkan "Tabel Periodik dari Metode Visualisasi", sebuah bagan interaktif yang memperlihatkan berbagai metode visualisasi data. Ia mengikutkan enam tipe dari metode visualisasi data: data, informasi, konsep, strategi, metafora dan gabungan. [13]

Contoh diagram digunakan pada visualisasi data

Nama Visual

Dimensi

  Jaringan
  • ukuran nodes
  • warna node
  • ketebalan ikatan
  • warna ikatan
  • spasialisasi
  Grafik Batang
  • panjang
  • warna
  • waktu
  Streamgraph
  • lebar
  • warna
  • waktu (alur)
  Treemap
  • ukuran
  • warna
  Gantt Chart
  • warna
  • waktu (alur)
  Scatter Plot (3D)
  • posisi x
  • posisi y
  • posisi z
  • warna

Perspektif lain

Ada pendekatan berbeda dalam ruang lingkup visualisasi data. Salah satu fokus umum yaitu pada presentasi informasi, seperti yang Friedman (2008) berikan. Dalam cara ini Friendly (2008) menganggap dua bagian utama dari visualisasi data: grafik statistik, dan kartografi tematik. [1] Dalam artikel "Data Visualization: Modern Approaches" (2007) memberikan ikhtisar tentang tujuh subjek dari visualisasi data: [14]

Semua subjek tersebut secara dekat berkaitan dengan perancangan grafik dan representasi informasi.

Di lain sisi, dari perspektif ilmu komputer, Frits H. Post (2002) mengkategorikan bidang ilmu ini menjadi sejumlah sub-bidang: [4]

Arsitektur Presentasi Data

 
Sebuah visualisasi data dari media sosial

Arsitektur Presentasi Data (APD) adalah sekumpulan keahlian yang mencoba mengidentifikasi, menempatkan, manipulasi, format dan memberikan data dengan suatu cara untuk secara optimal mengkomunikasi makna dan mengajukan pengetahuan.

Secara sejarah, istilah APD diatribusikan ke Kelly Lautt: [15] "Arsitektur Presentasi Data adalah penerapan keahlian yang jarang digunakan untuk kesuksesan dan nilai dari Intelijensi Bisnis. Arsitektur presentasi data mengawinkan ilmu angka, data dan statisik dalam menemukan informasi yang berharga dari data dan membuatnya berguna, berkaitan dan dapat diaksikan dengan seni dari visualisasi data, komunikasi, psikologi organisasi dan manajemen perubahan dengan tujuan untuk menyediakan solusi intelijensi bisnis dengan ruang lingkup data, pemilihan waktu penyampaian, format dan visualisasi yang secara efektif akan mendukung dan mengarahkan perilaku operasional, taktikal, dan strategik ke arah tujuan bisnis (atau organisasi) yang dapat dipahami. APD bukanlah kemampuan teknologi informasi (TI) atau bisnis tapi berada sebagai bagian ilmu keahlian yang terpisah. Terkadang dianggap dengan visualisasi data, APD adalah keahlian yang lebih luas yang mengikutkan penentuan data apa dan pada waktu kapan dan dalam format apa akan dipresentasikan, tidak hanya cara terbaik menampilkan data yang telah dipilih sebelumnya (yaitu visualisasi data). Kemampuan visualisasi data adalah salah satu elemen dari APD.

Objektif

PAD memiliki dua objektif utama:

  • Menggunakan data untuk menyediakan pengetahuan dengan cara yang seefisien mungkin (meminimalkan noise, kompleksitas, dan data yang tidak perlu terhadap kebutuhan dan peran penonton)
  • Menggunakan data untuk neyediakan pengetahuan dengan cara seefektif mungkin (menyediakan data yang relevan, berdasarkan waktu dan komplit untuk setiap anggota penonton dengan cara yang jelas dan mudah dipahami sehingga menyingkap makna yang penting, dapat di-"aksi"-kan dan dapat mempengaruhi pemahaman, perilkau dan keputusan)

Ruang lingkup

Dengan objektif di atas, pekerjaan sebenarnya dari arsitektur presentasi data terdiri dari:

  • Membuat mekanisme penyampaian efektif untuk setiap penonton bergantung kepada peran, pekerjaan, lokasi dan akses mereka terhadap teknologi
  • Menentukan makna yang penting (pengetahuan yang berkaitan) yang dibutuhkan oleh setiap anggota penonton di setiap konteks
  • Menentukan periode perbaruan dari data yang dibutuhkan (peredaran dari data)
  • Menentukan waktu yang tepat untuk presentasi data (kapan dan seberapa sering pengguna membutuhkan untuk melihat data)
  • Menemukan data yang tepat (wilayah subjek, pencapaian riwayat, luasnya, tingkat kerincian, dll)
  • Menggunakan analisis, pengelompokan, visualisasi, dan format presentasi lainnya yang tepat

Bidang ilmu terkait

Pekerjaan APD memiliki kesamaan dengan beberapa bidang lainnya, termasuk:

  • Analisis Bisnis dalam menentukan tujuan bisnis, mengumpulkan kebutuhan, pemetaan pemrosesan.
  • Perbaikan proses bisnis yang mana tujuannya adalah untuk meningkatkan mempersingkat aksi dan keputusan dalam mendorong tujuan bisnis
  • Visualisasi data di dalamnya yang menggunakan teori-teori visualisasi yang telah pakam untuk menambahkan atau menyoroti makna atau kepentingan dalam presentasi data.
  • Perancangan grafik atau pengguna: Saat istilah APD digunakan, ia menjadi semacam rancangan yang mana tidak mengindahkan beberapa rincian seperti selera warna, gaya, label dan perhatian estetika lainnya, kecuali elemen-elemen rancangan secara spesifik dibutuhkan atau menguntungkan bagi komunikasi makna, pengaruh, kesulitan atau informasi lain dari nilai bisnis. Sebagai contohnya,
    • memilih lokasi untuk berbagai elemen representasi data oada sebuah halaman presentasi (seperti portal perusahaan, dalam sebuah laporan atau situs web) dengan tujuan untuk memperlihatkan hirarki, prioritas, kepentingan atau sebuah progres yang rasional bagi pengguna adalah bagian dari kemampuan APD.
    • memilih untuk memberikan warna tertentu pada elemen grafis yang merepresentasikan data dari makna atau perhatian tertentu adalah bagian dari kemampuan APD.
  • Arsitektur informasi, arsitektur informasi fokus pada data tak-terstruktur dan transformasi langsung dari konten yang sebenarny (data, untuk APD) menjadi entitas dan kombinasi baru.
  • Arsitektur solusi dalam menentukan rincian solusi yang optimal, termasuk ruang lingkup data yang digunakan, terhadap tujuan bisnis
  • Analisis statistik atau analisis data yang mana ia menciptakan informasi dan pengetahuan dari data

Lihat juga

Referensi

  1. ^ a b Michael Friendly (2008). "Milestones in the history of thematic cartography, statistical graphics, and data visualization".
  2. ^ Vitaly Friedman (2008) "Data Visualization and Infographics" in: Graphics, Monday Inspiration, January 14th, 2008.
  3. ^ Fernanda Viegas and Martin Wattenberg, "How To Make Data Look Sexy", CNN.com, April 19, 2011. http://articles.cnn.com/2011-04-19/opinion/sexy.data_1_visualization-21st-century-engagement?_s=PM:OPINION
  4. ^ a b Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art. Research paper TU delft, 2002.. Kesalahan pengutipan: Tanda <ref> tidak sah; nama "FHP02" didefinisikan berulang dengan isi berbeda
  5. ^ Edward Tufte-Presentation-August 2013
  6. ^ a b c Tufte, Edward (1983). The Visual Display of Quantitative Information. Cheshire, Connecticut: Graphics Press. ISBN 0961392142. 
  7. ^ CBO-Telling Visual Stories About Data-June 2014
  8. ^ Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004
  9. ^ Stephen Few-Perceptual Edge-Graph Selection Matrix
  10. ^ Steven Few-Tapping the Power of Visual Perception-September 2004
  11. ^ Steven Few-Tapping the Power of Visual Perception-September 2004
  12. ^ Steven Few-Selecting the Right Graph for Your Message-September 2004
  13. ^ Lengler, Ralph; Eppler, Martin. J. "Periodic Table of Visualization Methods". www.visual-literacy.org. Diakses tanggal 15 March 2013. 
  14. ^ "Data Visualization: Modern Approaches". in: Graphics, August 2nd, 2007
  15. ^ The first formal, recorded, public usages of the term data presentation architecture were at the three formal Microsoft Office 2007 Launch events in Dec, Jan and Feb of 2007-08 in Edmonton, Calgary and Vancouver (Canada) in a presentation by Kelly Lautt describing a business intelligence system designed to improve service quality in a pulp and paper company. The term was further used and recorded in public usage on December 16, 2009 in a Microsoft Canada presentation on the value of merging Business Intelligence with corporate collaboration processes.

Bacaan lebih lanjut

Tautan luar