Data tertaut

data terstruktur dan metode publikasinya

Dalam ilmu komputasi, Data tertaut (Inggris: Linked data; atau Data terhubung) adalah data terstruktur, yang saling tertaut dengan data lain sehingga dapat memberikan manfaat apabila data tersebut melalui proses kueri semantik. Data tertaut didesain berdasarkan standar teknologi Web seperti HTTP, RDF dan URI, dengan tujuan tidak terbatas pada penyajian dokumen web untuk pembaca manusia, namun juga menyajikan dokumen web agar dapat dibaca secara otomatis oleh mesin. Salah satu visi dari data tertauit adalah menjadikan Internet sebagai pangkalan data global.

Tampilan simpul Wikidata dalam Linked Open Data Cloud.[1] Pangkalan data digambarkan dengan simpul lingkaran (dengan Wikidata ditulis sebagai 'WD'), dengan garis abu-abu yang menghubungkan dengan Wikidata dengan pangkalan data lain di Internet.

Direktur Konsorsium Waring Wera Wanua (World Wide Web Consortium; W3C), Tim Berners Lee, menciptakan istilah data tertaut dalam catatan desain proyek Jejaring Semantik pada tahun 2006.

DBPedia sebagai dataset data tertaut yang memiliki paling banyak relasi dengan pangkalan data di Internet. DBPedia merupakan titik tumpu data tertaut terbuka sejak tahun 2008. Gambar diagram diambil pada tahun 2021.[2]

Data tertaut juga diartikan sebagai seperangkat prinsip desain untuk berbagi data saling terkait yang dapat dibaca mesin di web.[3] Jika digabungkan dengan Open Data (data yang dapat digunakan dan didistribusikan secara bebas), maka disebut Linked Open Data (LOD). Basis data RDF seperti GraphDB Ontotext adalah contoh LOD.[4]

Prinsip

sunting

Pada tahun 2006, pelopor teknologi web Tim Berners-Lee menuliskan garis besar Prinsip Data Tertaut yang menyatakan bahwa:[5]

  1. Entitas dalam data harus dapat diidentifikasi dengan menggunakan Pengidentifikasi Sumber Seragam (Uniform Resource Identifier; URI).
  2. Protokol HTTP pada URI harus dapat digunakan untuk mencari dan menginterpretasi entitas, demikian juga melepaskan referensi terhadap entitas.
  3. Informasi perihal nama yang berkaitan dengan suatu entitas harus disediakan melalui standar terbuka seperti Kerangka Kerja Deskripsi Sumber (Resource Description Framework; RDF), SPARQL, dan lain sebagainya.
  4. Data maupun entitas lain yang dipublikasikan di Web harus dapat dipanggil menggunakan URI melalui protokol HTTP.

Pada tahun 2009, Tim Berners-Lee kembali menyatakan prinsip-prinsip dasar ini pada Konferensi TED, yang diringkas dalam butir-butir berikut:

  1. Seluruh hal konseptual harus memiliki nama yang dimulai dengan protokol HTTP.
  2. Mencari entitas yang memiliki protokol HTTP dapat memberikan hasil berisi data dalam format dengan standar tertentu.
  3. Seluruh hal lain yang berkaitan dengan entitas yang disebut dalam poin dua harus memiliki nama yang dimulai juga dengan protokol HTTP.

Komponen

sunting

Dari paparan sebelumnya, dapat diidentifikasi komponen-komponen dasar untuk membangun sistem data tertaut global, dan menghubungkan subset data tertaut yang ada di dalamnya, yaitu:

  • Pengidentifikasi Sumber Seragam (Uniform Resource Identifier; URI)
  • Protokol Transfer Hiperteks (Hypertext Transfer Protocol; HTTP)
  • Data terstruktur yang menggunakan kosa kata terkontrol yang berisi istilah dan definisi dataset yang disusun menggunakan format serialisasi Kerangka Kerja Deskripsi Sumber (Resource Description Framework; RDF), seperti RDFa, RDF/XML, N3, Turtle, atau JSON-LD.
  • Platform Data Tertaut

Data terbuka tertaut

sunting

Data terbuka tertaut (disebut juga Data terbuka terhubung, en: Linked open data; LOD) adalah data tertaut yang merupakan bagian dari data terbuka. Tim Berners-Lee mendefinisikan data terbuka tertaut sebagai data tertaut yang dipublikasikan di bawah lisensi terbuka, yang tidak menghambat penggunaan data tertaut tersebut secara gratis.[6][7] Data tertaut terbuka lebih efektif digunakan apabila data tertaut tersebut disusun di atas protokol dan standar yang sama, sehingga memudahkan penggunaan dan interoperabilitas data tersebut oleh pengguna lintas sistem.[8] Set data tertaut yang tergolong besar adalah antara lain: DBPedia, Wikibase, Wikidata dan Open ICEcat.

Referensi

sunting
  1. ^ "LOD Cloud". lod-cloud.net. Diakses tanggal 2024-08-29. 
  2. ^ "The Linked Open Data Cloud". lod-cloud.net. Diakses tanggal 2024-08-29. 
  3. ^ Heath, Tom; Bizer, Christian (2011). Heath, Tom; Bizer, Christian, ed. Principles of Linked Data. Synthesis Lectures on Data, Semantics, and Knowledge (dalam bahasa Inggris). Cham: Springer International Publishing. hlm. 7–27. doi:10.1007/978-3-031-79432-2_2#preview. ISBN 978-3-031-79432-2. 
  4. ^ "What Are Linked Data and Linked Open Data?". Ontotext (dalam bahasa Inggris). Diakses tanggal 2023-11-29. 
  5. ^ "A walkthrough of Linked Data principles, 5 star ratings and Linked Open Data". TPXimpact (dalam bahasa Inggris). Diakses tanggal 2023-11-29. 
  6. ^ "Linked Data - Design Issues". www.w3.org. Diakses tanggal 2024-09-02. 
  7. ^ "5-star Open Data". 5stardata.info (dalam bahasa Inggris). Diakses tanggal 2024-09-02. 
  8. ^ Blaney, Jonathan (2017-05-07). "Introduction to the Principles of Linked Open Data". Programming Historian (dalam bahasa Inggris).