Penerbitan data (juga publikasi data) adalah tindakan merilis data penelitian dalam bentuk yang dipublikasikan untuk digunakan oleh orang lain. Ini adalah praktik yang terdiri dari menyiapkan data atau kumpulan data tertentu untuk penggunaan publik sehingga membuatnya tersedia bagi semua orang untuk digunakan sesuai keinginan. Praktik ini merupakan bagian integral dari gerakan sains terbuka. Ada konsensus besar dan multidisiplin tentang manfaat yang dihasilkan dari praktik ini.[1] [2]

Tujuan utamanya adalah untuk meningkatkan data menjadi output penelitian kelas satu. [3] Ada sejumlah inisiatif yang sedang berlangsung serta poin-poin konsensus dan isu-isu yang masih diperdebatkan.[4]

Ada beberapa cara berbeda untuk menyediakan data penelitian, termasuk:

  • menerbitkan data sebagai bahan tambahan yang terkait dengan artikel penelitian, biasanya dengan file data yang dihosting oleh penerbit artikel,
  • menghosting data di situs web yang tersedia untuk umum, dengan file yang tersedia untuk diunduh,
  • hosting data dalam repositori yang telah dikembangkan untuk mendukung publikasi data, misalnya figshare, Dryad, Dataverse, Zenodo. Sejumlah besar repositori data umum dan khusus (seperti berdasarkan topik penelitian) ada.[5] Misalnya, UK Data Service memungkinkan pengguna untuk menyimpan koleksi data dan membagikannya kembali untuk tujuan penelitian,
  • menerbitkan makalah data tentang kumpulan data, yang dapat diterbitkan sebagai pracetak, dalam jurnal biasa, atau dalam jurnal data yang didedikasikan untuk mendukung makalah data. Data dapat di-host oleh jurnal atau di-host secara terpisah dalam repositori data.

Menerbitkan data memungkinkan peneliti untuk membuat data mereka tersedia bagi orang lain untuk digunakan, dan memungkinkan kumpulan data dikutip serupa dengan jenis publikasi penelitian lainnya (seperti artikel atau buku), sehingga memungkinkan produsen kumpulan data untuk mendapatkan kredit akademik untuk pekerjaan mereka.

Motivasi untuk menerbitkan data dapat berkisar pada keinginan untuk membuat penelitian lebih mudah diakses, untuk memungkinkan sitabilitas kumpulan data, atau penyandang dana penelitian atau mandat penerbit yang memerlukan penerbitan data terbuka. UK Data Service adalah salah satu organisasi kunci yang bekerja dengan pihak lain untuk meningkatkan pentingnya mengutip data dengan benar [6] dan membantu para peneliti untuk melakukannya.

Solusi untuk menjaga privasi dalam penerbitan data telah diusulkan, termasuk algoritma perlindungan privasi, metode "masking" data, dan algoritma perhitungan tingkat privasi regional.[7]

Metode untuk menerbitkan data

sunting

File data sebagai bahan tambahan

sunting

Sejumlah besar jurnal dan penerbit mendukung materi tambahan yang dilampirkan pada artikel penelitian, termasuk kumpulan data. Meskipun secara historis materi tersebut mungkin telah didistribusikan hanya dengan permintaan atau pada bentuk mikro ke perpustakaan, jurnal saat ini biasanya host materi tersebut secara online. Materi tambahan tersedia untuk pelanggan jurnal atau, jika artikel atau jurnal tersebut adalah akses terbuka, untuk semua orang.

Repositori data

sunting

Ada sejumlah besar repositori data, baik pada topik umum maupun khusus. Banyak repositori adalah repositori disipliner, berfokus pada disiplin penelitian tertentu seperti UK Data Service yang merupakan repositori digital tepercaya untuk data sosial, ekonomi, dan humaniora. Repositori mungkin gratis bagi peneliti untuk mengunggah data mereka atau mungkin mengenakan biaya satu kali atau berkelanjutan untuk hosting data. Repositori ini menawarkan antarmuka web yang dapat diakses publik untuk mencari dan menelusuri kumpulan data yang dihosting, dan dapat mencakup fitur tambahan seperti pengidentifikasi objek digital, untuk kutipan permanen data, dan menautkan ke makalah dan kode terkait yang diterbitkan.

Makalah data

sunting

Makalah data atau artikel data adalah "publikasi ilmiah dari dokumen metadata yang dapat dicari yang menggambarkan dataset online tertentu yang dapat diakses, atau sekelompok dataset, yang diterbitkan sesuai dengan praktik akademik standar".[8] Tujuan akhir mereka adalah untuk memberikan "informasi tentang apa, di mana, mengapa, bagaimana dan siapa data". [3] Tujuan dari makalah data adalah untuk menawarkan informasi deskriptif tentang kumpulan data terkait yang berfokus pada pengumpulan data, fitur pembeda, akses, dan potensi penggunaan kembali daripada pada pemrosesan dan analisis data.[9] Karena makalah data dianggap publikasi akademis tidak berbeda dari jenis makalah lainnya, mereka memungkinkan para ilmuwan berbagi data untuk menerima kredit dalam mata uang yang dapat dikenali dalam sistem akademik, sehingga "membuat berbagi data diperhitungkan".[10] Ini tidak hanya memberikan insentif tambahan untuk berbagi data, tetapi juga melalui proses peer review, meningkatkan kualitas metadata dan dengan demikian dapat digunakan kembali data yang dibagikan.

Dengan demikian makalah data mewakili pendekatan komunikasi ilmiah untuk berbagi data. Terlepas dari potensinya, makalah data bukanlah solusi akhir dan lengkap untuk semua masalah berbagi dan penggunaan kembali data dan, dalam beberapa kasus, mereka dianggap menimbulkan harapan palsu dalam komunitas penelitian.[11]

Jurnal data

sunting

Makalah data didukung oleh beragam jurnal data, beberapa di antaranya "murni", yaitu mereka didedikasikan untuk menerbitkan makalah data saja, sementara yang lain - mayoritas - adalah "campuran", yaitu mereka menerbitkan sejumlah jenis artikel termasuk makalah data.

Sebuah survei komprehensif pada jurnal data tersedia.[12] Daftar jurnal data yang tidak lengkap telah disusun oleh staf di Universitas Edinburgh.

Contoh jurnal data "murni" adalah: Earth System Science Data, Journal of Open Archaeology Data, Open Health Data, Polar Data Journal, dan Scientific Data.

Contoh jurnal "campuran" yang menerbitkan makalah data adalah: Biodiversity Data Journal, F1000Research, GigaScience, GigaByte, PLOS ONE, dan SpringerPlus.

Kutipan data

sunting

Contoh kutipan data

Kutipan data adalah penyediaan referensi yang akurat, konsisten, dan terstandarisasi untuk kumpulan data seperti halnya kutipan bibliografi disediakan untuk sumber lain yang diterbitkan seperti artikel penelitian atau monograf. Biasanya pendekatan Digital Object Identifier (DOI) yang mapan digunakan dengan membawa pengguna ke situs web yang berisi metadata pada dataset dan dataset itu sendiri. [13]

Sejarah perkembangan

2011: Sebuah makalah terbitan tahun 2011 melaporkan ketidakmampuan untuk menentukan seberapa sering kutipan data terjadi dalam ilmu sosial.[14]

2012-2013: Makalah di tahun 2012-2013 melaporkan bahwa kutipan data menjadi lebih umum, tetapi praktik untuk itu tidak standar.[15] [16] [17]

2014: Pada tahun 2014, FORCE 11 menerbitkan Deklarasi Bersama Prinsip Kutipan Data yang mencakup tujuan, fungsi, dan atribut kutipan data.[18]

2018: Pada bulan Oktober 2018, CrossRef menyatakan dukungannya untuk membuat katalog kumpulan data dan merekomendasikan kutipan mereka.[19]

2019: Sebuah jurnal berorientasi data populer melaporkan pada bulan April 2019, bahwa sekarang akan menggunakan kutipan data.[20] Ada sebuah makalah pada Juni 2019 menyarankan bahwa peningkatan kutipan data akan membuat praktik ini lebih berharga bagi semua orang dengan mendorong berbagi data dan juga dengan meningkatkan prestise orang-orang yang berbagi.[21]

Kutipan data adalah topik yang muncul dalam ilmu komputer dan telah didefinisikan sebagai masalah komputasi.[22]. Mengutip data menimbulkan tantangan signifikan bagi ilmuwan komputer dan masalah utama yang harus diatasi terkait dengan: [23]

  • penggunaan model dan format data heterogen – misalnya, basis data relasional, Comma-Separated Values (CSV), Extensible Markup Language (XML), Resource Description Framework (RDF);
  • kesementaraan data; perlunya mengutip data pada berbagai tingkat kekasaran – yaitu, kutipan yang dalam;
  • kebutuhan untuk secara otomatis menghasilkan kutipan ke data dengan granularitas variabel.

Referensi

sunting
  1. ^ crossref. "Chooser". chooser.crossref.org (dalam bahasa Inggris). doi:10.1525/bio.2009.59.5.9. Diakses tanggal 2023-11-29. 
  2. ^ Lawrence, Bryan; Jones, Catherine; Matthews, Brian; Pepler, Sam; Callaghan, Sarah (2011-10-07). "Citation and Peer Review of Data: Moving Towards Formal Data Publication". International Journal of Digital Curation (dalam bahasa Inggris). 6 (2): 4–37. doi:10.2218/ijdc.v6i2.205. ISSN 1746-8256. 
  3. ^ a b Callaghan, Sarah; Donegan, Steve; Pepler, Sam; Thorley, Mark; Cunningham, Nathan; Kirsch, Peter; Ault, Linda; Bell, Patrick; Bowie, Rod (2012-03-12). "Making Data a First Class Scientific Output: Data Citation and Publication by NERC's Environmental Data Centres". International Journal of Digital Curation (dalam bahasa Inggris). 7 (1): 107–113. doi:10.2218/ijdc.v7i1.218. ISSN 1746-8256. 
  4. ^ Kratz, John; Strasser, Carly (2014-10-16). "Data publication consensus and controversies" (dalam bahasa Inggris). doi:10.12688/f1000research.4518. 
  5. ^ Assante, Massimiliano; Candela, Leonardo; Castelli, Donatella; Tani, Alice (2016-04-26). "Are Scientific Data Repositories Coping with Research Data Publishing?" (dalam bahasa Inggris). 15 (0): 6. doi:10.5334/dsj-2016-006. 
  6. ^ Service, UK Data. "New to using data". UK Data Service (dalam bahasa Inggris). Diakses tanggal 2023-11-29. 
  7. ^ "Logic-Partition Based Gaussian Sampling for Online Aggregation | IEEE Conference Publication | IEEE Xplore". ieeexplore.ieee.org. doi:10.1109/cbd.2017.39. Diakses tanggal 2023-11-29. 
  8. ^ Chavan, Vishwas; Penev, Lyubomir (2011-12-15). "The data paper: a mechanism to incentivize data publishing in biodiversity science". BMC Bioinformatics. 12 (15): S2. doi:10.1186/1471-2105-12-S15-S2. ISSN 1471-2105. PMC 3287445 . PMID 22373175. 
  9. ^ Newman, Paul; Corke, Peter (2009-05). "Editorial: Data Papers — Peer Reviewed Publication of High Quality Data Sets". The International Journal of Robotics Research (dalam bahasa Inggris). 28 (5): 587–587. doi:10.1177/0278364909104283. ISSN 0278-3649. 
  10. ^ Gorgolewski, Krzysztof; Margulies, Daniel; Milham, Michael (2013). "Making Data Sharing Count: A Publication-Based Solution". Frontiers in Neuroscience. 7. doi:10.3389/fnins.2013.00009. ISSN 1662-453X. PMC 3565154 . PMID 23390412. 
  11. ^ Parsons, M. A.; Fox, P. A. (2013-01-31). "Is Data Publication the Right Metaphor?" (dalam bahasa Inggris). 12 (0): WDS32. doi:10.2481/dsj.WDS-042. 
  12. ^ Candela, Leonardo; Castelli, Donatella; Manghi, Paolo; Tani, Alice (2015-09). "Data journals: A survey". Journal of the Association for Information Science and Technology (dalam bahasa Inggris). 66 (9): 1747–1762. doi:10.1002/asi.23358. ISSN 2330-1635. 
  13. ^ "Briefing Papers | DCC". www.dcc.ac.uk. Diakses tanggal 2023-11-29. 
  14. ^ Mooney, Hailey (2011-04). "Citing data sources in the social sciences: do authors do it?". Learned Publishing (dalam bahasa Inggris). 24 (2): 99–108. doi:10.1087/20110204. ISSN 0953-1513. 
  15. ^ Edmunds, Scott C.; Pollard, Tom J.; Hole, Brian; Basford, Alexandra T. (2012-07-02). "Adventures in data citation: sorghum genome data exemplifies the new gold standard". BMC Research Notes. 5 (1): 223. doi:10.1186/1756-0500-5-223. ISSN 1756-0500. PMC 3392744 . PMID 22571506. 
  16. ^ Practices, CODATA-ICSTI Task Group on Data Citation Standards and (2013-09-08). "Out of Cite, Out of Mind: The Current State of Practice, Policy, and Technology for the Citation of Data" (dalam bahasa Inggris). 12 (0): CIDCR1. doi:10.2481/dsj.OSOM13-043. 
  17. ^ Mooney, Hailey; Newton, Mark P. (2012). "The Anatomy of a Data Citation: Discovery, Reuse, and Credit" (dalam bahasa Inggris). 1 (1). doi:10.7916/D8MW2STM. 
  18. ^ "Joint Declaration of Data Citation Principles – FORCE11". www.force11.org (dalam bahasa Inggris). Diakses tanggal 2023-11-29. 
  19. ^ shouten. "Data citation: let's do this". Crossref (dalam bahasa Inggris). Diakses tanggal 2023-11-29. 
  20. ^ "Data citation needed". Scientific Data (dalam bahasa Inggris). 6 (1): 27. 2019-04-10. doi:10.1038/s41597-019-0026-5. ISSN 2052-4463. PMC 6472333 . PMID 30971699. 
  21. ^ Pierce, Heather H.; Dev, Anurupa; Statham, Emily; Bierer, Barbara E. (2019-06). "Credit data generators for data reuse". Nature (dalam bahasa Inggris). 570 (7759): 30–32. doi:10.1038/d41586-019-01715-4. 
  22. ^ Buneman, Peter; Davidson, Susan; Frew, James (2016-08-24). "Why data citation is a computational problem". Communications of the ACM. 59 (9): 50–57. doi:10.1145/2893181. ISSN 0001-0782. PMC 5687090 . PMID 29151602. 
  23. ^ Silvello, Gianmaria (2018-01). "Theory and practice of data citation". Journal of the Association for Information Science and Technology (dalam bahasa Inggris). 69 (1): 6–20. doi:10.1002/asi.23917. ISSN 2330-1635.