ISO TR 14873 Web Archiving

ISO TR 14873 adalah Standar Internasional mengenai Informasi dan Dokumentasi, khususnya tentang statistik dan masalah kualitas untuk pengarsipan web atau web archiving.

Standar versi terbaru yang masih berlaku adalah terbitan tahun 2013 dengan judul berikut :

  • ISO/TR 14873:2013 Information and documentation — Statistics and quality issues for web archiving

Standar ISO/TR 14873:2013

ISO/TR 14873:2013 mendefinisikan statistik, istilah, dan kriteria kualitas untuk pengarsipan Web.

Ini mempertimbangkan kebutuhan dan praktik di berbagai organisasi seperti perpustakaan, arsip, museum, pusat penelitian dan yayasan warisan.

ISO/TR 14873:2013 ditujukan untuk para profesional yang terlibat langsung dalam pengarsipan Web.

Hal ini juga berguna untuk otoritas pendanaan lembaga pengarsipan Web dan pemangku kepentingan eksternal.

Terminologi yang digunakan dalam ISO/TR 14873:2013 mencoba untuk mencerminkan berbagai minat dan keahlian audiens, menyeimbangkan antara ilmu komputer, manajemen, dan kepustakawanan.

ISO/TR 14873:2013 pada dasarnya berfokus pada prinsip dan metode pengarsipan Web dan tidak mencakup cara alternatif untuk mengumpulkan sumber daya Internet.

Penerbitan Standar ISO/TR 14873:2013

Standar ini diterbitkan dan dipublikasikan pada Desember 2013, berupa dokumen edisi 1 dengan jumlah halaman sebanyak 54 lembar.

Disusun oleh :

  • Technical Committee ISO/TC 46/SC 8 Quality – Statistics and performance evaluation, atau : Komite Teknis ISO/TC 46/SC 8 Kualitas – Statistik dan evaluasi kinerja.

ICS :

  • 01.140.20 Information sciences, atau : 01.140.20 Ilmu informasi

Sebagaimana standar ISO lainnya, ISO/TR 14873:2013 ini juga ditinjau setiap 5 tahun dan peninjauan sudah mencapai tahap 60.60.

Isi Standar ISO/TR 14873:2013

Berikut adalah kutipan isi Standar ISO/TR 14873:2013 yang diambil dari Online Browsing Platform (OBP) dari situs resmi iso.org.

Yang ditambah dengan berbagai keterangan dan informasi untuk mempermudah pemahaman pembaca.

Hanya bagian standar yang informatif yang tersedia untuk umum, OBP hanya menampilkan hingga klausa 2 saja.

Oleh karena itu, untuk melihat konten lengkap dari standar ini, maka pembaca harus membeli standar dari ISO ini secara resmi.

Daftar Isi Standar ISO/TR 14873:2013

  • Foreword
  • Introduction
  • 1 Scope
  • 2 Terms and definitions
  • 3 Methods and purposes of Web archiving
  • 3.1 Collecting methods
  • 3.2 Access and description methods
  • 3.3 Preservation methods
  • 3.4 Legal basis for Web archiving
  • 3.5 Additional reasons for Web archiving
  • 4 Statistics
  • 4.1 General
  • 4.2 Statistics for collection development
  • 4.3 Collection characterization
  • 4.4 Collection usage
  • 4.5 Web archive preservation
  • 4.6 Measuring the costs of Web archiving
  • 5 Quality indicators
  • 5.1 General
  • 5.2 Limitations
  • 5.3 Description
  • 6 Usage and benefits
  • 6.1 General
  • 6.2 Intended usage and readers
  • 6.3 Benefits for user groups
  • 6.4 Use of proposed statistics by user groups
  • 6.5 Web archiving process with related performance indicators
  • Bibliography

Kata pengantar

Sebagaimana tercantum dalam “Klausa 0 Foreword”, bahwa :

ISO (Organisasi Internasional untuk Standardisasi) adalah federasi badan standar nasional (badan anggota ISO) di seluruh dunia.

Pekerjaan mempersiapkan Standar Internasional biasanya dilakukan melalui komite teknis ISO.

Setiap badan anggota yang tertarik pada suatu topik yang untuknya komite teknis telah dibentuk berhak untuk diwakili dalam komite tersebut.

Organisasi internasional, pemerintah dan non-pemerintah, bekerja sama dengan ISO, juga ambil bagian dalam pekerjaan tersebut.

ISO bekerja sama erat dengan International Electrotechnical Commission (IEC) dalam semua masalah standardisasi elektroteknik.

Prosedur yang digunakan untuk mengembangkan dokumen ini dan yang dimaksudkan untuk pemeliharaan lebih lanjut dijelaskan dalam Arahan ISO/IEC, Bagian 1.

Secara khusus, kriteria persetujuan yang berbeda yang diperlukan untuk berbagai jenis dokumen ISO harus diperhatikan.

Dokumen ini disusun sesuai dengan aturan editorial Arahan ISO/IEC, Bagian 2 (lihat www.iso.org/directives).

Perhatian diberikan pada kemungkinan bahwa beberapa elemen dari dokumen ini dapat menjadi subyek hak paten.

ISO tidak bertanggung jawab untuk mengidentifikasi salah satu atau semua hak paten tersebut.

Rincian hak paten apa pun yang diidentifikasi selama pengembangan dokumen akan ada di Pendahuluan dan/atau pada daftar pernyataan paten ISO yang diterima (lihat www.iso.org/patents).

Setiap nama dagang yang digunakan dalam dokumen ini adalah informasi yang diberikan untuk kenyamanan pengguna dan bukan merupakan suatu dukungan.

Tersedia pula halaman Foreword – Supplementary information untuk :

  • penjelasan tentang arti istilah dan ekspresi khusus ISO yang terkait dengan penilaian kesesuaian,
  • informasi tentang kepatuhan ISO terhadap prinsip-prinsip WTO dalam Technical Barriers to Trade (TBT).

Komite yang bertanggung jawab untuk dokumen ini adalah :

  • ISO/TC 46, Information and documentation, Subcommittee SC 8, Quality – Statistics and performance evalutation,
  • atau : ISO/TC 46, Informasi dan dokumentasi, Subkomite SC 8, Kualitas – Statistik dan evaluasi kinerja.

Mengenal ISO, IEC, WTO dan TBT Agreement

ISO (International Organization for Standardization) adalah suatu organisasi atau lembaga nirlaba internasional,

Tujuan dari ISO adalah untuk membuat dan memperkenalkan standar dan standardisasi internasional untuk berbagai tujuan.

Sebagaimana ISO, IEC juga merupakan suatu organisasi standardisasi internasional yang menyusun dan menerbitkan standar-standar internasional.

Namun ruang lingkupnya adalah untuk seluruh bidang elektrik, elektronik dan teknologi yang terkait atau bidang teknologi elektro (electrotechnology).

TBT Agreement (Technical Barriers to Trade) adalah perjanjian internasional mengenai hambatan teknis perdagangan di bawah kerangka Organisasi WTO (World Trade Organization).

WTO (World Trade Organization) adalah sebuah organisasi resmi internasional yang mengatur standar sistem perdagangan bebas di dunia.

Lebih jelas mengenai ISO, IEC, WTO dan TBT Agreement dapat dibaca pada artikel lain dari standarku.com berikut :

Pengantar Standar

Sebagaimana tercantum dalam “Klausa 0 Introduction”, bahwa :

Laporan Teknis ini dikembangkan sebagai tanggapan atas permintaan di seluruh dunia akan pedoman tentang pengelolaan dan evaluasi aktivitas dan produk pengarsipan Web.

Pengarsipan web mengacu pada aktivitas memilih, menangkap, menyimpan, melestarikan, dan mengelola akses ke snapshot sumber daya Internet dari waktu ke waktu.

Ini dimulai pada akhir 1990-an, berdasarkan visi bahwa arsip sumber daya Internet akan menjadi catatan penting untuk penelitian, perdagangan, dan pemerintahan di masa depan.

Sumber daya internet dianggap sebagai bagian dari warisan budaya dan oleh karena itu dilestarikan seperti publikasi warisan cetak.

Banyak lembaga yang terlibat dalam pengarsipan Web melihat ini sebagai perpanjangan dari misi lama mereka melestarikan warisan nasional mereka, dan ini didukung dan diaktifkan di banyak negara oleh kerangka legislatif seperti deposit hukum.

Ada berbagai sumber daya yang tersedia di Internet, termasuk teks, gambar, film, suara dan format multimedia lainnya.

Selain halaman Web yang saling terkait, ada newsgroup, buletin, blog, dan layanan interaktif seperti permainan, yang tersedia menggunakan berbagai protokol transfer dan komunikasi.

Arsip web menyatukan salinan sumber daya Internet, dikumpulkan secara otomatis dengan memanen perangkat lunak, biasanya secara berkala.

Obyektif

Tujuannya adalah untuk memutar ulang sumber daya termasuk hubungan yang melekat, misalnya melalui tautan hypertext, sebanyak mungkin seperti di lingkungan aslinya.

Tujuan utama dari pengarsipan Web adalah untuk melestarikan catatan Web selamanya, semirip mungkin dengan bentuk aslinya, untuk berbagai keperluan akademik, profesional dan pribadi.

Pengarsipan web adalah aktivitas baru-baru ini tetapi berkembang yang terus-menerus membutuhkan pendekatan dan alat baru untuk tetap sinkron dengan teknologi Web yang berkembang pesat.

Ditentukan oleh kepentingan strategis yang dirasakan oleh lembaga pengarsipan, sarana yang tersedia dan terkadang persyaratan hukum, berbagai pendekatan telah diambil untuk mengarsipkan sumber daya Internet, mulai dari menangkap halaman Web individu hingga seluruh domain tingkat atas.

Dari perspektif organisasi, pengarsipan Web juga berada pada tingkat kematangan yang berbeda.

Sementara itu telah menjadi kegiatan bisnis seperti biasa di beberapa organisasi, yang lain baru saja memulai program eksperimental untuk mengeksplorasi tantangan.

Tergantung pada skala dan tujuan pengumpulan, perbedaan dapat dibuat antara dua kategori besar strategi pengarsipan Web: panen massal dan panen selektif.

Pemanenan massal skala besar, seperti pemanenan domain nasional, dimaksudkan untuk menangkap snapshot dari seluruh domain (atau sebagian darinya).

Pemanenan selektif dilakukan dalam skala yang jauh lebih kecil, lebih terfokus, dan dilakukan lebih sering, seringkali berdasarkan kriteria seperti tema, acara, format (mis. file audio atau video) atau kesepakatan dengan pemilik konten.

 Perbedaan utama antara kedua strategi terletak pada tingkat kontrol kualitas, evaluasi Situs Web yang dipanen untuk menentukan apakah standar kualitas yang telah ditentukan telah tercapai.

Skala pemanenan domain tidak memungkinkan untuk melakukan perbandingan visual manual antara sumber daya yang dipanen dan versi hidup, yang merupakan metode jaminan kualitas umum dalam pemanenan selektif.

Tujuan

Laporan Teknis ini bertujuan untuk menunjukkan bagaimana arsip Web, sebagai bagian dari koleksi warisan yang lebih luas, dapat diukur dan dikelola dengan cara yang serupa dan sesuai berdasarkan alur kerja perpustakaan tradisional.

Laporan tersebut membahas pengembangan koleksi, karakterisasi, deskripsi, pelestarian, penggunaan dan struktur organisasi, menunjukkan bahwa sebagian besar aspek alur kerja manajemen koleksi tradisional tetap berlaku pada prinsipnya untuk pengarsipan Web, meskipun dalam praktiknya penyesuaian diperlukan.

Meskipun Laporan Teknis ini memberikan gambaran umum tentang status pengarsipan Web saat ini, fokusnya adalah pada definisi dan penggunaan statistik arsip Web dan indikator kualitas.

Produksi beberapa statistik bergantung pada penggunaan perangkat lunak pemanenan, pengindeksan, atau penelusuran, dan pilihan perangkat lunak yang berbeda dapat menyebabkan perbedaan dalam hasil.

Namun Laporan Teknis ini tidak mendukung atau merekomendasikan perangkat lunak apa pun secara khusus.

Ini menyediakan satu set indikator untuk membantu menilai kinerja dan kualitas arsip Web secara umum.

Laporan Teknis ini harus dianggap sebagai pekerjaan yang sedang berjalan.

Beberapa isinya diharapkan akan dimasukkan di masa depan ke dalam ISO 2789 dan ISO 11620.

ISO/TR 14873:2013 Klausa 1-2

1 Scope :  Lingkup

Laporan Teknis ini mendefinisikan statistik, istilah dan kriteria kualitas untuk pengarsipan Web.

Ini mempertimbangkan kebutuhan dan praktik di berbagai organisasi seperti perpustakaan, arsip, museum, pusat penelitian dan yayasan warisan.

Contoh-contoh tersebut diambil dari sektor perpustakaan, karena perpustakaan, khususnya perpustakaan nasional, telah mengambil tugas baru pengarsipan Web dalam rangka titipan hukum.

Ini sama sekali tidak boleh dianggap melemahkan kontribusi penting dari lembaga-lembaga yang bukan perpustakaan.

Juga tidak mengurangi penerapan utama Laporan Teknis ini untuk lembaga warisan dan profesional pengarsipan.

Lingkup

Laporan Teknis ini ditujukan bagi para profesional yang terlibat langsung dalam pengarsipan Web, sering kali dalam tim campuran yang terdiri dari kurator perpustakaan atau arsip, insinyur, dan staf manajerial.

Ini juga berguna untuk otoritas pendanaan lembaga pengarsipan Web dan pemangku kepentingan eksternal.

Terminologi yang digunakan dalam Laporan Teknis ini mencoba untuk mencerminkan berbagai minat dan keahlian audiens, dengan menyeimbangkan antara ilmu komputer, manajemen, dan kepustakawanan.

Laporan Teknis ini tidak mempertimbangkan pengelolaan sumber daya elektronik akademik dan komersial, seperti e-journal, e-newspaper atau e-book, yang biasanya disimpan dan diproses secara terpisah menggunakan sistem manajemen yang berbeda.

Mereka dianggap sebagai sumber daya Internet dan tidak dibahas dalam Laporan Teknis ini sebagai aliran konten arsip Web yang berbeda.

Beberapa organisasi juga mengumpulkan dokumen elektronik, yang dapat dikirimkan melalui Web, melalui sistem penyimpanan dan penyimpanan elektronik berbasis penerbit.

Ini juga berada di luar cakupan Laporan Teknis ini.

Prinsip dan teknik yang digunakan untuk pengumpulan semacam ini memang sangat berbeda dengan pengarsipan Web; statistik dan indikator kualitas yang relevan untuk satu jenis metode belum tentu relevan untuk yang lain.

Akhirnya, Laporan Teknis ini pada dasarnya berfokus pada prinsip dan metode pengarsipan Web, dan tidak mencakup cara alternatif untuk mengumpulkan sumber daya Internet.

Faktanya, beberapa sumber daya Internet, terutama yang tidak didistribusikan di Web (misalnya, buletin yang didistribusikan sebagai email) tidak dikumpulkan dengan teknik pengarsipan Web dan dikumpulkan dengan cara lain yang tidak dijelaskan atau dianalisis dalam Teknis ini. Laporan.

2 Terms and definitions  : Istilah dan definisi

Untuk tujuan dokumen ini, istilah dan definisi berikut berlaku.

Daftar Pustaka atau Bibliography :

1-24

  • [1] ISO 2789, Information and documentation — International library statistics
  • [2] ISO 9000:2005, Quality management systems — Fundamentals and vocabulary
  • [3] ISO 11620, Information and documentation — Library performance indicators
  • [4] ISO 14721:2012, Space data and information transfer systems — Open archival information system (OAIS) — Reference model
  • [5] ISO 15489-1:2001, Information and documentation — Records management — Part 1: General
  • [6] ISO 16439:—1, Methods and procedures for assessing the impact of libraries
  • [7] ISO 28500:2009, Information and documentation — WARC file format
  • [8] Digital R.A.M.B.O.R.A., (DRAMBORA), available from: http://www.repositoryaudit.eu/
  • [9] Global W.M.S., available from: http://www.ifabc.org/
  • [10] Transfer Protocol H., HTTP/1.1, available from: http://www.ietf.org/rfc/rfc2616.txt
  • [11] Encoding M., Standard T., (METS), available from: http://www.loc.gov/standards/mets/METSOverview.html
  • [12] Multipurpose Internet Mail Extension, (MIME) Part Two: Media Types, available from: http://www.ietf.org/rfc/rfc2046.txt
  • [13] NESTOR CATALOGUE OF CRITERIA FOR TRUSTED DIGITAL REPOSITORIES, available from: http://files.d-nb.de/nestor/materialien/nestor_mat_08_eng.pdf
  • [14] REVISED GUIDELINES FOR STATISTICAL MEASURES OF USAGE OF WEB-BASED INFORMATION RESOURCES, available from: http://icolc.net/statement/revised-guidelines-statistical-measures-usage-web-based-information-resources
  • [15] Trusted Repositories Audit & Certification (TRAC), available from: http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf
  • [16] Identifiers U.R., (URI), available from http://www.ietf.org/rfc/rfc2396.txt
  • [17] WEB ANALYTICS ASSOCIATION, available from: http://www.webanalyticsassociation.org/?page=standards
  • [18] Website metric definitions, available from: http://www.jicwebs.org/standards.php
  • [19] BALL, A. 2010. Web Archiving, available from: http://www.dcc.ac.uk/sites/default/files/documents/reports/sarwa-v1.1.pdf
  • [20] BERMES, E. and ILLIEN, G. 2009. Metrics and Strategies for Web Heritage Management and Preservation, available from: http://conference.ifla.org/past/ifla75/92-bermes-en.pdf
  • [21] BRÜGGER, N. 2005. Archiving Websites. General Considerations and Strategies, available from: http://cfi.au.dk/fileadmin/www.cfi.au.dk/publikationer/archiving_underside/archiving.pdf
  • [22] DOUGHERTY, M., MEYER, E.T., MADSEN, C., VAN DEN HEUVEL, C., THOMAS, A. and WYATT, 2010. Researcher Engagement with Web Archives: State of the Art. Report. London: JISC, available from: http://ssrn.com/abstract=1714997
  • [23] DROID (DIGITAL RECORD OBJECT IDENTIFICATION), available from: http://sourceforge.net/projects/droid/
  • [24] IIPC ACCESS WORKING GROUP, 2006: Use cases for Access to Internet Archives, available from: http://www.netpreserve.org/resources/use-cases-access-internet-archives

25-35

  • [25] JACOBSEN, G. 2007. Webarchiving Internationally: Interoperability in the Future? Results of a survey of Web archiving activities on national libraries.
  • Paper published on the IFLANET prior to the World Library and Information Congress: 73rd IFLA General Conference and Council held in Durban, South Africa, available from: http://netarkivet.dk/publikationer/InteroperabilityInTheFuture_IFLA2007.pdf
  • [26] JHOVE – JSTOR/HARVARD OBJECT VALIDATION ENVIRONMENT, available from: http://jhove.sourceforge.net/
  • [27] MASANÈS, J. (ed.). 2006. Web Archiving, Springer, Berlin.
  • [28] MASANÈS, J. 2002. Towards Continuous Web Archiving. In: D-Lib Magazine 8 (12), available from: http://www.dlib.org/dlib/december02/masanes/12masanes.html
  • [29] MEYER, E., THOMAS, A. and SCHROEDER, R. 2011: Web Archives: The Future(s), available from: http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1830025
  • [30] PINSENT, E., DAVIS, R., ASHLEY, K., KELLY, B., GUY, M. and HATCHER, J. 2010. PoWR: The Preservation of Web Resources Handbook, available from: http://www.jisc.ac.uk/publications/programmerelated/2008/powrhandbook.aspx
  • [31] AUBRY, S. 2010: Introducing Web Archives as a New Library Service: the Experience of the National Library of France. In: Liber Quaterly, 2010, vol. 20, no. 2, available from: http://liber.library.uu.nl/index.php/lq/article/view/7987
  • [32] BAILEY, S. and THOMPSON, D. 2006: UKWAC: Building the UK’s First Public Web Archive. D-Lib. 2006, 12 (1). Available at: http://www.dlib.org/dlib/january06/thompson/01thompson.html
  • [33] GLENN, V. 2007: Preserving Government and Political Information: The Web-at-Risk Project. First Monday. 2007, 12 (7). Available at: http://firstmonday.org/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/1917/1799
  • [34] HOCKX-YU, H. 2011: The Past Issue of the Web. In: Proceedings of the ACM WebSci’11, Webscience Trust, June 17, 2011, available from: http://www.websci11.org/fileadmin/websci/Papers/PastIssueWeb.pdf
  • [35] HOCKX-YU, H., CRAWFORD, L.ROGER, C., JOHNSON, S. 2010: Capturing and Replaying Streaming Media in a Web Archive – a British Library Case Study. In: Proceedings of iPRES 2010, September 2010, available from: http://www.ifs.tuwien.ac.at/dp/ipres2010/papers/hockxyu-44.pdf

36-44

  • [36] ILLIEN, G. 2008: L’archivage d’Internet, un défi pour les décideurs et les bibliothécaires: scénarios d’organisation et d’évaluation; l’expérience du consortium IIPC et de la BnF. In: Actes du 74e congrès de la Fédération internationale des associations de bibliothécaires et d’institutions (IFLA), Québec, Canada, available from: http://archive.ifla.org/IV/ifla74/papers/107-Illien-fr.pdf
  • [37] ILLIEN, G. and STIRLING, P. 2011: The state of e-legal deposit in France: looking back at five years of putting new legislation into practice and envisioning the future. In: Proceedings of the 77th IFLA congress, San Juan, Porto Rico, available from: http://conference.ifla.org/past/ifla77/193-stirling-en.pdf
  • [38] JACOBSEN, G. 2008: Web Archiving: Issues and Problems in Collection Building and Access. In: Liber Quarterly, Volume 18, Nr. 3/4 (2008), available from: http://liber.library.uu.nl/index.php/lq/article/view/7936/8202
  • [39] LASFARGUES, F., OURY C. and WENDLAND B. 2008: Legal deposit of the French Web: harvesting strategies for a national domain. In: Proceedings of the 8th International Web Archiving Workshop, Aarhus, Danemark, available from: http://iwaw.net/08/IWAW2008-Lasfargues.pdf
  • [40] OURY C., PEYRARD S. 2011: From the World Wide Web to digital library stacks: preserving the French Web archives. In: Proceedings of iPRES 2011, p. 231-241, available from: http://halshs.archives-ouvertes.fr/halshs-00868729
  • [41] POPE, J. and BERESFORD, Ph. 2007: IIPC Web Archiving Toolset Performance Testing at the British Library. In: Ariadne, no. 52 (2007), available from http://www.ariadne.ac.uk/issue52/pope-beresford/
  • [42] RAUBER, A., ASCHENBRENNER, A., WITVOET, O., BRUCKNER, R. and KAISER, M. 2002: Uncovering Information Hidden in Web Archives: A Glimpse at Web Analysis Building on Data Warehouses. D-Lib. 2002, 8 (12). Available at: http://www.dlib.org/dlib/december02/rauber/12rauber.html
  • [43] SMITH, J., and NELSON, M. 2008: Creating Preservation-Ready Web Resources. D-Lib. 2008, 14 (1/2). Available at: http://www.dlib.org/dlib/january08/smith/01smith.html
  • [44] SPENCER, A., SHERIDAN, J., THOMAS, D. and PULLINGER, D. 2009: UK Government Web Continuity: Persisting Access through Aligning Infrastructures. International Journal of Digital Curation. 2009, 4 (1). Available at: http://www.ijdc.net/index.php/ijdc/article/view/106

ISO/TR 14873:2013

Klausa 2

Dikarenakan isi Klausa 2 terlalu panjang, maka pembaca bisa melanjutkan ke artikel lanjutan dari standarku.com berikut :

  • ISO TR 14873 Klausa 2.1 – 2.53

Penutup

Demikian artikel dari standarku.com mengenai Standar ISO 6929:2013.

Mohon saran dari pembaca untuk kelengkapan isi artikel ini, silahkan saran tersebut dapat disampaikan melalui kolom komentar.

Baca artikel lain :

Sumber referensi :

Leave a Comment