ISO TR 14873 Klausa 2.1 – 2.53

ISO TR 14873 Klausa 2.1 – 2.53 adalah Standar Internasional mengenai Informasi dan Dokumentasi, khususnya tentang statistik dan masalah kualitas untuk pengarsipan web atau web archiving.

Artikel ini merupakan lanjutan dari artikel sebelumnya berikut :

  • ISO TR 14873 Web Archiving

Standar ISO TR 14873 Klausa 2.1 – 2.53

ISO TR 14873 Klausa 2.1 – 2.6

2.1 access : mengakses

permintaan sukses dari layanan online yang disediakan perpustakaan

Catatan :

  • 1 : Akses adalah satu siklus aktivitas pengguna yang biasanya dimulai saat pengguna terhubung ke layanan online yang disediakan perpustakaan dan diakhiri dengan aktivitas penghentian yang eksplisit (dengan meninggalkan database melalui logout atau keluar) atau implisit (batas waktu karena pengguna tidak aktif).
  • 2 : Akses ke situs web perpustakaan dihitung sebagai kunjungan virtual.
  • 3 : Permintaan pintu masuk umum atau halaman gerbang tidak termasuk.
  • 4 : Jika memungkinkan, permintaan oleh mesin pencari dikecualikan.

[SUMBER:ISO 2789:2013, definisi 2.2.1]

2.2 access tool : alat akses

perangkat lunak khusus yang digunakan untuk menemukan, mengambil, dan memutar ulang sumber daya Internet yang diarsipkan

  • Catatan 1 : Ini dapat diimplementasikan oleh sejumlah paket perangkat lunak terpisah yang bekerja bersama.

2.3 administrative metadata : metadata administratif

informasi yang diperlukan untuk memungkinkan pengelolaan objek digital yang tepat dalam repositori

Catatan 1 : Metadata administratif dapat dibagi ke dalam kategori berikut:

  • — metadata konteks atau asal: menggambarkan siklus hidup sumber daya ke suatu titik, termasuk entitas dan proses terkait, mis. konfigurasi dan file log;
    • — metadata teknis: mendeskripsikan karakteristik teknis dari objek digital, mis. formatnya;
    • — metadata hak: menentukan kepemilikan dan penggunaan objek yang diizinkan secara hukum.

2.4 archive : arsip

Web archive : Arsip web

seluruh rangkaian sumber daya yang dirayapi dari Web dari waktu ke waktu, terdiri dari satu atau lebih koleksi

2.5 bit stream : aliran kecil

seri 0 dan 1 digit yang merupakan file digital

2.6 budget (crawl) : anggaran (perayapan)

batasan yang terkait dengan perayapan atau benih individu, yang dapat diekspresikan dalam mis. jumlah file, volume data, atau waktu yang dihabiskan per crawl seperti yang ditentukan dalam pengaturan crawler

ISO TR 14873 Klausa 2.7 – 2.11

2.7 bulk crawl : perayapan massal

bulk harvest : panen massal

perayapan yang bertujuan mengumpulkan keseluruhan satu atau beberapa domain tingkat atas atau subset

Catatan :

  • 1 : Dibandingkan dengan perayapan selektif, perayapan massal memiliki cakupan yang lebih luas dan biasanya lebih jarang dilakukan.
  • 2 : Perayapan massal umumnya menghasilkan arsip Web skala besar, sehingga mustahil untuk melakukan jaminan kualitas yang terperinci. Hal ini sering dilakukan melalui sampling.

2.8 capture : menangkap

instance : contoh

salinan sumber daya yang dirayapi pada titik waktu tertentu

  • Catatan 1 : Jika sumber daya telah dirayapi tiga kali pada tanggal yang berbeda, akan ada tiga tangkapan.

2.9 collection : koleksi

Web archive collection : Koleksi arsip web

sumber daya kohesif disajikan sebagai sebuah kelompok

Catatan :

  • 1 : Koleksi dapat dipilih secara spesifik sebelum panen (misalnya peristiwa, topik) atau dikumpulkan secara retrospektif dari sumber daya yang tersedia di arsip.
  • 2 : Arsip Web dapat terdiri dari satu atau lebih koleksi.

2.10 crawl : merangkak

harvest : memanen

proses penelusuran dan penyalinan sumber daya menggunakan perayap

  • Catatan 1 : Perayapan dapat dikategorikan sebagai perayapan massal atau perayapan selektif.

2.11 crawl settings : pengaturan perayapan

crawl parameters : parameter perayapan

definisi sumber daya mana yang harus dikumpulkan dan frekuensi serta kedalaman yang diperlukan untuk setiap set benih

  • Catatan 1 : Pengaturan perayapan juga mencakup kesopanan perayap (jumlah permintaan per detik atau menit yang dikirim ke server yang menghosting sumber daya), kepatuhan terhadap robots.txt, dan filter untuk mengecualikan jebakan perayap.

ISO TR 14873 Klausa 2.12 – 2.18

2.12 crawler : perayap

harvester : mesin penuai

archiving crawler : perayap pengarsipan

DEPRECATED:spider : TIDAK DIGUNAKAN: laba-laba

perangkat lunak yang secara berurutan akan meminta URL dan mengurai sumber daya yang dihasilkan untuk URL lebih lanjut

  • Catatan 1 : Sumber daya dapat disimpan dan URL dibuang sesuai dengan seperangkat aturan yang telah ditentukan sebelumnya [lihat pengaturan perayapan (2.11) dan cakupan (perayapan) (2.40)].

2.13 crawler trap : perangkap perayap

Halaman web (atau rangkaiannya) yang akan menyebabkan crawler mogok atau terus-menerus mengikuti referensi ke sumber daya lain yang dianggap kurang atau tidak bernilai sama sekali

  • Catatan 1 : Perangkap perayap dapat dipasang dengan sengaja untuk mencegah perayap memanen sumber daya. Ini juga bisa terjadi secara tidak sengaja misalnya ketika crawler mengikuti tanggal kalender tanpa henti.

2.14 curator tool : alat kurator

aplikasi yang berjalan di atas perayap Web dan mendukung proses pemanenan

  • Catatan 1 : Fungsi inti adalah pengelolaan target dan metadata deskriptif dan administratif terkait. Ini juga dapat mencakup komponen untuk penjadwalan dan kontrol kualitas.

2.15 data mining : penambangan data

proses komputasi yang mengekstraksi pola dengan menganalisis data kuantitatif dari perspektif dan dimensi yang berbeda, mengkategorikannya, dan meringkas hubungan dan dampak potensial

[SUMBER:ISO 16439:—, definisi 3.13]

2.16 deep Web : Web yang dalam

DEPRECATED:hidden Web : TIDAK DIGUNAKAN: Web tersembunyi

DEPRECATED:invisible Web : TIDAK DIGUNAKAN: Web tak terlihat

bagian dari Web yang tidak dapat dirayapi dan diindeks oleh mesin pencari, terutama terdiri dari sumber daya yang dihasilkan secara dinamis atau dilindungi kata sandi

2.17 descriptive metadata : metadata deskriptif

informasi yang menggambarkan konten intelektual dari objek digital

2.18 domain name : nama domain

string identifikasi yang mendefinisikan wilayah otonomi administratif, otoritas, atau kontrol di Internet, yang ditentukan oleh aturan dan prosedur sistem nama domain (DNS)

ISO TR 14873 Klausa 2.19 – 2.26

2.19 domain name system (DNS) : sistem nama domain

hierarki, sistem penamaan global terdistribusi yang digunakan untuk mengidentifikasi entitas yang terhubung ke Internet

  • Catatan 1 : Domain Tingkat Atas (TLD) adalah yang tertinggi dalam hierarki.

2.20 emulation : emulasi

rekreasi fungsionalitas dan perilaku sistem usang, menggunakan perangkat lunak (disebut emulator) pada sistem komputer saat ini

  • Catatan 1 : Emulasi adalah strategi pelestarian digital utama.

2.21 host : tuan rumah

bagian dari URI yang menamai sumber jaringan konten

  • Catatan 1 : Host biasanya berupa nama domain seperti www.archive.org, atau subdomain seperti web.archive.org.

2.22 HTML : HTML

Hypertext Markup Language : Hyper Text Markup Language

bahasa mark-up utama untuk halaman Web, terdiri dari elemen yang digunakan untuk menambahkan informasi struktural dan semantik ke teks mentah.

2.23 HTTP

Hypertext Transfer Protocol : Protokol Transfer Hypertext

protokol komunikasi klien/server yang digunakan untuk mentransfer informasi di Web

2.24 hyperlink

link : tautan

struktur hubungan yang digunakan untuk menghubungkan informasi di Internet

2.25 junk : sampah

spam

konten yang tidak diminta yang dianggap tidak memiliki relevansi atau nilai jangka panjang

Catatan :

  • 1 : Spam yang disengaja biasanya digunakan untuk memanipulasi indeks mesin pencari. Sampah juga dapat dihasilkan secara tidak sengaja ketika perayap jatuh dalam jebakan perayap.
  • 2: Lembaga pengumpul pada umumnya mencoba untuk menghindari pengumpulan sampah dan spam sehingga sumber daya dapat digunakan untuk memanen sumber daya yang “baik”.

Beberapa, bagaimanapun, menyimpan sampel kecil ini sebagai bagian dari catatan Web.

2.26 link mining : penambangan tautan

pemrosesan dan analisis yang berfokus pada penggalian pola dan heuristik dari hyperlink, e. g. menggambar grafik jaringan

ISO TR 14873 Klausa 2.27 – 2.33

2.27 live Web leakage : kebocoran Web langsung

masalah umum dalam merender sumber daya yang diarsipkan, yang terjadi ketika tautan dalam sumber daya yang diarsipkan mengarah ke salinan saat ini di situs langsung, alih-alih ke versi arsip dalam arsip Web

Catatan 1 :

  • Kebocoran Web Langsung juga terjadi ketika skrip pada halaman Web yang diarsipkan terus merujuk, dan berhasil meminta, sumber daya Web langsung dalam rendering arsip.
  • Ini dapat menyebabkan umpan media sosial Web langsung atau video streaming, misalnya, muncul di halaman web yang diarsipkan.

2.28 log file : berkas log

file secara otomatis dibuat oleh server yang menyimpan catatan aktivitasnya

2.29 metadata : metadata

data yang menggambarkan konteks, konten, dan struktur objek digital dan pengelolaannya sepanjang waktu

[SUMBER:ISO 15489 1:2001, definisi 2.12]

  • Catatan 1 : Metadata dapat dikategorikan sebagai metadata deskriptif, struktural dan administratif.

2.30 migration : migrasi

konversi format file lama atau usang ke yang lebih baru atau saat ini untuk tujuan menjaga aksesibilitas objek digital

  • Catatan 1 : Migrasi adalah strategi pelestarian utama.

[SUMBER:ISO 15489 1:2001, definisi 3.13]

2.31 MIME type : tipe MIME

Internet media type : Jenis media internet

content type : Jenis konten

pengenal dua bagian untuk format file di Internet

  • Catatan 1 : MIME (Multipurpose Internet Mail Extensions) menggunakan header tipe konten, yang terdiri dari tipe dan subtipe, untuk menunjukkan format sumber daya, mis. g. gambar/jpeg.

2.32 nomination : pencalonan

kandidat sumber daya untuk dipertimbangkan untuk dimasukkan dalam arsip Web

2.33 page : halaman

Web page : halaman web

sumber daya terstruktur, yang selain konten yang dapat dibaca manusia, berisi nol atau lebih hubungan dengan sumber daya lain dan diidentifikasi oleh URL

ISO TR 14873 Klausa 2.34 – 2.39

2.34 permission : izin

otorisasi untuk merayapi situs web langsung dan/atau menampilkan kontennya secara publik di arsip Web

  • Catatan 1 : Izin dapat dinyatakan dengan lisensi resmi dari pemegang hak atau dibebaskan berdasarkan titipan legal.

2.35 registered user : pengguna terdaftar

orang atau organisasi yang terdaftar di perpustakaan untuk menggunakan koleksi dan/atau layanannya di dalam atau di luar perpustakaan

Catatan :

  • 1 : Pengguna dapat didaftarkan atas permintaan mereka atau secara otomatis saat mendaftar di institusi.
  • 2 : Pendaftaran dipantau secara berkala, setidaknya setiap tiga tahun, sehingga pengguna yang tidak aktif dapat dihapus dari daftar.

[SUMBER:ISO 2789:2013, definisi 2.2.28]

2.36 request : meminta

Pesan berformat HTTP yang dikirim oleh sistem yang meminta (misalnya browser atau crawler) ke server jauh untuk sumber daya tertentu yang diidentifikasi oleh URL

2.37 response : tanggapan

jawaban oleh server jauh ke permintaan HTTP untuk sumber daya, yang berisi sumber daya yang diminta, pengalihan ke URL lain, atau respons (kesalahan) negatif, yang menunjukkan mengapa sumber daya yang diminta tidak dapat dikembalikan

2.38 response code : Kode respon

status code : Kode status

nomor tiga digit yang menunjukkan ke server yang meminta status sumber daya yang diminta

  • Catatan 1 : Kode yang dimulai dengan 4 (4xx), misalnya, menunjukkan bahwa sumber daya yang diminta tidak tersedia.

2.39 robots.txt

robots exclusion standard : standar pengecualian robot

protokol yang digunakan untuk mencegah perayap Web mengakses semua atau sebagian situs web

Catatan :

  • 1 : robots.txt tidak mengikat secara hukum.
  • 2 : Ini juga dapat digunakan untuk meminta penundaan minimum antara permintaan berturut-turut atau bahkan untuk menyediakan tautan ke peta situs untuk memfasilitasi perayapan situs yang lebih baik.

Klausa 2.40 – 2.47

2.40 scope (crawl) : lingkup (merangkak)

set parameter yang menentukan tingkat perayapan, e. g. jumlah lompatan maksimum atau kedalaman jalur maksimum yang harus diikuti oleh perayap

  • Catatan 1 : Cakupan perayapan dapat seluas seluruh domain tingkat atas (mis. .de) atau sesempit satu file.

2.41 scope (Web archive) : ruang lingkup (Arsip web)

tingkat arsip atau koleksi Web, sebagaimana ditentukan oleh mandat hukum institusional atau kebijakan pengumpulan

2.42 second level domain : domain tingkat kedua

subdivisi dalam domain tingkat atas untuk kategori organisasi atau bidang minat tertentu (mis. .gov.uk untuk situs web pemerintah, .asso.fr untuk situs web asosiasi)

2.43 seed : benih

targeted URL : URL yang ditargetkan

URL yang sesuai dengan lokasi sumber daya tertentu yang akan dirayapi, digunakan sebagai titik awal oleh perayap Web

2.44 selection : pilihan

proses pengambilan keputusan kuratorial yang menentukan apakah sekumpulan sumber daya yang berarti ada dalam ruang lingkup arsip Web, dinilai berdasarkan kebijakan pengembangan koleksinya

2.45 selective crawl : perayapan selektif

selective harvest : panen selektif

perayapan yang bertujuan mengumpulkan sumber daya yang dipilih sesuai dengan kriteria tertentu

Catatan :

  • 1 : Dibandingkan dengan perayapan massal, perayapan selektif memiliki cakupan yang lebih sempit dan biasanya dilakukan lebih sering.
  • 2 : Perayapan berkelanjutan selektif adalah perayapan yang ditujukan untuk mengumpulkan sumber daya yang dipilih menurut kriteria tertentu, seperti kepentingan ilmiah, relevansi dengan subjek, atau frekuensi pembaruan berkelanjutan sumber daya.
  • 3 : Perayapan acara selektif adalah perayapan terikat waktu, yang berakhir pada tanggal tertentu, yang ditujukan untuk mengumpulkan sumber daya yang terkait dengan acara unik, seperti pemilihan umum, acara olahraga, dan bencana.

2.46 structural metadata : metadata struktural

informasi yang menjelaskan bagaimana objek majemuk dibangun bersama untuk membentuk unit logis

2.47 target : target

kumpulan sumber daya yang berarti untuk dikumpulkan seperti yang ditentukan oleh satu atau lebih benih dan pengaturan perayapan terkait

Klausa 2.48 – 2.53

2.48 top level domain (TLD) : domain tingkat atas

domain tingkat tertinggi dalam Sistem Nama Domain (DNS), termasuk domain tingkat atas kode negara (mis. domain level (mis. .com, .net, .org, .paris.)

  • Catatan 1 : Kecuali dinyatakan secara khusus, istilah ini digunakan untuk mengartikan TLD kode negara dalam laporan.

2.49 Uniform Resource Identifier (URI) : Pengidentifikasi Sumber Daya Seragam

string karakter yang dapat diperluas yang digunakan untuk mengidentifikasi atau memberi nama sumber daya di Internet

2.50 Uniform Resource Locator (URL) : Pencari Sumber Daya Seragam

subset dari Uniform Resource Identifier (URI) yang menentukan lokasi sumber daya dan protokol untuk mengambilnya

2.51 WARC format : format WARC

format file yang menentukan metode untuk menggabungkan beberapa sumber daya digital ke dalam file arsip agregat bersama dengan informasi terkait

  • Catatan 1 : Format WARC (Web ARChive) telah menjadi standar ISO sejak 2009 (ISO 28500:2009).

2.52 website : situs web

kumpulan halaman Web yang saling berhubungan secara hukum dan/atau editorial

  • Catatan 1 : Biasanya situs web mewakili lembaga resmi, organisasi, perusahaan swasta, dan beranda pribadi.

2.53 Web

aplikasi penerbitan utama Internet, diaktifkan oleh tiga standar utama: URI, HTTP, dan HTML

Penutup

Demikian artikel dari standarku.com mengenai Standar ISO 6929:2013.

Mohon saran dari pembaca untuk kelengkapan isi artikel ini, silahkan saran tersebut dapat disampaikan melalui kolom komentar.

Baca artikel lain :

Sumber referensi :

Leave a Comment