ISO TR 14873 Klausa 2.1 – 2.53 adalah Standar Internasional mengenai Informasi dan Dokumentasi, khususnya tentang statistik dan masalah kualitas untuk pengarsipan web atau web archiving.
Artikel ini merupakan lanjutan dari artikel sebelumnya berikut :
- ISO TR 14873 Web Archiving
Standar ISO TR 14873 Klausa 2.1 – 2.53
ISO TR 14873 Klausa 2.1 – 2.6
2.1 access : mengakses
permintaan sukses dari layanan online yang disediakan perpustakaan
Catatan :
- 1 : Akses adalah satu siklus aktivitas pengguna yang biasanya dimulai saat pengguna terhubung ke layanan online yang disediakan perpustakaan dan diakhiri dengan aktivitas penghentian yang eksplisit (dengan meninggalkan database melalui logout atau keluar) atau implisit (batas waktu karena pengguna tidak aktif).
- 2 : Akses ke situs web perpustakaan dihitung sebagai kunjungan virtual.
- 3 : Permintaan pintu masuk umum atau halaman gerbang tidak termasuk.
- 4 : Jika memungkinkan, permintaan oleh mesin pencari dikecualikan.
[SUMBER:ISO 2789:2013, definisi 2.2.1]
2.2 access tool : alat akses
perangkat lunak khusus yang digunakan untuk menemukan, mengambil, dan memutar ulang sumber daya Internet yang diarsipkan
- Catatan 1 : Ini dapat diimplementasikan oleh sejumlah paket perangkat lunak terpisah yang bekerja bersama.
2.3 administrative metadata : metadata administratif
informasi yang diperlukan untuk memungkinkan pengelolaan objek digital yang tepat dalam repositori
Catatan 1 : Metadata administratif dapat dibagi ke dalam kategori berikut:
- — metadata konteks atau asal: menggambarkan siklus hidup sumber daya ke suatu titik, termasuk entitas dan proses terkait, mis. konfigurasi dan file log;
- — metadata teknis: mendeskripsikan karakteristik teknis dari objek digital, mis. formatnya;
- — metadata hak: menentukan kepemilikan dan penggunaan objek yang diizinkan secara hukum.
2.4 archive : arsip
Web archive : Arsip web
seluruh rangkaian sumber daya yang dirayapi dari Web dari waktu ke waktu, terdiri dari satu atau lebih koleksi
2.5 bit stream : aliran kecil
seri 0 dan 1 digit yang merupakan file digital
2.6 budget (crawl) : anggaran (perayapan)
batasan yang terkait dengan perayapan atau benih individu, yang dapat diekspresikan dalam mis. jumlah file, volume data, atau waktu yang dihabiskan per crawl seperti yang ditentukan dalam pengaturan crawler
ISO TR 14873 Klausa 2.7 – 2.11
2.7 bulk crawl : perayapan massal
bulk harvest : panen massal
perayapan yang bertujuan mengumpulkan keseluruhan satu atau beberapa domain tingkat atas atau subset
Catatan :
- 1 : Dibandingkan dengan perayapan selektif, perayapan massal memiliki cakupan yang lebih luas dan biasanya lebih jarang dilakukan.
- 2 : Perayapan massal umumnya menghasilkan arsip Web skala besar, sehingga mustahil untuk melakukan jaminan kualitas yang terperinci. Hal ini sering dilakukan melalui sampling.
2.8 capture : menangkap
instance : contoh
salinan sumber daya yang dirayapi pada titik waktu tertentu
- Catatan 1 : Jika sumber daya telah dirayapi tiga kali pada tanggal yang berbeda, akan ada tiga tangkapan.
2.9 collection : koleksi
Web archive collection : Koleksi arsip web
sumber daya kohesif disajikan sebagai sebuah kelompok
Catatan :
- 1 : Koleksi dapat dipilih secara spesifik sebelum panen (misalnya peristiwa, topik) atau dikumpulkan secara retrospektif dari sumber daya yang tersedia di arsip.
- 2 : Arsip Web dapat terdiri dari satu atau lebih koleksi.
2.10 crawl : merangkak
harvest : memanen
proses penelusuran dan penyalinan sumber daya menggunakan perayap
- Catatan 1 : Perayapan dapat dikategorikan sebagai perayapan massal atau perayapan selektif.
2.11 crawl settings : pengaturan perayapan
crawl parameters : parameter perayapan
definisi sumber daya mana yang harus dikumpulkan dan frekuensi serta kedalaman yang diperlukan untuk setiap set benih
- Catatan 1 : Pengaturan perayapan juga mencakup kesopanan perayap (jumlah permintaan per detik atau menit yang dikirim ke server yang menghosting sumber daya), kepatuhan terhadap robots.txt, dan filter untuk mengecualikan jebakan perayap.
ISO TR 14873 Klausa 2.12 – 2.18
2.12 crawler : perayap
harvester : mesin penuai
archiving crawler : perayap pengarsipan
DEPRECATED:spider : TIDAK DIGUNAKAN: laba-laba
perangkat lunak yang secara berurutan akan meminta URL dan mengurai sumber daya yang dihasilkan untuk URL lebih lanjut
- Catatan 1 : Sumber daya dapat disimpan dan URL dibuang sesuai dengan seperangkat aturan yang telah ditentukan sebelumnya [lihat pengaturan perayapan (2.11) dan cakupan (perayapan) (2.40)].
2.13 crawler trap : perangkap perayap
Halaman web (atau rangkaiannya) yang akan menyebabkan crawler mogok atau terus-menerus mengikuti referensi ke sumber daya lain yang dianggap kurang atau tidak bernilai sama sekali
- Catatan 1 : Perangkap perayap dapat dipasang dengan sengaja untuk mencegah perayap memanen sumber daya. Ini juga bisa terjadi secara tidak sengaja misalnya ketika crawler mengikuti tanggal kalender tanpa henti.
2.14 curator tool : alat kurator
aplikasi yang berjalan di atas perayap Web dan mendukung proses pemanenan
- Catatan 1 : Fungsi inti adalah pengelolaan target dan metadata deskriptif dan administratif terkait. Ini juga dapat mencakup komponen untuk penjadwalan dan kontrol kualitas.
2.15 data mining : penambangan data
proses komputasi yang mengekstraksi pola dengan menganalisis data kuantitatif dari perspektif dan dimensi yang berbeda, mengkategorikannya, dan meringkas hubungan dan dampak potensial
[SUMBER:ISO 16439:—, definisi 3.13]
2.16 deep Web : Web yang dalam
DEPRECATED:hidden Web : TIDAK DIGUNAKAN: Web tersembunyi
DEPRECATED:invisible Web : TIDAK DIGUNAKAN: Web tak terlihat
bagian dari Web yang tidak dapat dirayapi dan diindeks oleh mesin pencari, terutama terdiri dari sumber daya yang dihasilkan secara dinamis atau dilindungi kata sandi
2.17 descriptive metadata : metadata deskriptif
informasi yang menggambarkan konten intelektual dari objek digital
2.18 domain name : nama domain
string identifikasi yang mendefinisikan wilayah otonomi administratif, otoritas, atau kontrol di Internet, yang ditentukan oleh aturan dan prosedur sistem nama domain (DNS)
ISO TR 14873 Klausa 2.19 – 2.26
2.19 domain name system (DNS) : sistem nama domain
hierarki, sistem penamaan global terdistribusi yang digunakan untuk mengidentifikasi entitas yang terhubung ke Internet
- Catatan 1 : Domain Tingkat Atas (TLD) adalah yang tertinggi dalam hierarki.
2.20 emulation : emulasi
rekreasi fungsionalitas dan perilaku sistem usang, menggunakan perangkat lunak (disebut emulator) pada sistem komputer saat ini
- Catatan 1 : Emulasi adalah strategi pelestarian digital utama.
2.21 host : tuan rumah
bagian dari URI yang menamai sumber jaringan konten
- Catatan 1 : Host biasanya berupa nama domain seperti www.archive.org, atau subdomain seperti web.archive.org.
2.22 HTML : HTML
Hypertext Markup Language : Hyper Text Markup Language
bahasa mark-up utama untuk halaman Web, terdiri dari elemen yang digunakan untuk menambahkan informasi struktural dan semantik ke teks mentah.
2.23 HTTP
Hypertext Transfer Protocol : Protokol Transfer Hypertext
protokol komunikasi klien/server yang digunakan untuk mentransfer informasi di Web
2.24 hyperlink
link : tautan
struktur hubungan yang digunakan untuk menghubungkan informasi di Internet
2.25 junk : sampah
spam
konten yang tidak diminta yang dianggap tidak memiliki relevansi atau nilai jangka panjang
Catatan :
- 1 : Spam yang disengaja biasanya digunakan untuk memanipulasi indeks mesin pencari. Sampah juga dapat dihasilkan secara tidak sengaja ketika perayap jatuh dalam jebakan perayap.
- 2: Lembaga pengumpul pada umumnya mencoba untuk menghindari pengumpulan sampah dan spam sehingga sumber daya dapat digunakan untuk memanen sumber daya yang “baik”.
Beberapa, bagaimanapun, menyimpan sampel kecil ini sebagai bagian dari catatan Web.
2.26 link mining : penambangan tautan
pemrosesan dan analisis yang berfokus pada penggalian pola dan heuristik dari hyperlink, e. g. menggambar grafik jaringan
ISO TR 14873 Klausa 2.27 – 2.33
2.27 live Web leakage : kebocoran Web langsung
masalah umum dalam merender sumber daya yang diarsipkan, yang terjadi ketika tautan dalam sumber daya yang diarsipkan mengarah ke salinan saat ini di situs langsung, alih-alih ke versi arsip dalam arsip Web
Catatan 1 :
- Kebocoran Web Langsung juga terjadi ketika skrip pada halaman Web yang diarsipkan terus merujuk, dan berhasil meminta, sumber daya Web langsung dalam rendering arsip.
- Ini dapat menyebabkan umpan media sosial Web langsung atau video streaming, misalnya, muncul di halaman web yang diarsipkan.
2.28 log file : berkas log
file secara otomatis dibuat oleh server yang menyimpan catatan aktivitasnya
2.29 metadata : metadata
data yang menggambarkan konteks, konten, dan struktur objek digital dan pengelolaannya sepanjang waktu
[SUMBER:ISO 15489 1:2001, definisi 2.12]
- Catatan 1 : Metadata dapat dikategorikan sebagai metadata deskriptif, struktural dan administratif.
2.30 migration : migrasi
konversi format file lama atau usang ke yang lebih baru atau saat ini untuk tujuan menjaga aksesibilitas objek digital
- Catatan 1 : Migrasi adalah strategi pelestarian utama.
[SUMBER:ISO 15489 1:2001, definisi 3.13]
2.31 MIME type : tipe MIME
Internet media type : Jenis media internet
content type : Jenis konten
pengenal dua bagian untuk format file di Internet
- Catatan 1 : MIME (Multipurpose Internet Mail Extensions) menggunakan header tipe konten, yang terdiri dari tipe dan subtipe, untuk menunjukkan format sumber daya, mis. g. gambar/jpeg.
2.32 nomination : pencalonan
kandidat sumber daya untuk dipertimbangkan untuk dimasukkan dalam arsip Web
2.33 page : halaman
Web page : halaman web
sumber daya terstruktur, yang selain konten yang dapat dibaca manusia, berisi nol atau lebih hubungan dengan sumber daya lain dan diidentifikasi oleh URL
ISO TR 14873 Klausa 2.34 – 2.39
2.34 permission : izin
otorisasi untuk merayapi situs web langsung dan/atau menampilkan kontennya secara publik di arsip Web
- Catatan 1 : Izin dapat dinyatakan dengan lisensi resmi dari pemegang hak atau dibebaskan berdasarkan titipan legal.
2.35 registered user : pengguna terdaftar
orang atau organisasi yang terdaftar di perpustakaan untuk menggunakan koleksi dan/atau layanannya di dalam atau di luar perpustakaan
Catatan :
- 1 : Pengguna dapat didaftarkan atas permintaan mereka atau secara otomatis saat mendaftar di institusi.
- 2 : Pendaftaran dipantau secara berkala, setidaknya setiap tiga tahun, sehingga pengguna yang tidak aktif dapat dihapus dari daftar.
[SUMBER:ISO 2789:2013, definisi 2.2.28]
2.36 request : meminta
Pesan berformat HTTP yang dikirim oleh sistem yang meminta (misalnya browser atau crawler) ke server jauh untuk sumber daya tertentu yang diidentifikasi oleh URL
2.37 response : tanggapan
jawaban oleh server jauh ke permintaan HTTP untuk sumber daya, yang berisi sumber daya yang diminta, pengalihan ke URL lain, atau respons (kesalahan) negatif, yang menunjukkan mengapa sumber daya yang diminta tidak dapat dikembalikan
2.38 response code : Kode respon
status code : Kode status
nomor tiga digit yang menunjukkan ke server yang meminta status sumber daya yang diminta
- Catatan 1 : Kode yang dimulai dengan 4 (4xx), misalnya, menunjukkan bahwa sumber daya yang diminta tidak tersedia.
2.39 robots.txt
robots exclusion standard : standar pengecualian robot
protokol yang digunakan untuk mencegah perayap Web mengakses semua atau sebagian situs web
Catatan :
- 1 : robots.txt tidak mengikat secara hukum.
- 2 : Ini juga dapat digunakan untuk meminta penundaan minimum antara permintaan berturut-turut atau bahkan untuk menyediakan tautan ke peta situs untuk memfasilitasi perayapan situs yang lebih baik.
Klausa 2.40 – 2.47
2.40 scope (crawl) : lingkup (merangkak)
set parameter yang menentukan tingkat perayapan, e. g. jumlah lompatan maksimum atau kedalaman jalur maksimum yang harus diikuti oleh perayap
- Catatan 1 : Cakupan perayapan dapat seluas seluruh domain tingkat atas (mis. .de) atau sesempit satu file.
2.41 scope (Web archive) : ruang lingkup (Arsip web)
tingkat arsip atau koleksi Web, sebagaimana ditentukan oleh mandat hukum institusional atau kebijakan pengumpulan
2.42 second level domain : domain tingkat kedua
subdivisi dalam domain tingkat atas untuk kategori organisasi atau bidang minat tertentu (mis. .gov.uk untuk situs web pemerintah, .asso.fr untuk situs web asosiasi)
2.43 seed : benih
targeted URL : URL yang ditargetkan
URL yang sesuai dengan lokasi sumber daya tertentu yang akan dirayapi, digunakan sebagai titik awal oleh perayap Web
2.44 selection : pilihan
proses pengambilan keputusan kuratorial yang menentukan apakah sekumpulan sumber daya yang berarti ada dalam ruang lingkup arsip Web, dinilai berdasarkan kebijakan pengembangan koleksinya
2.45 selective crawl : perayapan selektif
selective harvest : panen selektif
perayapan yang bertujuan mengumpulkan sumber daya yang dipilih sesuai dengan kriteria tertentu
Catatan :
- 1 : Dibandingkan dengan perayapan massal, perayapan selektif memiliki cakupan yang lebih sempit dan biasanya dilakukan lebih sering.
- 2 : Perayapan berkelanjutan selektif adalah perayapan yang ditujukan untuk mengumpulkan sumber daya yang dipilih menurut kriteria tertentu, seperti kepentingan ilmiah, relevansi dengan subjek, atau frekuensi pembaruan berkelanjutan sumber daya.
- 3 : Perayapan acara selektif adalah perayapan terikat waktu, yang berakhir pada tanggal tertentu, yang ditujukan untuk mengumpulkan sumber daya yang terkait dengan acara unik, seperti pemilihan umum, acara olahraga, dan bencana.
2.46 structural metadata : metadata struktural
informasi yang menjelaskan bagaimana objek majemuk dibangun bersama untuk membentuk unit logis
2.47 target : target
kumpulan sumber daya yang berarti untuk dikumpulkan seperti yang ditentukan oleh satu atau lebih benih dan pengaturan perayapan terkait
Klausa 2.48 – 2.53
2.48 top level domain (TLD) : domain tingkat atas
domain tingkat tertinggi dalam Sistem Nama Domain (DNS), termasuk domain tingkat atas kode negara (mis. domain level (mis. .com, .net, .org, .paris.)
- Catatan 1 : Kecuali dinyatakan secara khusus, istilah ini digunakan untuk mengartikan TLD kode negara dalam laporan.
2.49 Uniform Resource Identifier (URI) : Pengidentifikasi Sumber Daya Seragam
string karakter yang dapat diperluas yang digunakan untuk mengidentifikasi atau memberi nama sumber daya di Internet
2.50 Uniform Resource Locator (URL) : Pencari Sumber Daya Seragam
subset dari Uniform Resource Identifier (URI) yang menentukan lokasi sumber daya dan protokol untuk mengambilnya
2.51 WARC format : format WARC
format file yang menentukan metode untuk menggabungkan beberapa sumber daya digital ke dalam file arsip agregat bersama dengan informasi terkait
- Catatan 1 : Format WARC (Web ARChive) telah menjadi standar ISO sejak 2009 (ISO 28500:2009).
2.52 website : situs web
kumpulan halaman Web yang saling berhubungan secara hukum dan/atau editorial
- Catatan 1 : Biasanya situs web mewakili lembaga resmi, organisasi, perusahaan swasta, dan beranda pribadi.
2.53 Web
aplikasi penerbitan utama Internet, diaktifkan oleh tiga standar utama: URI, HTTP, dan HTML
Penutup
Demikian artikel dari standarku.com mengenai Standar ISO 6929:2013.
Mohon saran dari pembaca untuk kelengkapan isi artikel ini, silahkan saran tersebut dapat disampaikan melalui kolom komentar.
Baca artikel lain :
- International Organization for Standardization
- Memahami apa itu Standar ISO
- Memahami Standard atau Standar
Sumber referensi :