ISO IEC 15938-15 adalah Standar Internasional mengenai Teknologi informasi, khususnya tentang antarmuka deskripsi konten multimedia, bagian15: Compact descriptors for video analysis
Standar versi terbaru yang masih berlaku adalah terbitan tahun 2019 dengan judul berikut :
- ISO/IEC 15938-15:2019 Information technology — Multimedia content description interface — Part 15: Compact descriptors for video analysis
Standar ISO/IEC 15938-15:2019
Dokumen ini membahas teknologi deskriptor untuk aplikasi pencarian dan pengambilan, yaitu untuk pencocokan konten visual dalam video.
Pencocokan konten visual mencakup pencocokan tampilan objek dan pemandangan besar dan kecil, dengan ketahanan terhadap oklusi parsial serta perubahan titik pandang, parameter kamera, dan kondisi pencahayaan.
Objek yang diminati terdiri dari objek planar atau non-planar, kaku atau sebagian kaku, bertekstur atau bertekstur sebagian, tetapi tidak termasuk identifikasi orang dan wajah.
Basis datanya bisa besar, misalnya arsip siaran atau video yang tersedia di internet.
Oleh karena itu, aplikasi semacam itu memerlukan deskriptor video yang memungkinkan pencocokan dengan ukuran deskriptor yang lebih kecil dan runtime yang lebih pendek dibandingkan dengan aplikasi yang diaktifkan oleh deskriptor bingkai tunggal (gambar diam) (misalnya CVDS, ISO/IEC 15938-13) dalam domain video.
Deskriptor ringkas untuk analisis video untuk aplikasi pencarian dan pengambilan:
- mengaktifkan desain aplikasi pencarian instance objek yang dapat dioperasikan;
- meminimalkan ukuran deskriptor video;
- memastikan kinerja objek yang cocok (dalam hal akurasi dan kompleksitas);
- memungkinkan implementasi yang efisien dari fungsionalitas tersebut pada sistem profesional atau tertanam.
Dokumen ini menyediakan alat pelengkap untuk rangkaian standar yang ada, seperti ISO/IEC 15938-13.
Penerbitan Standar ISO/IEC 15938-15:2019
Standar ini diterbitkan dan dipublikasikan pada Juli 2019, berupa dokumen edisi 1 dengan jumlah halaman sebanyak 32 lembar.
Disusun oleh :
- Technical Committee ISO/IEC JTC 1/SC 29 Coding of audio, picture, multimedia and hypermedia information,
- atau : Komite Teknis ISO/IEC JTC 1/SC 29 Coding informasi audio, gambar, multimedia dan hypermedia.
ICS :
- 35.040.40 Coding of audio, video, multimedia and hypermedia information, atau : 35.040.40 Pengkodean informasi audio, video, multimedia dan hypermedia
Standar ini berkontribusi pada Tujuan Pembangunan Berkelanjutan atau Sustainable Development Goal berikut:
- Kota dan masyarakat berkelanjutan
- Industri, inovasi dan infrastruktur
- Pekerjaan yang layak dan pertumbuhan ekonomi
Sebagaimana standar ISO lainnya, ISO/IEC 15938-15:2019 ini juga ditinjau setiap 5 tahun dan peninjauan sudah mencapai tahap 60.60.
Isi Standar ISO/IEC 15938-15:2019
Berikut adalah kutipan isi Standar ISO/IEC 15938-15:2019 yang diambil dari Online Browsing Platform (OBP) dari situs resmi iso.org.
Yang ditambah dengan berbagai keterangan dan informasi untuk mempermudah pemahaman pembaca.
Hanya bagian standar yang informatif yang tersedia untuk umum, OBP hanya menampilkan hingga klausa 3 saja.
Oleh karena itu, untuk melihat konten lengkap dari standar ini, maka pembaca harus membeli standar dari ISO ini secara resmi.
Daftar Isi Standar ISO/IEC 15938-15:2019
- Foreword
- Introduction
- 1 Scope
- 2 Normative references
- 3 Terms and definitions
- 4 Abbreviated terms, operators, mnemonics, functions and symbols
- 4.1 General
- 4.2 Abbreviated terms
- 4.3 Arithmetic operators
- 4.4 Logical operators
- 4.5 Relational operators
- 4.6 Bitwise operators
- 4.7 Interval specification
- 4.8 Mnemonics
- 4.9 Functions
- 4.10 Symbols
- 5 CDVA bitstream syntax
- 5.1 CDVA descriptor
- 5.2 CDVA header
- 5.3 Segment header
- 5.4 Global descriptor
- 5.5 Local descriptor
- 5.6 Deep feature descriptor
- 6 CDVA descriptor
- 6.1 Components
- 6.2 Encoding procedure
- Annex A Recommended parameter values
- Annex B Parameters of the deep feature extraction process
- B.1 CNN for deep feature extraction
- B.2 Mean NIP vector for binarization of deep feature descriptors
- Bibliography
Kata pengantar
Sebagaimana tercantum dalam “Klausa 0 Foreword”, bahwa :
ISO (Organisasi Internasional untuk Standardisasi) dan IEC (Komisi Elektroteknik Internasional) membentuk sistem khusus untuk standardisasi dunia.
Badan nasional yang menjadi anggota ISO atau IEC berpartisipasi dalam pengembangan Standar Internasional melalui komite teknis yang dibentuk oleh organisasi masing-masing untuk menangani bidang kegiatan teknis tertentu.
Komite teknis ISO dan IEC berkolaborasi dalam bidang yang menjadi kepentingan bersama.
Organisasi internasional lainnya, pemerintah dan non-pemerintah, bekerja sama dengan ISO dan IEC, juga ambil bagian dalam pekerjaan tersebut.
Prosedur yang digunakan untuk mengembangkan dokumen ini dan yang dimaksudkan untuk pemeliharaan lebih lanjut ditentukan dalam Arahan ISO/IEC, Bagian 1.
Khususnya kriteria persetujuan yang berbeda yang diperlukan untuk jenis dokumen yang berbeda harus diperhatikan.
Dokumen ini disusun sesuai dengan aturan editorial Arahan ISO/IEC, Bagian 2 (lihat www.iso.org/directives).
Perhatian tertuju pada kemungkinan bahwa beberapa elemen dari dokumen ini dapat menjadi subjek dari hak paten.
ISO dan IEC tidak bertanggung jawab untuk mengidentifikasi salah satu atau semua hak paten tersebut.
Rincian hak paten yang teridentifikasi selama pengembangan dokumen akan ada di Pendahuluan dan/atau di daftar ISO dari deklarasi paten yang diterima (lihat www.iso.org/patents).
Setiap nama dagang yang digunakan dalam dokumen ini adalah informasi yang diberikan untuk kenyamanan pengguna dan bukan merupakan suatu dukungan.
Tersedia pula halaman Foreword – Supplementary information untuk :
- penjelasan tentang arti istilah dan ekspresi khusus ISO yang terkait dengan penilaian kesesuaian,
- informasi tentang kepatuhan ISO terhadap prinsip-prinsip WTO dalam Technical Barriers to Trade (TBT).
Panitia yang bertanggung jawab atas dokumen ini adalah :
- ISO/IEC JTC 1, Information technology, SC 29, Coding of audio, picture, multimedia and hypermedia information,
- atau : ISO/IEC JTC 1, Teknologi informasi, SC 29, Coding audio, gambar, informasi multimedia dan hypermedia.
Mengenal ISO, IEC, WTO dan TBT Agreement
ISO (International Organization for Standardization) adalah suatu organisasi atau lembaga nirlaba internasional,
Tujuan dari ISO adalah untuk membuat dan memperkenalkan standar dan standardisasi internasional untuk berbagai tujuan.
Sebagaimana ISO, IEC juga merupakan suatu organisasi standardisasi internasional yang menyusun dan menerbitkan standar-standar internasional.
Namun ruang lingkupnya adalah untuk seluruh bidang elektrik, elektronik dan teknologi yang terkait atau bidang teknologi elektro (electrotechnology).
TBT Agreement (Technical Barriers to Trade) adalah perjanjian internasional mengenai hambatan teknis perdagangan di bawah kerangka Organisasi WTO (World Trade Organization).
WTO (World Trade Organization) adalah sebuah organisasi resmi internasional yang mengatur standar sistem perdagangan bebas di dunia.
Lebih jelas mengenai ISO, IEC, WTO dan TBT Agreement dapat dibaca pada artikel lain dari standarku.com berikut :
- Mengenal organisasi ISO, standardisasi internasional
- Standar IEC
- TBT Agreement, Standar Teknis Perdagangan
- Standar World Trade Organization
Pengantar Standar
Sebagaimana tercantum dalam “Klausa 0 Introduction”, bahwa :
ISO/IEC 15938 (semua bagian), juga dikenal sebagai ” Multimedia Content Description Interface (Antarmuka Uraian Konten Multimedia)”, menyediakan serangkaian teknologi standar untuk mendeskripsikan konten multimedia.
Ini membahas spektrum yang luas dari aplikasi dan persyaratan multimedia dengan menyediakan sistem metadata untuk menggambarkan fitur konten multimedia.
Berikut ini ditentukan dalam ISO/IEC 15938 ini (semua bagian):
- Skema Deskripsi atau Description Schemes (DS) menjelaskan entitas atau hubungan yang berkaitan dengan konten multimedia. Skema deskripsi menentukan struktur dan semantik komponennya, yang mungkin berupa Skema Deskripsi, deskriptor, atau tipe data.
- Descriptors atau Deskriptor (D) mendeskripsikan fitur, atribut, atau grup atribut konten multimedia.
- Datatypes atau Tipe data adalah tipe data dasar yang dapat digunakan kembali yang digunakan oleh skema deskripsi dan deskriptor.
- Bahasa definisi deskripsi atau Description Definition Language (DDL) mendefinisikan skema deskripsi, deskriptor, dan tipe data dengan menentukan sintaksnya, dan mengizinkan ekstensinya.
- Peralatan sistem mendukung pengiriman deskripsi, multiplexing deskripsi dengan konten multimedia, sinkronisasi, format file, dan sebagainya.
Bagian Standar
Seri ISO/IEC 15938 dibagi menjadi 15 bagian yang diterbitkan dengan bagian selanjutnya dalam pengembangan:
- 1 Systems atau Sistem: menentukan alat untuk menyiapkan deskripsi untuk transportasi dan penyimpanan yang efisien, mengompresi deskripsi, dan memungkinkan sinkronisasi antara konten dan deskripsi.
- 2 Description definition language atau Bahasa definisi deskripsi: menentukan bahasa untuk mendefinisikan seperangkat alat deskripsi Standar Internasional (DS, D, dan tipe data) dan untuk mendefinisikan alat deskripsi baru.
- 3 Visual: menentukan alat deskripsi yang berkaitan dengan konten visual.
- 4 Audio: menentukan alat deskripsi yang berkaitan dengan konten audio.
- 5 Multimedia description schemes atau Skema deskripsi multimedia: menentukan alat deskripsi generik yang berkaitan dengan multimedia termasuk konten audio dan visual.
- 6 Reference software atau Perangkat lunak referensi : menyediakan implementasi perangkat lunak dari rangkaian tersebut.
- 7 Conformance testing atau Pengujian Kesesuaian : menentukan pedoman dan prosedur pengujian kesesuaian implementasi rangkaian.
- 8 Extraction and use of MPEG-7 descriptions (Ekstraksi dan penggunaan deskripsi MPEG-7) : memberikan pedoman dan contoh ekstraksi dan penggunaan deskripsi.
- 9 Profiles and Levels (Profil dan Level) : memberikan pedoman dan profil standar.
- 10 Schema Definition (Definisi Skema) : menentukan skema menggunakan bahasa definisi deskripsi.
- 11. MPEG-7 Profile Schemas (Skema Profil MPEG-7) : daftar skema profil menggunakan bahasa definisi deskripsi.
- 12. Query Format (Format Permintaan) : berisi alat format kueri MPEG (MPQF).
- 13. Compact descriptors for visual search (Deskriptor ringkas untuk pencarian visual) : menentukan alat deskripsi gambar untuk aplikasi pencarian visual.
- 14. Reference software, conformance and usage guidelines for compact descriptors for visual search (Perangkat lunak referensi, panduan kesesuaian dan penggunaan untuk deskriptor ringkas untuk pencarian visual) : menyediakan perangkat lunak referensi dan panduan, menentukan pengujian kesesuaian.
- 15. Compact descriptors for video analysis (this document) {Deskriptor ringkas untuk analisis video (dokumen ini)} : menentukan alat deskripsi video yang dirancang untuk mengaktifkan aplikasi analisis video yang efisien dan dapat dioperasikan, yang memungkinkan pencocokan konten visual dalam video.
Klausa dan Lampiran
Struktur dokumen ini adalah sebagai berikut:
- Klausa 5 menentukan sintaks representasi biner dan semantik komponen deskriptor untuk deskriptor CDVA.
- Klausa 6 menentukan proses ekstraksi dan pengkodean untuk deskriptor CDVA.
- Lampiran A menentukan nilai yang direkomendasikan untuk parameter proses pengkodean Klausul 6.
- Lampiran B menentukan parameter dan model jaringan neural dari proses ekstraksi fitur mendalam.
ISO dan IEC
Organisasi Internasional untuk Standardisasi (ISO) dan Komisi Elektroteknik Internasional (IEC) menarik perhatian pada fakta yang diklaim bahwa kepatuhan terhadap dokumen ini mungkin melibatkan penggunaan paten.
ISO dan IEC tidak mengambil posisi mengenai bukti, validitas dan ruang lingkup hak paten ini.
Pemegang hak paten ini telah meyakinkan ISO dan IEC bahwa dia bersedia untuk menegosiasikan lisensi berdasarkan syarat dan ketentuan yang wajar dan tidak diskriminatif dengan pemohon di seluruh dunia.
Dalam hal ini, pernyataan pemegang hak paten ini terdaftar pada ISO dan IEC. Informasi dapat diperoleh dari: Joanneum Research Forschungagesellshaft mbH, Leonhardstrasse 59, 8010 Graz, Austria.
Perhatian tertuju pada kemungkinan bahwa beberapa elemen dari dokumen ini mungkin tunduk pada hak paten selain yang disebutkan di atas.
ISO dan IEC tidak bertanggung jawab untuk mengidentifikasi salah satu atau semua hak paten tersebut.
ISO/IEC 15938-15:2019 Klausa 1-3
1 Scope : Lingkup
Dokumen ini membahas teknologi deskriptor untuk aplikasi pencarian dan pengambilan, yaitu untuk pencocokan konten visual dalam video.
Pencocokan konten visual mencakup pencocokan tampilan objek dan pemandangan besar dan kecil, dengan ketahanan terhadap oklusi parsial serta perubahan titik pandang, parameter kamera, dan kondisi pencahayaan.
Objek yang diminati terdiri dari objek planar atau non-planar, kaku atau sebagian kaku, bertekstur atau bertekstur sebagian, tetapi tidak termasuk identifikasi orang dan wajah.
Basis datanya bisa besar, misalnya arsip siaran atau video yang tersedia di internet.
Oleh karena itu, aplikasi semacam itu memerlukan deskriptor video yang memungkinkan pencocokan dengan ukuran deskriptor yang lebih kecil dan runtime yang lebih pendek dibandingkan dengan aplikasi yang diaktifkan oleh deskriptor bingkai tunggal (gambar diam) (misalnya CVDS, ISO/IEC 15938-13) dalam domain video.
Deskriptor ringkas untuk analisis video untuk aplikasi pencarian dan pengambilan:
- mengaktifkan desain aplikasi pencarian contoh objek yang dapat dioperasikan;
- meminimalkan ukuran deskriptor video;
- memastikan kinerja pencocokan objek yang tinggi (dalam hal akurasi dan kompleksitas);
- memungkinkan implementasi yang efisien dari fungsionalitas tersebut pada sistem profesional atau tertanam.
Dokumen ini menyediakan alat pelengkap untuk rangkaian standar yang ada, seperti ISO/IEC 15938-13.
2 Normative references : Referensi normatif
Dokumen referensi berikut sangat diperlukan untuk penerapan dokumen ini. Untuk referensi bertanggal, hanya edisi yang dikutip yang berlaku.
Untuk referensi yang tidak bertanggal, berlaku edisi terbaru dari dokumen referensi (termasuk amandemen).
- ISO/IEC 15938-13:2015, Information technology — Multimedia content description interface — Part 13: Compact descriptors for visual search
- Neural Network Exchange Format, The Khronos Group, Version 1.0, Revision 3, 2018-06-13.
- RFC 3986, Uniform Resource Identifier (URI): Generic Syntax, Jan. 2005.
3 Terms and definitions : Istilah dan definisi
Untuk tujuan dokumen ini, istilah dan definisi berikut berlaku.
ISO dan IEC memelihara database terminologis untuk digunakan dalam standardisasi di alamat berikut:
- Platform penelusuran online ISO: tersedia di https://www.iso.org/obp
- IEC Electropedia: tersedia di http://www.electropedia.org/
Klausa 3.1 – 3.6
3.1 image descriptor : deskriptor gambar
deskriptor diekstraksi dari bingkai kunci tunggal (3.6) sampel dari video input (3.8), yang berisi deskriptor global (3.2), deskriptor fitur lokal (3.3) dan deskriptor fitur dalam (3.4)
Catatan 1 : Deskriptor gambar dikodekan seperti yang dijelaskan dalam Klausul 6.
3.2 global descriptor : deskriptor global
agregasi deskriptor fitur lokal menjadi representasi gambar yang ringkas (3.5)
- Catatan 1 : Pengumpulan seperti yang dijelaskan dalam subpasal 6.1.2.
3.3 local feature descriptor : deskriptor fitur lokal
deskriptor wilayah lokal, diekstraksi di sekitar titik minat (titik dalam gambar (3.5) yang menunjukkan stabilitas deteksi di bawah gangguan lokal dan global dalam domain gambar, termasuk transformasi perspektif, perubahan skala gambar, dan variasi iluminasi)
- Catatan 1 : Ekstraksi seperti yang dijelaskan dalam subpasal 6.1.3.
3.4 deep feature descriptor : deskriptor fitur yang dalam
deskriptor fitur yang diekstrak dari lapisan jaringan saraf convolutional terlatih
- Catatan 1 : Ekstraksi seperti yang dijelaskan dalam subpasal 6.1.4.
3.5 image : gambar
masukan key frame (3.6) ke image descriptor (3.1) encoder
- Catatan 1 : Gambar seperti yang dijelaskan dalam Klausul 6.
3.6 key frame : bingkai kunci
frame diekstrak dari segmen input video (3.7) dengan proses perbedaan frame dari histogram warna
- Catatan 1 : Ekstraksi seperti yang dijelaskan dalam subpasal 6.2.
Klausa 3.7 – 3.11
3.7 input video segment : segmen video masukan
rentang waktu (segmen temporal) video dan dari mana deskriptor diekstraksi
3.8 input video : video masukan
urutan gambar untuk diproses oleh sistem yang berisi sejumlah segmen video input (3.7) ke proses ekstraksi CDVA
- Catatan 1 : Video masukan seperti yang dijelaskan dalam Klausul 6.
3.9 segment descriptor : deskriptor segmen
deskriptor yang diekstraksi dari bingkai kunci sampel (3.6) dari segmen video input (3.7)
- Catatan 1 : Deskriptor segmen dikodekan seperti yang dijelaskan dalam Klausul 6. Mereka dibuat dari deskriptor gambar (3.1) dari bingkai kunci sampel dari segmen video masukan.
3.10 representative frame : bingkai perwakilan
bingkai dari segmen video input (3.7) yang direpresentasikan oleh deskriptor yang tidak dikompresi dan yang digunakan sebagai dasar untuk pengkodean diferensial
3.11 pixel : piksel
elemen yang dapat diindeks pada kisi bilangan bulat dari gambar asli atau gambar yang dikonversi, yang terdiri dari koordinat spasial, nilai luminance, dan nilai chrominance (opsional)
Daftar Pustaka atau Bibliography :
- [1] Langdon G. G., Adaptive binary arithmetic coding for multi-media applications, Compcon Spring, Digest of Papers, San Francisco, CA, USA, 1991, pp. 354-357, DOI: 10.1109/CMPCON.1991.128833
- [2] Simonyan K., Zisserman A., Very deep convolutional networks for large-scale image recognition. arXiv:1409.1556, 2014
Penutup
Demikian artikel dari standarku.com mengenai Standar ISO/IEC 15938-15:2019.
Mohon saran dari pembaca untuk kelengkapan isi artikel ini, silahkan saran tersebut dapat disampaikan melalui kolom komentar.
Baca artikel lain :
- International Organization for Standardization
- Memahami apa itu Standar ISO
- Memahami Standard atau Standar
Sumber referensi :