Mereka yang melewatkan masa remaja di era 1980-an, pasti mengenal kuis “Berpacu dalam Melodi” yang dibawakan oleh Koes Hendratmo, dan “Gita Remaja” yang digawangi oleh Tantowi Yahya.

Dalam kedua kuis televisi tersebut, peserta akan diperdengarkan petikan melodi sebuah lagu, kemudian diminta untuk menebak judulnya. Mereka yang mengoleksi banyak lagu dalam otaknya, dan memiliki kecerdasan musikal, mampu menebak judul lagu dengan tepat. Fakta di atas menunjukkan bahwa manusia memiliki kecerdasan untuk mengenali sebuah informasi yang utuh dari sebagian isinya. Tidak hanya musik, ketika membaca penggalan teks “… diselenggarakan dengan tjara seksama dan dalam tempo jang sesingkat-singkatnja,” misalnya, Anda pasti tahu bahwa yang dimaksud naskah proklamasi kemerdekaan kita.

Kemampuan mengenali sebuah informasi dari sebagian isinya, saat ini juga dimiliki oleh komputer yang dikenal dengan istilah content recognition. Dengan software ini, konten yang terdapat di website file dan video sharing, seperti Multiply, YouTube, dan yang sejenisnya, dapat di-scan untuk mengetahui apakah terdapat file-file yang dilindungi hak cipta.

Mendesain software untuk mengenali konten sebuah file, menjadi tantangan tersendiri bagi para programmer. Banyaknya cara mengencode file audio dan video, serta varian bit rate dan noise, membuat program sulit mengenali sebuah file dari kode binarinya. File WAV dan MP3 misalnya, dapat memainkan musik yang sama, namun memiliki kode yang berbeda. Demikian pula halnya pada file video. Jika pernah menonton film dari DVD bajakan, Anda pasti tahu beberapa film direkam dengan kamera yang dibawa ke ruang pertujukan bioskop.

Semua tindakan di atas membuat kode file-file video tersebut memiliki kode yang berbeda. Lantas, bagaimana merancang software content recognition dapat mengenali semua varian file audio dan video?

Audio Content Recognition

Langkah pertama untuk mengidentifikasi konten adalah membuat sebuah database yang berisi materi-materi musik sebagai rujukan bagi file yang akan di-scan. Software audio content recognition menganalisis setiap lagu, dan membuat tag-tag digital yang mengidentifikasi lagu tersebut. Tag ini disebut fingerprint atau signature. Selanjutnya, software menganalisis suara musik yang sedang dimainkan, bukan kode-kode digitalnya (lihat Speech Recognition).

Sebagian program menganalisis tempo dan irama atau hentakan sebuah lagu. Sebagian lainnya mengukur amplitudo dan frekuensi lagu. Pembuatan fingerprint biasanya mengambil beberapa detik sampel dari masing-masing lagu. Namun, ada pula software yang menganalisis sebuah lagu secara utuh untuk mendapatkan fingerprint yang lengkap. Atau paling tidak, software menganalisis bagian-bagian yang paling menonjol (landmark) dalam sebuah lagu.

Program-program tersebut menggunakan algoritma untuk menganalisis suara. Sebagian besar menggunakan algoritma Fast Fourier Transform (FFT). Teknik matematis ini dapat mengambil serangkaian sinyal kompleks, dan melacak perubahan yang ada di dalamnya. Perubahan-perubahan tersebut–apakah perubahan tempo, hentakan per menit, atau amplitudo dan frekuensi suara–dipetakan, dan secara matematis dikonversi ke dalam figerprint digital. Fingerprint biasanya disimpan dalam format numerik.

Begitu database selesai, perusahaan rekaman dapat langsung menggunakannya untuk mendukung penjualan musik kepada calon pembeli, yang hanya tahu beberapa bagian dari sebuah lagu sekaligus melacak pendistribusian musiknya secara ilegal.

Video Content Recognition

Baru-baru ini, Time Warnet dan Disney bekerja sama dengan YouTube menguji software video content recognition yang dikembangkan oleh Google. Software ini serupa dengan audio content recognition yang telah lebih dulu ada, yakni menganalisis konten untuk membuat fingerprint. Kemudian, software  membandingkannya dengan informasi yang ada dalam database untuk mencari kesamaan. Walaupun demikian, video menyisakan tantangan unik yang masih belum terpecahkan.

Sebagai contoh, sebagian besar video yang ada di YouTube berdurasi 10 menit atau berukuran 100 MB. Untuk mengetahui apakah 10 menit tayangan tersebut merupakan segmen dari sebuah film atau acara televisi yang dilindungi hak cipta, software harus menganalisis keseluruhan film  agar dapat mengenali potongan-potongan video yang lebih kecil. Selain itu, software juga harus mampu mengidentifikasi sebuah adegan, jika film yang di-upload telah diedit terlebih dahulu.

Misalnya, orang bisa mengelabui software yang mencocokkan resolusi warna dengan men-tweak saturasi warna dalam sebuah video. Memotong video atau meng-upload adegan yang diambil dari sebuah film dengan kamera video, juga dapat mengelabui software. Beberapa film bajakan yang merekam gambar dari dalam bioskop, dengan sudut yang agak miring. Hal ini juga dapat membuat proses identifikasi menjadi lebih rumit.

sumber: Tabloid PCMild

Togap Tartius

Freelance web developer. Mantan guru komputer. Suka membaca dan berpikir. Hobi mengutak-atik komputer baik software maupun hardware.

More PostsWebsite

Follow Me:
TwitterFacebookLinkedInGoogle Plus