Perbedaan Multimedia Mining dan Multimedia Retrieval

Altien J. Rindengan (G651080041)

MULTIMEDIA MINING

Multimedia mining adalah salah satu bagian ilmu data mining untuk menambang/menggali pengetahuan dari informasi atau data multimedia. Akan tetapi multimedia mining tidak sekedar perluasan dari data mining, karena merupakan upaya interdisipliner yang memanfaatkan keahlian dalam multimedia retrieval, pengolahan data multimedia, computer vision, machine learning, dan kecerdasan buatan.  Multimedia mining berkaitan dengan ekstraksi pengetahuan implisit, relasi data multimedia, atau pola lain yang tidak secara eksplisit disimpan dalam file multimedia.

Sistem multimedia mining dapat secara otomatis mengekstraksi informasi semantik sebagai pengetahuan dari file multimedia.  Umumnya, sistem database multimedia mengelola koleksi besar objek multimedia, seperti image, video, audio dan data hypertext.

Secara umum, file multimedia dari database harus  mengalami praproses sesuai dengan format data yang sesuai, selanjutnya mengalami berbagai transformasi dengan ekstraksi fitur untuk menghasilkan fitur penting dari file multimedia.  Dengan fitur yang dihasilkan, mining dapat dilaksanakan dengan menggunakan teknik data mining untuk menemukan pola signifikan untuk kemudian dievaluasi dan diinterpretasikan untuk mendapatkan pengetahuan yang diinginkan.

Proses aplikasi multimedia mining dapat dilihat pada Gambar 1 berikut (Kotsiantis et al, 2004).

Gambar 1.  Proses multimedia mining

Pengumpulan data adalah titik awal dari sebuah pembelajaran sistem, sehingga kualitas data mentah dicapai pada kinerja secara keseluruhan.  Disini akan dilakukan ekstraksi fitur yang sesuai dengan tipe data yang ada (teks, gambar, audio, video), misalkan untuk data teks dengan tokenisasi, dan data audio dilihat dari pitch atau frekuensi audio.  Kemudian, tujuan dari pra-proses data adalah untuk menemukan fitur penting atau seleksi  fitur dari data mentah. Pra-proses data meliputi pembersihan data, normalisasi, transformasi, seleksi fitur, dll.  Proses pembelajaran bisa cepat, jika informatif fitur dapat diidentifikasi pada tahap pra-proses.  Hasil dari pra-proses data adalah training set. Jika diberikan sebuah training set, sebuah model pembelajaran harus memilih untuk belajar dari itu. Kemudian dengn machine learning dapat diperoleh model yang diinginkan dengan cara klasifikasi atau kluster.

MULTIMEDIA RETRIEVAL

Jika multimedia mining adalah bagian ilmu dari data mining, maka multimedia retrival adalah bagian dari ilmu temu kembali informasi yang menfokuskan pada temu kembali informasi dari data multimedia.  Secara umum, teknik-teknik yang dilakukan sama pada temu kembali informasi untuk data bukan multimedia.  Berbeda dengan data yang hanya berupa numeric atau teks, karena data multimedia bisa apa saja (teks, audio, image dan video) maka multimedia retrieval adalah model temu kembali informasi berbasis konten (content-base infromastion retrieval).  Disini yang bisa menjadi query tidak hanya teks atau angka saja, bisa audio atau gambar tergantung jenis data yang akan dicari.

Wei dan Li, 2004, menyajikan arsitektur untuk data multimedia berdasarkan content-base infromastion retrieval, sebagai berikut :

Gambar 2. Arsitektur content-base information retrieval untuk data multimedia

Dalam content-base information retrieval system, konten media dalam database diekstrak dan dideskripsikan oleh vector fitur multi-dimensi, atau disebut deskriptor. Vektor fitur media merupakan fitur dataset. Untuk mengambil data yang diinginkan, pengguna mengirimkan contoh query untuk system temu kembali. Sistem kemudian merepresentasikan contoh-contoh ini dengan vector fitur. Jarak (yaitu, dalam arti ukuran kesamaan) antara vektor fitur dari contoh query dan yang ada di media dalam fitur dataset kemudian dihitung dan dirangking. Temu kembali dilakukan dengan menerapkan suatu skema pengindeksan untuk memberikan cara yang efisien untuk mencari database media. Akhirnya, sistem merangking hasil pencarian dan kemudian mengembalikan hasil pencarian teratas yang paling mirip dengan contoh query.

Untuk content-base information retrieval system, seorang perancang harus mempertimbangkan empat aspek: fitur ekstraksi dan representasi, dimensi reduksi fitur, pengindeksan, dan spesifikasi query.

PERBEDAAN MULTIMEDIA MINING DAN MULTIMEDIA RETRIEVAL

Yang dilakukan dalam multimedia retrieval adalah bagaimana mengekstraksi pengetahuan implisit, relasi data multimedia, atau pola lain yang tidak secara eksplisit disimpan dalam file multimedia (discovering), dibanding pada multimedia retrieval yang hanya untuk merangking query yang dicari untuk disajikan ke user (searching).

Multimedia retrieval hanya menekankan pada temu kembali data/informasi yang sesuai dengan query yang diminta.  Sedangkan multimedia mining mengelola data/informasi yang sesuai dengan proses analisa yang diterapkan agar diperoleh informasi yang lebih banyak (pengetahuan) berdasarkan query yang diminta.

Karena data perlu  dianalisa berdasarkan teori dalam data mining, maka dalam multimedia mining harus melakukan cleaning data dan seleksi fitur untuk membuat analisanya menjadi lebih cepat dan sederhana, artinya data yang “tidak baik” dibuang saja dan fitur yang tidak signifikan mempengaruhi tidak perlu diikutkan dalam analisa.  Sedangkan pada multimedia retrieval, hal ini tidak dilakukan.

Pustaka

Kotsiantis, S., D. Kanellopoulos, P. Pintelas. 2004.   Multimedia Mining. WSEAS Transactions on Systems, Issue 10, Vol.3:3263-3268.

Wei, C-H., & Li, C-T. 2004.  Design of Content-based Multimedia Retrieval. Department of Computer Science University of Warwick, Coventry UK.

Pos ini dipublikasikan di Data Mining. Tandai permalink.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s