Selasa, 03 Maret 2015

Information Retrieval

Nama/NIM: I Gede Kusuma Ary Jaya/1204505034
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.


Definisi Information Retrieval

Information Retrieval (IR) adalah bagaimana menemukan suatu dokumen dari dokumen-dokumen tidak terstruktur yang memberikan informasi yang dibutuhkan dari koleksi dokumen yang sangat besar yang tersimpan dalam komputer. (Manning, 2008). ISO 2382/1 mendefinisikan IR sebagai tindakan, metode dan prosedur demi menemukan kembali data yang tersimpan untuk menyediakan informasi mengenai subyek yang dibutuhkan. Tidakan tersebut mencakup text indexing, inquiry analysis, dan relevance analysis; data mencakup text, tabel, gambar, ucapan, dan video; sedangkan informasi termasuk pengetahuan relevan yang dibutuhkan untuk mendukung penyelesaian masalah dan akuisisi pengetahuan. 
Tujuan dari sistem IR adalah untuk memenuhi kebutuhan informasi pengguna dengan meretrieve semua dokumen yang mungkin relevan, pada waktu yang sama me-retrieve sesedikit mungkin dokumen yang tidak relevan. Sistem IR yang baik memungkinkan pengguna menentukan secara cepat dan akurat apakah isi dari dokumen yang diterima memenuhi kebutuhannya. Tujuan yang harus dipenuhi adalah bagaimana menyusun dokumen yang telah didapatkan tersebut ditampilkan terurut dari dukumen yang memiliki tingkat relevansi tinggi ke tingkat relevansi yang lebih rendah. Penyusunan dokumen tersebut disebut sebagai perangkingan dokumen.
Model IR adalah model yang digunakan untuk melakukan pencocokan antara termterm (kata) dari query dengan term-term dalam document collection (folder file), model yang terdapat dalam IR terbagi dalam 3 model besar, yaitu :
a.         Set-theoritic models
Model ini merepresentasikan dokumen sebagai himpunan kata atau frase. Contoh model ini adalah Standard Boolean model dan Extended Boolean model.
b.         Algebraic model
Model merepresentasikan dokumen dan query sebagai vektor similarity antara vektor dokumen dan vektor query yang direpresentasikan sebagai sebuah nilai skalar. Contoh model ini adalah Vektor Space Model (model ruang vektor), Latent Semantic Indexing (LSI) dan Generalized Vector Space Model (GVSM).
c.         Probabilistic model
Model ini memperlakukan proses pengambilan dokumen sebagai sebuah probabilistic inference. Contoh model ini ialah penerapan teorema bayes dalam model probabilistik.

Proses Searching Information Retrieval

Ilustrasi mengenai bagaimana proses searching information retrieval dapat dilihat pada Gambar 1.
Gambar 1. Proses Searching

Beberapa proses yang terjadi saat melakukan search sesuai dengan ilustrasi Gambar 1 yaitu :
a.         Parse query yaitu memecah query menjadi bentuk token.
b.         Proses Stopword filtration.
            Token-token query yang telah dihasilkan pada proses parse query kemudian difilter melalui proses pembuangan token yang termasuk Stopword.
c.         Proses Stemming
Stopword tokens dari proses stopword sebelumnya kemudian difilter kembali melalui proses stemming sehingga menghasilkan stemmed term query.
d.         Transformasi Query
Stemmed term query yang dihasilkan kemudian ditransformasikan apabila memerlukan. Artinya, apabila query yang diinputkan membutuhkan terjemahan ke dalam bentuk query bahasa lain maka sebelum mencari dokumen pada koleksi dokumen, query tersebut diterjemahkan duhulu melalui proses penerjemahan query. Sistem akan membandingkan query tersebut dengan koleksi dokumen sehingga mengembalikan dokumen-dokumen yang relevan dalam suatu bahasa yang berbeda dengan bahasa query.
e.         Pemodelan dalam model ruang vektor
Tiap term atau kata yang ditemukan pada dokumen dan query diberi bobot dan disimpan sebagai salah satu elemen vektor dan dihitung nilai kemiripan antara query dan dokumen.
f.          Perangkingan dokumen atau konten berdasarkan nilai kemiripan antara query dan dokumen.

Peranan Information Retrieval

Information Retrieval memiliki beberapa peranan yang sangat penting bagi penggunanya antara lain:
a.         Menganalisis isi sumber informasi (dokumen).
b.         Mengidentifikasi sumber informasi yang relevan dengan minat masyarakat pengguna yang ditargetkan.
c.         Menyempurnakan unjuk kerja sistem berdasarkan umpan balik yang diberikan oleh pengguna.
d.         Menemu-kembalikan informasi yang relevan.
e.         Mempertemukan pernyataan pencarian dengan data yang tersimpan dalam basis data.
f.          Merepresentasikan pertanyaan (query) pengguna dengan cara tertentu yang memungkinkan untuk dipertemukan sumber informasi yang terdapat dalam basis data.
g.         Merepresentasikan isi sumber informasi dengan cara tertentu yang memungkinkan untuk dipertemukan dengan pertanyaan (query) pengguna.

Contoh Information Retrieval

User menggunakan search engine Google dalam melakukan searching informasi tentang tim robot kampus Universitas Udayana, di mana:
a.         Dibiayai oleh PENS-UNUD.
b.         Ikut serta dalam turnamen internasional kontes robot di Jepang.
            User melakukan search dengan keyword “tim robot UNUD yang dibiayai PENS-UNUD dan pernah ikut turnamen internasional di Jepang”.­
            Deskripsi kebutuhan informasi user demikian tidak dapat langsung didapatkan meski melalui search engine Google. Sebaliknya, user harus menterjemahkan terlebih dahulu kebutuhan informasi yang diharapkan melalui suatu query yang kemudian akan diproses oleh search engine. Hasil dari penerjemahan oleh user tadi berupa keyword (index) atau kata kunci yang merupakan ringkasan dari deskripsi tadi. Sehingga dari keyword yang dimasukkan user untuk pencarian tadi, sistem IR akan mencari informasi, yang mana informasi yang didapatkan mengandung relevansi/keterkaitan dengan yang diharapkan user tadi misalkan “turnamen International robot PENS-UNUD” atau “tim robot PENS-UNUD”.

Referensi 
IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL oleh Jasman Pardede, Mira Musrini Barmawi, Wildan Denny Pramono

0 komentar:

Posting Komentar

 
Blogger Wordpress Gadgets Read more: http://hzndi.blogspot.com/2012/04/menambahkan-widget-sosial-bookamrking.html#ixzz2DZHFHdWl