Selasa, 03 Maret 2015
Nama/NIM: I Gede Kusuma Ary Jaya/1204505034
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.
Definisi Information Retrieval
Information
Retrieval (IR) adalah bagaimana menemukan suatu dokumen dari
dokumen-dokumen tidak terstruktur yang memberikan informasi yang dibutuhkan
dari koleksi dokumen yang sangat besar yang tersimpan dalam komputer. (Manning,
2008). ISO 2382/1 mendefinisikan IR sebagai tindakan, metode dan prosedur demi menemukan
kembali data yang tersimpan untuk menyediakan informasi mengenai subyek yang
dibutuhkan. Tidakan tersebut mencakup text indexing, inquiry analysis, dan
relevance analysis; data mencakup text, tabel, gambar, ucapan, dan video;
sedangkan informasi termasuk pengetahuan relevan yang dibutuhkan untuk mendukung
penyelesaian masalah dan akuisisi pengetahuan.
Tujuan dari sistem IR
adalah untuk memenuhi kebutuhan informasi pengguna dengan meretrieve semua
dokumen yang mungkin relevan, pada waktu yang sama me-retrieve sesedikit
mungkin dokumen yang tidak relevan. Sistem IR yang baik memungkinkan pengguna
menentukan secara cepat dan akurat apakah isi dari dokumen yang diterima
memenuhi kebutuhannya. Tujuan yang harus dipenuhi adalah bagaimana menyusun
dokumen yang telah didapatkan tersebut ditampilkan terurut dari dukumen yang
memiliki tingkat relevansi tinggi ke tingkat relevansi yang lebih rendah.
Penyusunan dokumen tersebut disebut sebagai perangkingan dokumen.
Model IR adalah model
yang digunakan untuk melakukan pencocokan antara termterm (kata) dari query
dengan term-term dalam document collection (folder file), model yang terdapat
dalam IR terbagi dalam 3 model besar, yaitu :
a. Set-theoritic models
Model ini merepresentasikan
dokumen sebagai himpunan kata atau frase. Contoh model ini adalah Standard Boolean model dan Extended Boolean model.
b. Algebraic model
Model merepresentasikan
dokumen dan query sebagai vektor similarity antara vektor dokumen dan vektor query yang direpresentasikan sebagai
sebuah nilai skalar. Contoh model ini adalah Vektor Space Model (model ruang vektor), Latent Semantic Indexing (LSI) dan Generalized Vector Space Model (GVSM).
c. Probabilistic model
Model ini memperlakukan
proses pengambilan dokumen sebagai sebuah probabilistic
inference. Contoh model ini ialah penerapan teorema bayes dalam model probabilistik.
Proses Searching Information Retrieval
Ilustrasi
mengenai bagaimana proses searching
information retrieval dapat dilihat pada Gambar 1.
Gambar 1. Proses Searching
Beberapa proses yang
terjadi saat melakukan search sesuai dengan ilustrasi Gambar 1 yaitu :
a. Parse query yaitu memecah query menjadi
bentuk token.
b. Proses Stopword filtration.
Token-token
query yang telah dihasilkan pada
proses parse query kemudian difilter melalui proses pembuangan token
yang termasuk Stopword.
c. Proses Stemming
Stopword
tokens dari proses stopword sebelumnya kemudian difilter kembali melalui proses stemming sehingga menghasilkan stemmed term query.
d. Transformasi Query
Stemmed
term query yang dihasilkan kemudian ditransformasikan apabila
memerlukan. Artinya, apabila query
yang diinputkan membutuhkan terjemahan ke dalam bentuk query bahasa lain maka sebelum mencari dokumen pada koleksi
dokumen, query tersebut diterjemahkan
duhulu melalui proses penerjemahan query.
Sistem akan membandingkan query
tersebut dengan koleksi dokumen sehingga mengembalikan dokumen-dokumen yang
relevan dalam suatu bahasa yang berbeda dengan bahasa query.
e. Pemodelan dalam model ruang vektor
Tiap term atau kata yang ditemukan pada
dokumen dan query diberi bobot dan
disimpan sebagai salah satu elemen vektor dan dihitung nilai kemiripan antara query dan dokumen.
f. Perangkingan
dokumen atau konten berdasarkan nilai kemiripan antara query dan dokumen.
Peranan Information Retrieval
Information
Retrieval memiliki beberapa peranan yang sangat penting bagi
penggunanya antara lain:
a. Menganalisis
isi sumber informasi (dokumen).
b. Mengidentifikasi
sumber informasi yang relevan dengan minat masyarakat pengguna yang ditargetkan.
c. Menyempurnakan
unjuk kerja sistem berdasarkan umpan balik yang diberikan oleh pengguna.
d. Menemu-kembalikan
informasi yang relevan.
e. Mempertemukan
pernyataan pencarian dengan data yang tersimpan dalam basis data.
f. Merepresentasikan
pertanyaan (query) pengguna dengan cara tertentu yang memungkinkan untuk
dipertemukan sumber informasi yang terdapat dalam basis data.
g. Merepresentasikan
isi sumber informasi dengan cara tertentu yang memungkinkan untuk dipertemukan
dengan pertanyaan (query) pengguna.
Contoh Information Retrieval
User menggunakan search engine Google dalam melakukan searching informasi tentang tim robot kampus Universitas Udayana,
di mana:
a. Dibiayai
oleh PENS-UNUD.
b. Ikut
serta dalam turnamen internasional kontes robot di Jepang.
User
melakukan search dengan keyword “tim robot UNUD yang dibiayai
PENS-UNUD dan pernah ikut turnamen internasional di Jepang”.
Deskripsi
kebutuhan informasi user demikian
tidak dapat langsung didapatkan meski melalui search engine Google. Sebaliknya, user harus menterjemahkan terlebih dahulu kebutuhan informasi yang
diharapkan melalui suatu query yang
kemudian akan diproses oleh search engine.
Hasil dari penerjemahan oleh user
tadi berupa keyword (index) atau kata kunci yang merupakan
ringkasan dari deskripsi tadi. Sehingga dari keyword yang dimasukkan user
untuk pencarian tadi, sistem IR akan mencari informasi, yang mana informasi
yang didapatkan mengandung relevansi/keterkaitan dengan yang diharapkan user tadi misalkan “turnamen International robot PENS-UNUD” atau “tim
robot PENS-UNUD”.
Referensi
IMPLEMENTASI
METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL oleh Jasman Pardede, Mira Musrini Barmawi, Wildan
Denny Pramono
Langganan:
Posting Komentar (Atom)
0 komentar:
Posting Komentar