Selasa, 10 Maret 2015

Boolean Information Retrieval Model

Nama/NIM: I Gede Kusuma Ary Jaya/1204505034
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.

Definisi Model Boolean
Model ini merupakan model IR sederhana yang berdasarkan atas teori himpunan dan aljabar boolean. Boolean sendiri pertama kali dikembangkan oleh seroang ilmuan matematika bernama George Boole (1815-1864). Yang dikemukakan sebagai suatu struktur logika aljabar yang mencakup operasi Logika AND, OR dan NOR, dan juga teori himpunan untuk operasi union. Di dalam struktur data, Boolean merupakan sebuah tipe data yang bernilai “True” atau “False” (benar atau salah). Sehingga didalam IR logika boolean berartikan bahwa data yang di crawler sesuai atau tidak antara variable – variablenya.
Dalam pengerjaan operator boolean (AND, NOT, OR) ada urutan pengerjaannya (Operator precedence). Urutannya adalah:
- () berarti prioritas yang berada dalam tanda kurung.
- NOT
- AND
- OR
Contoh: Jika ada query seperti berikut:
- (Madding OR crow) AND killed OR slain
- (Brutus OR Caesar) AND NOT (Antony OR Cleopatra)
Misalkan kita ingin mencari dari cerita-cerita karangan shakespeare yang mengandung kata Brutus AND Caesar AND NOT Calpurnia. Salah satu cara adalah: Baca semua teks yang ada dari awal sampai akhir. Komputer juga bisa disuruh melakukan hal ini (menggantikan manusia). Proses ini disebut grepping. Melihat kemajuan komputer jaman sekarang, grepping bisa jadi solusi yang baik. Tapi, kalau sudah bicara soal ribuan dokumen, kita perlu melakukan sesuatu yang lebih baik. Karena ada beberapa tuntutan yang harus dipenuhi :
- Kecepatan dalam pemrosesan dokumen yang jumlahnya sangat banyak.
-   Fleksibilitas.
-   Perangkingan.
Salah satu cara pemecahannya adalah dengan membangun index dari dokumen.

Logical NOT
Dapat mengecualikan item-item dari seperangkat term penelusuran. Pernyataan formulasi sederhana: A NOT B.
Contoh: marketing NOT library. Ini artinya user hanya menginginkan dokumen yang mengandung unsur marketing yang di dalamnya tidak ada unsur marketing yang di dalamnya tidak ada unsur perpustakaannya.

Logical AND
Memperbolehkan penelusur untuk menggunakan pernyataan query ke dalam dua tau lebih konsep sehingga hasil penelusuran menjadi lebih terbatas. Pernyataan formulasi sederhana: A AND B.
Contoh: untuk menelusur marketing and library, user memformulasikan penyataan penelusuran dengan : marketing AND library.
Dengan query tersebut maka kita akan menemukandokumen yang mengandung unsur marketing danperpustakaan saja, dan tidak untuk mendapatkan dokumenyang hanya mengandung unsur marketing atau perpustakaan saja.

Logical OR
Memperbolehkan penelusur untuk secara spesifik menggunakan alternatif term (atau konsep) yang mengindikasikan dua konsep sesuai dengan tujuanpenelusuran. Hal ini menjadikan hasil penelusuran menjadilebih luas, karena adanya alternatif dalam penyataan query.
Formulasi pernyataan sederhana: A OR B.
Contoh: marketing OR library. Dengan query tersebut maka kita akan mendapatkandokumen yang mengandung unsur marketing saja, perpustakaan saja, atau yang mengandung unsur marketing dan perpustakaan.

Kombinasi Logical AND, OR, NOT
Dapat mengkombinasikan satu pernyataan ke dalam penelusuran yang kompleks.
Contoh: marketing AND library OR information centre NOT profit organization. Artinya user ingin mendapatkan dokumen yang mengandung untur marketing dan perpustakaan tanpa unsur pusat informasi dan bukan untuk organisasi non profit.

Kelebihan Model Boolean
1.  Mudah untuk diimplementasikan.
2.  Konsep yang terstruktur.
3. Operator Boolean bisa mendekati bahasa alami. Cari dokumen tentang demonstrasi menentang kenaikan harga minyak tanah.
4. AND dapat menemukan hubungan antara konsep Demonstrasi mahasiswa.
5. OR dapat menemukan terminologi alternatif Demonstrasi karyawan.
6.  NOT dapat menemukan arti alternatif Demonstrasi memasak.
7.  Query sederhana mudah dimengerti.

Kekurangan Model Boolean
1. Pencocokan yang tepat dapat mengambil dokumen terlalu sedikit atau terlalu banyak.
2. Sulit untuk pengindexkan, beberapa dokumen yang lebih penting dari pada yang lain kadang berada dibawah dokumen yang tidak penting.
3.  Sulit untuk menerjemahkan query ke dalam ekspresi Boolean.
4.  Semua istilah sama-sama berbobot.
5.  Lebih seperti pengambilan data dari pencarian informasi.
6. Bahasa alami sangat kompleks. Contoh Dia melihat seseorang di Pantai dengan teropong.
7.  Sering menghasilkan terlalu banyak dokumen.
     - Semua dokumen yang cocok akan muncul.
     - Sukar mengurutkan dokumen.
8.  Sukar untuk mengekspresikan permintaan pemakai yang kompleks.
9. Pemakai harus belajar Logic Boolean. (Perbendaraan kata pada indeks harus sama dengan perbendaraan kata pada query.



Referensi

0 komentar:

Posting Komentar

 
Blogger Wordpress Gadgets Read more: http://hzndi.blogspot.com/2012/04/menambahkan-widget-sosial-bookamrking.html#ixzz2DZHFHdWl