Selasa, 10 Maret 2015
Nama/NIM: I Gede Kusuma Ary Jaya/1204505034
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.
Definisi Model Boolean
Model ini merupakan model IR sederhana yang
berdasarkan atas teori himpunan dan aljabar boolean. Boolean sendiri pertama
kali dikembangkan oleh seroang ilmuan matematika bernama George Boole
(1815-1864). Yang dikemukakan sebagai suatu struktur logika aljabar yang
mencakup operasi Logika AND, OR dan NOR, dan juga teori himpunan untuk operasi
union. Di dalam struktur data,
Boolean merupakan sebuah tipe data yang bernilai “True” atau “False” (benar
atau salah). Sehingga didalam IR logika boolean berartikan bahwa data yang di
crawler sesuai atau tidak antara variable – variablenya.
Dalam pengerjaan operator boolean (AND, NOT, OR) ada
urutan pengerjaannya (Operator precedence). Urutannya
adalah:
-
() berarti prioritas yang berada dalam tanda kurung.
-
NOT
-
AND
-
OR
Contoh: Jika
ada query seperti berikut:
-
(Madding OR crow) AND killed OR slain
-
(Brutus OR Caesar) AND NOT (Antony OR Cleopatra)
Misalkan kita ingin mencari dari cerita-cerita
karangan shakespeare yang mengandung kata Brutus
AND Caesar AND NOT Calpurnia. Salah satu cara adalah: Baca semua teks yang
ada dari awal sampai akhir. Komputer juga bisa disuruh melakukan hal ini
(menggantikan manusia). Proses ini disebut grepping.
Melihat kemajuan komputer jaman sekarang, grepping bisa jadi solusi yang baik. Tapi,
kalau sudah bicara soal ribuan dokumen, kita perlu melakukan sesuatu yang lebih
baik. Karena ada beberapa tuntutan yang harus dipenuhi :
-
Kecepatan dalam pemrosesan dokumen yang jumlahnya sangat banyak.
- Fleksibilitas.
- Perangkingan.
Salah
satu cara pemecahannya adalah dengan membangun index dari dokumen.
Logical
NOT
Dapat
mengecualikan item-item dari seperangkat term penelusuran. Pernyataan formulasi
sederhana: A NOT B.
Contoh:
marketing NOT library. Ini artinya user hanya menginginkan dokumen yang
mengandung unsur marketing yang di dalamnya tidak ada unsur marketing yang di
dalamnya tidak ada unsur perpustakaannya.
Logical
AND
Memperbolehkan
penelusur untuk menggunakan pernyataan query ke dalam dua tau lebih konsep
sehingga hasil penelusuran menjadi lebih terbatas. Pernyataan formulasi
sederhana: A AND B.
Contoh:
untuk menelusur marketing and library, user memformulasikan penyataan
penelusuran dengan : marketing AND library.
Dengan
query tersebut maka kita akan menemukandokumen yang mengandung unsur marketing
danperpustakaan saja, dan tidak untuk mendapatkan dokumenyang hanya mengandung
unsur marketing atau perpustakaan saja.
Logical
OR
Memperbolehkan
penelusur untuk secara spesifik menggunakan alternatif term (atau konsep) yang
mengindikasikan dua konsep sesuai dengan tujuanpenelusuran. Hal ini menjadikan
hasil penelusuran menjadilebih luas, karena adanya alternatif dalam penyataan query.
Formulasi
pernyataan sederhana: A OR B.
Contoh:
marketing OR library. Dengan query tersebut maka kita akan mendapatkandokumen
yang mengandung unsur marketing saja, perpustakaan saja, atau yang mengandung
unsur marketing dan perpustakaan.
Kombinasi
Logical AND, OR, NOT
Dapat
mengkombinasikan satu pernyataan ke dalam penelusuran yang kompleks.
Contoh:
marketing AND library OR information centre NOT profit organization. Artinya user
ingin mendapatkan dokumen yang mengandung untur marketing dan perpustakaan tanpa
unsur pusat informasi dan bukan untuk organisasi non profit.
Kelebihan Model Boolean
1. Mudah untuk diimplementasikan.
2. Konsep yang terstruktur.
3.
Operator Boolean bisa mendekati bahasa alami. Cari dokumen tentang demonstrasi
menentang kenaikan harga minyak tanah.
4. AND dapat menemukan hubungan antara konsep Demonstrasi
mahasiswa.
5. OR dapat menemukan terminologi alternatif Demonstrasi
karyawan.
6. NOT dapat menemukan arti alternatif Demonstrasi
memasak.
7. Query sederhana mudah dimengerti.
Kekurangan Model Boolean
1. Pencocokan yang tepat dapat mengambil dokumen terlalu sedikit atau terlalu
banyak.
2.
Sulit untuk pengindexkan, beberapa dokumen yang lebih penting dari pada yang
lain kadang berada dibawah dokumen yang tidak penting.
3. Sulit untuk menerjemahkan query ke dalam ekspresi Boolean.
4. Semua istilah sama-sama berbobot.
5. Lebih seperti pengambilan data dari pencarian informasi.
6. Bahasa alami sangat kompleks. Contoh Dia melihat seseorang di Pantai dengan
teropong.
7. Sering menghasilkan terlalu banyak dokumen.
- Semua dokumen yang cocok akan muncul.
- Sukar mengurutkan dokumen.
8. Sukar untuk mengekspresikan permintaan pemakai yang kompleks.
9.
Pemakai harus belajar Logic Boolean. (Perbendaraan kata pada indeks harus sama
dengan perbendaraan kata pada query.
Referensi
Langganan:
Posting Komentar (Atom)
0 komentar:
Posting Komentar