Minggu, 07 Juni 2015

Tugas Makalah (Sistem Temu Kembali Informasi)

Judul Makalah : Analisa Pengaruh Ekspansi Kueri Menggunakan Kamus Sinonim dan Hiponim Terhadap Hasil Pencarian Dokumen Jurnal

Nama/NIM : I Gede Kusuma Ary Jaya/1204505034 
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana 
Mata Kuliah: Sistem Temu Kembali Informasi 
Dosen: I Putu Agus Eka Pratama, S.T., M.T.



Abstrak

Sistem Temu Kembali Informasi (Information retrieval) adalah ilmu yang digunakan untuk mencari informasi dalam suatu dokumen, mencari dokumen itu sendiri dan mencari metadata yang menggambarkan suatu dokumen. Sistem Temu Kembali Informasi membantu pencarian informasi dengan memberikan koleksi informasi yang sesuai dengan kebutuhan pengguna. Salah satu cara meningkatkan kemampuan sistem temu kembali informasi untuk meningkatkan jumlah dokumen jurnal yang diberikan kepada user adalah dengan menggunakan teknik ekspansi kueri. Teknik ekspansi kueri yang dapat digunakan adalah ekspansi kueri dengan kamus sinonim dan hiponim. Dengan penerapan ekspansi kueri, diharapkan adanya hasil temuan data yang lebih banyak, namun tetap relevan terhadap kata kunci yang dimasukkan.

Kata Kunci :

Sistem Temu Kembali Informasi, Ekspansi Kueri, Ekspansi Kueri dengan Sinonim, Ekspansi Kueri dengan Hiponim

URL : Download PDF

Selasa, 21 April 2015

Java Information Retrieval System

Nama/NIM : I Gede Kusuma Ary Jaya/1204505034
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.


Tutorial Instalasi Linux Ubuntu dan Java Information Retrieval System Serta Menjalankan Konsep IR


Information Retrieval (IR) atau sering disebut “temu kembali infromasi” adalah ilmu yang mempelajari prosedur-prosedur dan metode-metode untuk menemukan kembali infromasi yang tersimpan dari berbagai sumber (resources) yang relevan atau koleksi sumber informasi yang dicari atau dibutuhkan.

Ubuntu merupakan salah satu distribusi Linux yang berbasiskan Debian dan didistribusikan sebagai perangkat lunak bebas. Nama Ubuntu berasal dari filosofi dari Afrika Selatan yang berarti "kemanusiaan kepada sesama". Ubuntu dirancang untuk kepentingan penggunaan pribadi, namun versi server Ubuntu juga tersedia, dan telah dipakai secara luas.

Instalasi Linux Ubuntu

Di sini saya menggunakan virtual machine yaitu Virtual Box untuk menginstall sistem operasi Linux Ubuntu. Sebelum masuk ke langkah-langkah meng-install sistem operasi Linux Ubuntu, saya akan sedikit menjelaskan tentang cara mengoperasikan virtual box.  Tampilan awal dari virtual box dapat dilihat pada Gambar 1.

Gambar 1. Tampilan Awal Virtual Box

Langkah-langkah mengoperasikan virtual box adalah sebagai berkut:

1. Klik New untuk membuat virtual machine baru. Setelah itu masukkan data meliputi Nama, Type dan Version seperti Gambar 2, kemudian klik Next.
Gambar 2. Tampilan Create Virtual Machine

2. Set memory size 512mb/1024mb seperti gambar 3.
Gambar 3. Set Memory Size

3. Set Hard drive dengan memilih create a virtual hard drive new seperti gambar 4, kemudian Create.
Gambar 4. Set Hard Drive

4. Set Hard Drive file type dengan memilih VMDK (Virtual Machine Disk) seperti pada gambar 5, lalu Next.


Gambar 5. Set Hard Drive File Type

5. Set storage on physical hard drive dengan memilih dynamicaly alocated seperti gambar 6, lalu next.
Gambar 6. Set Storage on Physical Hard Drive

6. Set file location and size dengan size default yaitu 8GB seperti gambar 7, lalu create.
Gambar 7. Set Location and Size

7. Virtual machine sudah berhasil disetting dan akan muncul tampilan seperti gambar 8.
Gambar 8. Tampilan Setelah Setting Virtual Machine

8. Pilih Start untuk mulai mengimport file iso Linux Ubuntu, kemudian pilih browse.
Gambar 9. Import File ISO Linux Ubuntu


9. Cari direktori tempat menyimpan file iso Linux Ubuntu. Saya menggunakan Linux Ubuntu versi 13.10, kemudian open seperti gambar 10.
Gambar 10. Direktori File Iso Linux Ubuntu

10. Jika sudah meng-import file iso Linux Ubuntu dengan benar selanjutnya klik start untuk mulai meng-install.
Gambar 11. Tampilan Setelah Import File Iso Linux Ubuntu

11. Langkah selanjutnya adalah memulai untuk meng-install Linux Ubuntu. Gambar 12 merupakan tampilan awal dalam menginstall Linux Ubuntu versi 13.10. Pilih bahasa yang ingin digunakan kemudian install Ubuntu.
Gambar 12. Memilih Bahasa

12. Persiapan dalam meng-install Ubuntu. Terdapat 3 hal yang harus disiapkan yaitu sediakan drive space minimal 5,9GB, charge Notebook untuk mengantisipasi agar Notebook tidak mati saat proses instalasi, serta dibutuhkan koneksi internet dalam proses instalasi. Apabila 3 hal tersebut sudah terpenuhi klik Continue untuk melanjutkan.
Gambar 13. Persiapan Sebelum Install Ubuntu

13. Set tipe instalasi dengan memilih use LVM with the new Ubuntu installation seperti gambar 14. kemudian Install Now.
Gambar 14. Set Installation Type

14. Langkah selanjutnya adalah set region untuk pengaturan waktu, di sini saya men-set Denpasar, Bali, Indonesia, kemudian pilih Continue.
Gambar 15. Set Region

15. Selanjutnya set keyboard layout dengan memilih English (US) yang merupakan standar keyboard layout, kemudian pilih Continue.
Gambar 16. Set Keyboard Layout.

16. Masukkan identitas meliputi Nama, Username dan Password, lalu pilih Continue.
Gambar 17. Memasukkan Nama, Username dan Password

17. Sertakan email untuk proses registrasi, kemudian pilih Continue.
Gambar 18. Memasukkan Email

18. Masukkan kembali email, nama, dan password serta centang agreement seperti gambar 19, lalu pilih Continue.
Gambar 19. Memasukkan Email, Nama dan Password Serta Centang Agreement

19. Memulai loading proses instalasi Ubuntu, tunggu hingga proses selesai.
Gambar 20. Loading Proses Instalasi Ubuntu

20. Proses Instalasi telah selesai, kemudian restart computer.
Gambar 21. Proses Instalasi Selesai

21. Setelah selesai restart akan muncul tampilan login seperti gambar 22, masukkan username dan password, kemudian login.
Gambar 22. Tampilan Login

22. Sistem Operasi Linux Ubuntu sudah siap digunakan, tampilan awal Linux Ubuntu akan terlihat seperti gambar 23.
Gambar 23. Tampilan Awal Linux Ubuntu

Instalasi Java Information Retrieval System

Langkah-langkah dalam menginstall JIRS antara lain:

1. Sebelum menginstall JIRS, terlebih dahulu kita harus menginstall Java. Untuk mengecek apakah java sudah terinstall dengan benar masukkan syntak pada Gambar 24 di terminal.
Gambar 24. Mengecek Java

2. Selanjutnya menginstall JIRS. Download JIRS di  http://sourceforge.net/p/jirs kemudian install dengan memasukkan syntak pada Gambar 25.
Gambar 25. Instalasi JIRS

3. Tahap selanjutnya adalah mulai menjalankan aplikasi JIRS. Terlebih dahulu buat 2 buah file (.txt). Saya membuat 2 file bernama IR dan Google, di mana di dalam file IR terdapat text “Information Retreival” dan di dalam file Google terdapat text “Search Engine”, kedua file tersebut terletak di dalam folder STKI.
Gambar 26. Membuat 2 Buah File txt

4. Membuat DocList dengan ID “IR”.
Gambar 27. Membuat DocList

5. Jika berhasil akan muncul tampilan seperti gambar 28.
Gambar 28. Membuat DocList Berhasil

6. Melalukan Proses Indexing.
Gambar 29. Proses Indexing

7. Selanjutnya adalah proses ViewDatabase.
Gambar 30. ViewDatabase

8. Jika berhasil, akan muncul tampilan seperti gambar 31.
Gambar 31. Database Index

9. Selanjutnya melakukan proses searching dengan memasukkan syntak seperti gambar 32.
Gambar 32. Proses Searching

10. Jika berhasil akan muncul tampilan seperti gambar 33. User dapat melakukan pencarian berdasarkan data acuan pada file txt yang telah dibuat tadi pada folder STKI.
Gambar 33. Searching GUI

11. Saya menggunaan keyword “Information”, hasilnya adalah seperti gambar 34.
Gambar 34. Hasil Searching




Selasa, 17 Maret 2015

Review Pertanyaan

Nama/NIM: I Gede Kusuma Ary Jaya/1204505034
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.


Kali ini saya akan membahas salah satu pertanyaan teman pada mata kuliah Sistem Temu Kembali Informasi. Pertanyaannya adalah bagaimana cara kerja search engine melakukan proses pencarian sesuai dengan keyword? Saya akan menjawab sesuai pemahaman dan juga dari referensi yang sudah saya dapatkan.

Saat user mengetikkan keyword di kotak pencarian search engine misalnya google, maka apa yang user ketikkan itu akan terkirim dan diproses di sistem search engine. Search engie akan bekerja mencari petunjuk-petunjuk untuk memahami apa yang user inginkan, dan di sini ada 6 proses, yaitu:
- Ejaan, untuk menilai apakah ejaan anda sudah benar, dan jika salah maka Google akan memberi saran.
- Autocomplete, di mana Google memperkirakan apa yang kira-kira dicari dengan berbagai variasi makna lainnya.
- Sinonim, Google berusaha melihat dokumen-dokumen lain yang mengandung kata-kata yang sinonim dengan pencarian user.
- Metode Pencarian, Google juga menyediakan data lain dalam format tertentu seperti video, atau gambar yang berkaitan dengan kata kunci tersebut.
- Google Instant, yang berusaha menampilkan hasil secepat mungkin kepada user.

Dari semua petunjuk yang dikumpulkan di atas Google akan menarik data dari tempat penyimpanannya yang disebut index, kemudian data akan ditampilkan. Proses menampilkan data ini (ranking) harus melalui algoritma Google, yaitu:
1. Kualitas Situs dan Halaman
Algoritma Google akan bekerja untuk mengenali seberapa terpercaya, bereputasi, dan berotoritasnya suatu sumber dengan menggunakan beberapa parameter. Salah satu di antara parameter itu adalah page rank.
2. Kesegaran
Google juga memandang penting untuk mempertimbangkan informasi-informasi terbaru untuk ditampilkan dalam hasil pencariannya.
3. Pencarian Aman
Google sebisa mungkin mengurangi hasil pencarian yang berkonten dewasa dari hasil pencarian user (kecuali user memang mencari konten dewasa). Jadi kalau user bukan mencari situs konten dewasa, tapi memasang iklan yang menuju situs yang mengandung konten dewasa, maka kemungkinan user untuk ranking akan berkurang.
4. Konteks Pengguna
Google juga akan melihat posisi geografis kita dan cookie pada komputer untuk menentukan ranking halaman yang ditampilkannya.
5. Bahasa
Google juga akan menggolongkan hasil pencarian berdasarkan bahasa dan negara.
6. Konten Umum
Ini seperti gambar, video, berita, peta, dan lain-lain yang juga akan diikutsertakan dalam halaman hasil pencarian.
Semua proses di atas berlangsung dalam 1/8 detik sebelum dikirimkan ke layar user.

Algoritma Search Engine
Search engine menggunakan beberapa macam algoritma pencarian, yaitu sebagai berikut.
1. List Search
Algoritma ini bekerja dengan cara mencari secara berurutan. Kita bisa membayangkannya seperti saat kita ingin mencari seseorang dalam sebuah antrian. Maka kita mencarinya dengan cara memeriksa satu persatu, dari awal antrian hingga kita menemukan orang yang ingin kita cari. Cara atau algoritma seperti ini biasanya digunakan saat kita ingin mencari dengan menggunakan satu faktor atau satu kunci saja sebagai penentu. Untuk antrian yang pendek, cara ini mungkin cukup efektif dan efisien. Tapi untuk mencari sebuah kata dari milyaran web page yang ada di internet, maka akan membutuhkan waktu yang sangat lama.
2. Tree Search
Bayangkan sebuah pohon! Bayangkan mulai dari akar, batang, cabang, kemudian ranting-rantingnya. Begitulah cara kerja dari algoritma ini. Algoritma ini akan bekerja dengan cara mencarinya dari yang paling mendekati hingga ke yang paling tidak mendekati. Atau bisa juga dikatakan dari yang paling umum hingga ke yang paling spesifik, atau sebaliknya. Algoritma ini mirip dengan cara yang digunakan orang untuk mengatur internet. Seperti yang kita tahu, setiap situs yang ada di internet itu mempunyai keterkaitan antara satu dengan yang lainnya. Kita bisa menelusuri keterkaitan ini dengan cara memulai dari tingkat yang paling kecil dulu, kemudian ke tingkat yang paling besar, atau sebaliknya.
Tree searches adalah cara yang ampuh digunakan untuk melakukan pencarian di internet, akan tetapi cara ini tidak selalu memberikan hasil yang memuaskan.
3. SQL Search
Diambil dari kata sequel. Satu kelemahan saat melakukan pencarian menggunakan metode Tree Search yaitu pencarian dilakukan dengan cara dari point ke point, atau dari satu titik ke titik. Itu artinya data harus dicari secara hirarki, dari besar ke kecil atau sebaliknya. Dan kelemahan ini bisa teratasi dengan menggunakan SQL search.
4. Informed Search
Algoritma informed search bekerja dengan cara mencari solusi yang spesifik atau khusus dari sebuah dataset yang bercabang-cabang (tree dataset). Sesuai dengan namanya, algoritma ini tidak selalu cocok digunakan untuk melakukan pencarian di internet. Karena algoritma ini cuma cocok digunakan untuk pemecahan masalah-masalah yang spesifik atau khusus saja. Sedangkan kita seringkali ingin mencari pemecahan untuk masalah-masalah yang bersifat umum atau luas.
5. Adversarial Search
Adversarial search bekerja dengan cara mencari berbagai kemungkinan solusi atas sebuah masalah. Ini seperti saat kita melakukan permainan rolex atau gambling, dimana semua kemungkinan akan kita coba. Algoritma ini sulit digunakan untuk melakukan pencarian di internet, sebab berapa banyak kemungkinan yang akan di dapat untuk mencari sebuah kata di internet? Nyaris tak terhingga.
6. Constraint Satisfaction Search
Saat kita mencari suatu kata/kalimat di internet, maka algoritma constraint satisfaction search ini sepertinya adalah metode yang paling mendekati atau sesuai dengan keinginan mu. Algoritma pencarian jenis ini, akan mencari solusi dengan cara memberikan berbagai alternatif pilihan. Algoritma ini akan mencari dengan berbagai cara, dan tidak harus dengan cara yang berurutan.

Cara Kerja Information Retrieval
Information Retrieval memiliki cara kerja seperti berikut.
1. Tokenisasi (tokenizing) atau word token
Tokenisasi (tokenizing) atau word token adlaah pemisahan deret kata dalam kalimat, paragrap menjadi potongan kata tunggal (termed word) serta menghilangkan karakter-karakter dalam tanda baca dan mengubah kumpulan termed menjadi huruf kecil (lower case). Contoh : "saya belajar Information Retrieval" maka akan dihasilkan : "saya", "belajar", "information", "retrieval".
2. Stopword removal atau seleksi / penyaringan (filtration)
Stopword removal atau seleksi / penyaringan (filtration) adalah tahapan untuk mempersentasikan suatu dokumen dapat mendeskripsikan isi dari suatu dokumen untuk membedakan isi dokumen lain, dalam suatu istilah (term) akan mencari jumlah dokumen yang diangap paling relevan didalam suatu inputan (query), suatu term yang sering ditampilkan atau digunakan diangap sebagai stopword. Contoh : Operator Logika and, or, not, dan sebaginya. Maka stopword tersebut akan menghapus, karna frekuwnsi dari kemunculan trem terlalu sering.
3. Pembuatan kata dasar (stemming)
Stemming konversi dari trem ke bentuk akar (root) atau bentuk umum, biasanya dalam dokumen yang mirip atau sama (sinonim) atau bisa menemukan kata-kata yang terkait dalam sebuah dokumen. Contoh : kita memasukan kata "menemukan" maka query akan merekomendasikan, "memperoleh", "mengetahui", "memiliki", "mendapatkan" dan setrusnya.
4. Proses pembobotan setiap term dalam dokumen (term weighting)
Term weighting yaitu dalam tahapan pembobotan term skema dalam pembobotan dipilih berdasarkan pembobotan lokal, global atau kedua-duanya (term frequency dan global inverse document frequency).

Ada tiga hal yang menjadi dasar cara kerja mesin IR yaitu Proses Crawling, Proses Indexing dan Proses Surving.
a. Proses Crawling
Crawling adalah suatu pekerjaan yang dilakukan oleh googlebot (biasa dikenal juga dengan istilah robot, atau spider bisa di sebut juga crawler) dalam menjelajahi halaman-halaman website untuk di indeks pada google server.
Googlebot terdiri dari set komputer yang berjumlah besar yang memang difungsikan untuk meng-crawling website-website. Dalam melakukan tugasnya, googlebot menggunakan suatu algoritma komputer dalam menentukan situs apa saja yang akan di crawling, seberapa sering, dan berapa banyak halaman yang akan di indeks.
Proses crawling dalam suatu website dimulai dari mendata seluruh url dari website, menelusurinya satu-persatu, kemudian memasukkannya dalam daftar halaman pada google indeks, sehingga setiap kali ada perubahan pada website, akan terupdate secara otomatis.
b. Proses Indexing
Indexing adalah proses pengumpulan kata-kata atau kalimat pada suatu halaman web oleh googlebot yang telah ter-crawling sebelumnya. Dalam prosesnya, konten inilah yang digunakan oleh google sebagai sumber pencarian untuk selanjutnya ditampilkan sebagai hasil pencarian berdasarkan kata kunci (keywords) yang kita cari.
Namun perlu diingat bahwa tidak semua konten dapat diproses oleh googlebot ini. Umumnya konten tersebut adalah link url, judul, tag, nama file, tipe file, isi halaman (tidak semua) dan beberapa informasi halaman lainnya.
c. Proses Surving
Surving adalah suatu proses dalam menampilkan suatu halaman tertentu merujuk kepada kata kunci yang dimasukkan oleh pengguna. Keterhubungan antara bagaimana hasil akan ditampilkan dengan kata kunci ditentukan oleh kurang lebih 200 faktor.
Salah satu faktor penentu yang terkenal yang digunakan untuk menampilkan hasil pencarian adalah page rank. Dengan page rank, suatu halaman ditampilkan sesuai dengan urutan dengan cara “halaman yang terbanyak di akses ditampilkan pertama“.
Ketiga proses tersebut di atas dilakukan dalam waktu yang sangat cepat dan disajikan kepada pengguna ditambah dengan penjelasan jumlah penemuan dll.


Referensi
http://superblogpedia.blogspot.com/2014/05/cara-kerja-search-engine-google.html
http://trikmudahseo.blogspot.com/2014/01/cara-kerja-search-engine-google.html
http://suyatmobng.blogspot.com/2013/03/pengertian-cara-kerja-dan-masa-depan.html

Selasa, 10 Maret 2015

Boolean Information Retrieval Model

Nama/NIM: I Gede Kusuma Ary Jaya/1204505034
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.

Definisi Model Boolean
Model ini merupakan model IR sederhana yang berdasarkan atas teori himpunan dan aljabar boolean. Boolean sendiri pertama kali dikembangkan oleh seroang ilmuan matematika bernama George Boole (1815-1864). Yang dikemukakan sebagai suatu struktur logika aljabar yang mencakup operasi Logika AND, OR dan NOR, dan juga teori himpunan untuk operasi union. Di dalam struktur data, Boolean merupakan sebuah tipe data yang bernilai “True” atau “False” (benar atau salah). Sehingga didalam IR logika boolean berartikan bahwa data yang di crawler sesuai atau tidak antara variable – variablenya.
Dalam pengerjaan operator boolean (AND, NOT, OR) ada urutan pengerjaannya (Operator precedence). Urutannya adalah:
- () berarti prioritas yang berada dalam tanda kurung.
- NOT
- AND
- OR
Contoh: Jika ada query seperti berikut:
- (Madding OR crow) AND killed OR slain
- (Brutus OR Caesar) AND NOT (Antony OR Cleopatra)
Misalkan kita ingin mencari dari cerita-cerita karangan shakespeare yang mengandung kata Brutus AND Caesar AND NOT Calpurnia. Salah satu cara adalah: Baca semua teks yang ada dari awal sampai akhir. Komputer juga bisa disuruh melakukan hal ini (menggantikan manusia). Proses ini disebut grepping. Melihat kemajuan komputer jaman sekarang, grepping bisa jadi solusi yang baik. Tapi, kalau sudah bicara soal ribuan dokumen, kita perlu melakukan sesuatu yang lebih baik. Karena ada beberapa tuntutan yang harus dipenuhi :
- Kecepatan dalam pemrosesan dokumen yang jumlahnya sangat banyak.
-   Fleksibilitas.
-   Perangkingan.
Salah satu cara pemecahannya adalah dengan membangun index dari dokumen.

Logical NOT
Dapat mengecualikan item-item dari seperangkat term penelusuran. Pernyataan formulasi sederhana: A NOT B.
Contoh: marketing NOT library. Ini artinya user hanya menginginkan dokumen yang mengandung unsur marketing yang di dalamnya tidak ada unsur marketing yang di dalamnya tidak ada unsur perpustakaannya.

Logical AND
Memperbolehkan penelusur untuk menggunakan pernyataan query ke dalam dua tau lebih konsep sehingga hasil penelusuran menjadi lebih terbatas. Pernyataan formulasi sederhana: A AND B.
Contoh: untuk menelusur marketing and library, user memformulasikan penyataan penelusuran dengan : marketing AND library.
Dengan query tersebut maka kita akan menemukandokumen yang mengandung unsur marketing danperpustakaan saja, dan tidak untuk mendapatkan dokumenyang hanya mengandung unsur marketing atau perpustakaan saja.

Logical OR
Memperbolehkan penelusur untuk secara spesifik menggunakan alternatif term (atau konsep) yang mengindikasikan dua konsep sesuai dengan tujuanpenelusuran. Hal ini menjadikan hasil penelusuran menjadilebih luas, karena adanya alternatif dalam penyataan query.
Formulasi pernyataan sederhana: A OR B.
Contoh: marketing OR library. Dengan query tersebut maka kita akan mendapatkandokumen yang mengandung unsur marketing saja, perpustakaan saja, atau yang mengandung unsur marketing dan perpustakaan.

Kombinasi Logical AND, OR, NOT
Dapat mengkombinasikan satu pernyataan ke dalam penelusuran yang kompleks.
Contoh: marketing AND library OR information centre NOT profit organization. Artinya user ingin mendapatkan dokumen yang mengandung untur marketing dan perpustakaan tanpa unsur pusat informasi dan bukan untuk organisasi non profit.

Kelebihan Model Boolean
1.  Mudah untuk diimplementasikan.
2.  Konsep yang terstruktur.
3. Operator Boolean bisa mendekati bahasa alami. Cari dokumen tentang demonstrasi menentang kenaikan harga minyak tanah.
4. AND dapat menemukan hubungan antara konsep Demonstrasi mahasiswa.
5. OR dapat menemukan terminologi alternatif Demonstrasi karyawan.
6.  NOT dapat menemukan arti alternatif Demonstrasi memasak.
7.  Query sederhana mudah dimengerti.

Kekurangan Model Boolean
1. Pencocokan yang tepat dapat mengambil dokumen terlalu sedikit atau terlalu banyak.
2. Sulit untuk pengindexkan, beberapa dokumen yang lebih penting dari pada yang lain kadang berada dibawah dokumen yang tidak penting.
3.  Sulit untuk menerjemahkan query ke dalam ekspresi Boolean.
4.  Semua istilah sama-sama berbobot.
5.  Lebih seperti pengambilan data dari pencarian informasi.
6. Bahasa alami sangat kompleks. Contoh Dia melihat seseorang di Pantai dengan teropong.
7.  Sering menghasilkan terlalu banyak dokumen.
     - Semua dokumen yang cocok akan muncul.
     - Sukar mengurutkan dokumen.
8.  Sukar untuk mengekspresikan permintaan pemakai yang kompleks.
9. Pemakai harus belajar Logic Boolean. (Perbendaraan kata pada indeks harus sama dengan perbendaraan kata pada query.



Referensi

Search Engine Optimization

Nama/NIM: I Gede Kusuma Ary Jaya/1204505034
Jurusan/Fakultas/Universitas: Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah: Sistem Temu Kembali Informasi
Dosen: I Putu Agus Eka Pratama, S.T., M.T.

Definisi Search Engine Optimization
Search Engine Optimization (SEO) merupakan salah satu metode yang mengatasi masalah yang dijabarkan di atas, Search Engine Optimazation (SEO) adalah kumpulan teknik atau proses yang di gunakan untuk menjadikan suatu website menjadi lebih mudah diindeks oleh mesin pencari dengan melakukan optimasi dan modifikasi pada faktor-faktor yang terdapat di dalam webpage (on page optimization) dan memanfaatkan faktor-faktor yang tidak ada di dalam webpage tetapi digunakan mesin pencari dalam melakukan perangkingan pada hasil pencarian (off page optimization).

Sekilas Sejarah Search Engine Optimization
Menurut Danny Sullivan, istilah search engine optimization pertama kali digunakan pada 26 Juli tahun 1997 oleh sebuah pesan spam yang diposting di Usenet. Pada masa itu algoritma mesin pencari belum terlalu kompleks sehingga mudah dimanipulasi.
Versi awal algoritma pencarian didasarkan sepenuhnya pada informasi yang disediakan oleh webmaster melalui meta tag pada kode html situs web mereka. Meta tag menyediakan informasi tentang konten yang terkandung pada suatu halaman web dengan serangkaian kata kunci (keyword).
Sebagian webmaster melakukan manipulasi dengan cara menuliskan kata kunci yang tidak sesuai dengan konten situs yang sesungguhnya, sehingga mesin pencari salah menempatkan dan memeringkat situs tersebut. Hal ini menyebabkan hasil pencarian menjadi tidak akurat dan menimbulkan kerugian baik bagi mesin pencari maupun bagi pengguna internet yang mengharapkan informasi yang relevan dan berkualitas.

Keuntungan Menerapkan Search Engine Optimization
1.       Mendatangkan Traffic yang Banyak
Situs atau blog berada pada halaman satu Search Engine pasti akan mendatangkan pengunjung (Traffic) yang sangat besar, tergantung pada keyword yang user target dan besar kecilnya data hasil pencarian dari Google Planner.
2.       Meningkatkan Penjualan
Jika suatu situs menjual suatu produk atau barang seperti lazada.co.id yang menjual aneka barang seperti laptop atau lainnya, maka jika ada orang mencari di google dengan keyword “jual laptop murah” kemudian situs tersebut ranking 1, maka sudah 95% lazada akan mendapatkan penjualan dari hasil SEO tersebut.
3.       Meningkatkan Daya Saing
Mudah saja untuk keuntungan SEO yang satu ini, jika posisi suatu situs lebih tinggi maka secara otomatis daya saingnya pun akan lebih tinggi.

Cara Kerja Search Engine
Mesin pencari web bekerja dengan cara menyimpan hampir semua informasi halaman web, yang diambil langsung dari www. Halaman-halaman ini diambil secara otomatis. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya (misalnya, kata-kata diambil dari judul, subjudul, atau field khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri Ketika seorang pengguna mengunjungi mesin pencari dan memasukkan query, biasanya dengan memasukkan kata kunci, mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul dokumen dan terkadang sebagian teksnya. Mesin pencari lain yang menggunakan proses real-time, seperti Orase, tidak menggunakan indeks dalam cara kerjanya. Informasi yang diperlukan mesin tersebut hanya dikumpulkan jika ada pencarian baru.

SEO atau yang biasa disebut search engine optimization adalah sebuah teknik pemasaran yang sering dilakukan dalam dunia bisnis internet yang bertujuan untuk mendatangkan banyak pengunjung secara tertarget melalui mesin pencari seperti Google, Yahoo, Bing, dll. Keyword merupakan hal yang vital dalam SEO. Kesalahan dalam menentukan keyword dapat berakibat pengunjung tidak melimpah, dan sebaliknya, jika tepat menentukan keyword dalam SEO akan berdampak signifikan dalam menghasilkan ribuan pengunjung setiap harinya. Strategi untuk menentukan keyword dalam SEO menjadi hal yang harus diperhitungkan dalam pesaingan di dunia SEO. Keyword yang berkaitan merupakan keyword yang memiliki makna hampir sama dengan keyword utama. Untuk melakukan pencarian sinonim, penulis menggunakan berbagai tool, antara lain dari gorank.com atau menggunakan kamus dan software translator lainnya.
Dengan melakukan serangkaian teknik optimasi tersebut diharapkan suatu website bisa menduduki posisi terbaik di hasil pencarian. Ada pun posisi terbaik adalah posisi yang mudah ditemukan orang dalam suatu kalimat pencarian. Biasanya posisi yang sering dikunjungi orang adalah antara halaman 1 (lebih dominan) sampai halaman 3. Jika sampai halaman tersebut pengunjung belum mendapat informasi yang dibutuhkannya, maka ia akan beralih menggunakan kalimat pencarian lainnya. Untuk itulah bisa berada di posisi tersebut merupakan suatu target jika menggunakan teknik SEO ini. Terlebih bisa berada di Page 1 apalagi sampai peringkat 3 besar, pasti akan mendapatkan banyak kunjungan dari mesin pencari.

Software yang dapat digunakan dalam Search Engine Optimization
1.       Adobe Dreamweaver CS3
Adobe Dreamweaver CS3 adalah software yang berguna untuk mendesain web visual yang mempunyai keunggulan WYSIWYG (What You See Is What You Get) ini tidak harus berurusan dengan tag-tag HTML untuk membuat sebuah web. Dreamweaver tidak hanya digunakan untuk menuliskan text-text HTML, namun juga dapat mendesain halaman web yang interaktif. Adobe Dreamweaver CS3 juga mendukung berbagai bahasa pemprograman web seperti PHP.
2.       Web Browser
Web browser adalah sebuah aplikasi yang berguna untuk menjelajahi internet, menampilkan informasi dari suatu alamat situs web, baik itu tulisan, gambar bahkan saat ini teknologi web browser yang sudah diperbaharui mampu untuk menampilkan animasi, video klip hingga film berdurasi panjang.

Unsur Pendukung Penerapan SEO
1.       On Page SEO
On Page SEO adalah suatu teknik mengoptimisasi halaman website dengan menerapkan beberapa dasar keyword yang ditarget kedalamnya. Keuntungan dari on page seo ini yaitu situs anda akan lebih dinilai relevan oleh google, juga jika halaman tersebut hanya mendapatkan sedikit backlink bisa dipastikan akan mudah ranking #1 Google. Dasar yang harus diterapkan dalam On Page SEOadalah:
a.       Title Tag
       Title Tag mirip seperti judul pada suatu posting/artikel tetapi berbeda, karena umumnya title tag ini dibaca oleh search engine, jika title tag tidak diganti atau sama menyerupai judul posting maka yang muncul pada search engine sebagai title tag yaitu judul posting tersebut. Berikut gambar contoh title tag.

b.        Meta Description
 Meta descriptions adalah keterangan dari suatu halaman berdasarkan dari kalimat artikel postingan, agar meta description terlihat menggoda dan menarik trafik,  perlu memodifikasinya dengan menggunakan plugin SEO. Berikut gambar contoh Meta Description.
c.        URL
 URL singkatan dari Uniform Resource Locator, adalah rangkaian karakter menurut suatu format standar tertentu, yang digunakan untuk menunjukkan alamat suatu sumber seperti dokumen dan gambar di Internet.
d.        Heading
         Heading adalah sekumpulan kata yang menjadi judul atau sub-judul dalam sebuah dokumen html.
e.        Link to Authority Site
 Link to Authority Site merupakan sebuah posting yang di dalamnya terdapat link menuju situs–situs terpercaya/yang dipercayai google seperti yotube, wikipedia, facebook, dan lain-lain.
2.        SEO OFF PAGE
Off-page SEO adalah aktifitas atau teknik SEO yang dilakukan diluar blog atau website tersebut. Banyak hal yang bisa dilakukan dalam off-page SEO ini, antara lain :
a. Exchange Link atau Bertukar Link dengan blog lain.
b. Mensubmit blog ke search engine .
c. Mendaftarkan blog ke Web atau blog directory misal DMOZ.org.
d. Mendaftarkan blog ke social bookmark misal Technorati, digg, Del.cio.us dll.
e. Mendaftarkan blog atau website ke social media misal myblog atau blogcatalog.
f. Memasang iklan di iklan baris.
g. Memasang iklan pada blog atau web yang bertrafik tinggi dan ber PR (Page Rank) tinggi.
h. Mensubmit pillar artickel ke beberapa article directory.
i.  Bergabung ke beberapa forum diskusi.

Komponen-komponen Diagram SEO

Komponen komponen SEO mulai dari On page untuk Keyword Research (analisa keyword) fungsi analisa keyword adalah untuk memenangkan kompetisi keyword yang banyak dicari dan untuk mentargetkan keyword untuk visitor, menambah kekuatan dari on page diberi backlink anchor text untuk lebih memperkuat keyword target dari jumlah backlink yang berkualitas, untuk mencapai keyword yang tertujuh dan membuat website yang kualitasnya yang sangat baik, yang bisa disukai user betah lama-lama di website tersebut.

Contoh Implementasi Mengoptimasi Website di Situs Pencarian Google dan Yahoo
Proses implementasi yang dilakukan dalam mengoptimasi website di situs pencarian Google dan Yahoo yaitu :
1.      Dengan cara mendaftarkan situs website terlebih dahulu ke situs pencarian google dan Yahoo atau Langsung ke website submit URL Web ke beberapa search engines http://www.submitexpress.com/free-submission.html
       Kemudian setelah didaftarkan ke layanan submit search engine maka langkah selanjutnya mendaftarkannya di Google webmaster. Sesudah mendaftar dan memasukkan website/blog tersebut kemudian submit sitemap untuk website dengan format XML, bila menggunakan platform CMS wordpress bisa menggunakan Plugins Google Sitemap XML bisa didownload melalui (http://wordpress.org/extend/plugins/google-sitemap-generator/).
2.      Proses yang kedua adalah mengoptimasi website tersebut dengan cara pengujian yang telah disebutkan di bab ke-tiga yaitu SEO basic. Dengan memperbaiki meta tag,membuat beberapa keyword atau kata kunci,struktur website dan lain sebagainya.
3.       Proses yang ketiga adalah dengan mendaftarkan website ke situs statstik visitor untuk mengetahui statistic atau dapat dijadikan data untuk melihat pengunjung website dari Negara mana saja,berapa jumlah pengunjung dan presentase kunjungan perhari, disini penulis memakai webmaster tools yaitu histats.com dan extremetracking.com.
4.    Proses keempat adalah memonitoring website setiap hari, berguna untuk melihat data berada pada posisi berapa dan di halaman ke berapa di situs pencarian atau sama sekali tidak ada.



Referensi
ANALISA DAN IMPLEMENTASI SEO (Search Engine Optimization) KONTEN WEBSITE UNTUK ALGORITMA GOOGLE PANDA DAN YAHOO oleh Firman Dwi Prasetyo JURUSAN TEKNIK INFORMATIKA SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AMIKOM, YOGYAKARTA

 
Blogger Wordpress Gadgets Read more: http://hzndi.blogspot.com/2012/04/menambahkan-widget-sosial-bookamrking.html#ixzz2DZHFHdWl