Jumat, 28 Maret 2008

How Google Works

How Google Works


Nih, gw kasih tau artikel simple mengenai gimana cara google itu kerja , yang pasti google itu punya ribuan komputer dengan spesifikasi yang biasa-biasa aja (low-cost computers) dan semua komputer ini terhubung ke suatu jaringan yang terdistribusi sehingga dapat melakukan proses secara parallel dengan cepat. Paralel processing adalah suatu teknik komputasi dimana banyak perhitungan dapat dilaksanakan secara simultan (bersamaan) , hal ini akan meningkatkan kecepatan data processing secara significant.


3 hal yang menjadi bagian utama dari Google :

  • Googlebot, web crawler yang mencari dan mengambil situs-situs web.Okey, katanya cara yang paling gampang menggambarkan Googlebot adalah dengan membayangkan Googlebot sebagai laba-laba kecil yang berlari dengan cepat di sekitar are cyberspace, tapi dalam kenyataan Googlebot tidak melakukan traversal sama sekali. Cara kerja dari Googlebot hampir sama seperti browser yang biasa kita gunakan ,yaitu dengan mengirimkan request ke web server untuk setiap halaman web yang diinginkan , melakukan download keselurahan page , lalu memberikannya ke Google’s Indexer. Googlebot terdiri dari banyak komputer yang melakukan request dan fetch page lebih cepat dibandingkan dengan browser yang kita gunakan. Secara fakta, Googlebot bisa merequest ratusan halaman yang berbeda secara bersamaan. Sekarang gw mau ngebahas gimana caranya si Om Google ini nemuin halaman yang diinginkan , yang pertama adalah dengan menambahkan URL form , www.google.com/addurl.html , dan dengan menelusuri semua web yang ada.Ketika Googlebot mengambil(fetches) sebuah halaman yanga ada , dia mengambil semua links yang muncul dihalaman tersebut dan menambahkan link-link tersebut ke dalam sebuah queue(antrian) yang digunakana untuk melakukan crawling berikutnya.Dengan cara mengumpulkan semua link yang ada di suatu halaman web , Googlebot dapat dengan cepat membuat sebuah list dari link-link yang ada dan dapat membantu meng-cover secara keseluruhan mengenai web tersebut. Teknik ini biasa disebut dengan deep crawling.Beberapah hal yang perlu diperhatikan sama si Googlebot tuh diantaranya , Googlebot harus secara constant memeriksa dan membandingkan URL yang akan dikunjungi dengan URL yang udah ada di Google’s index. Jangan sampe terjadi duplikasi index , hal ini tuh buat nyegah biar Googlebot ga melakukan fetching kehalaman yang sama. Hal lain adalah Googlebot harus menentukan kapan dia harus melakukan “visitasi”( sebenernya sih cm kunjungan lagi ke sebuah page , hal ini dengan tujuan untuk menghasilkan suatu index yang up-to-date.
  • Indexer , yang melakukan sorting setiap kata yang ada di setiap pada dalam suatu web dan menyimpan hasil index kata-kata tersebut kedalam sebuah database yang besar.Kan tadi tuh si Googlebot ke indexer full text dari page yang ditemukan, nah page ini bakal disimpen di Google’s index database. Index yang ada di Google’s index database itu disorting secara alphabetically berdasarkan search term ( term waktu kita searching) , dimana setiap index yang disimpan memiliki list dokumen dimana term tersebut muncul dan lokasi text tersebut ada. Untuk meningkatkan perfoma searching maka Google tidak melakukan index untuk kata-kata yang biasa disebut dengan stop words ( seperti the , is ,on , or , of , how , why ) , kata-kata ini biasa digunakan sebagai kata bantu tapi bisa juga digunakan sebagai keyword pencarian. Indexer juga tidak melakukan index untuk beberapa tanda baca dan juga multiple space. 1 lagi google juga melakukan convert semua huruf ke dalam lower-case atau huruf kecil untuk membantu meningkatkan performa Google.
  • Query processor , membandingkan keyword yang kita ketikan di search engine dengan index yang ada dan melakukan rekomendasi dokumen yang paling berhubungan.Beberapa bagian dari query processor , search box yang biasa ada di www.google.com dan juga “engine” yang berfungsi melakukan evaluasi terhadap keyword yang kita masukkan dan melakukan penyamaan ke dokumen yang relevant , dan satu lagi adalah results formatter.List dari sesuatu yang kita cari itu bukan list sembarangan , hasil pencarian itu diurutkan berdasarkan page rank , page rank ini disusun berdasarkan dokumen yang paling berhubungan dengan keyword yang kita masukkan dan juga berdasarkan page yang paling sering dikunjungi. Si Om Google juga punya suatu teknologi yaitu spelling-correting system dimana dia akan melakukan suggestion keyword kepada kita bila kita mengetik sesuatu yang sekiranya salah-salah ketik dikit lah..Ada beberapa teknik pencarian lagi diantaranya Advanced Search Form dan Using Search Operator , cm belom gw bahas yah,entar tunggu dapet dokumennya dulu.

Hah!!!beres juga nih 1 topik ,, next topic will be delivered to you soon.. Thank’s guys!
Adapt from : www.googleguide.com
Hady – as Administrator.

Read More ..

1 komentar:

Moechtar mengatakan...

Trims infonya,,
tp koq g lengkap sich,,

Got Me!!!