bildirgec.org

google file system hakkında tüm yazılar

Google PetaByte’larca Bilgiyi Sıralıyor

Redingot | 25 November 2008 18:36

Google, anahtar kelimeler ile web site isimlerini ve içeriklerini inceleyerek yaptığı çıkarımlarla web siteleri sıralıyor. En iyi sıralamaya ulaşmayı en kısa zamanda büyük bilgi yığını içinde yapmaya çalışıyor.

Sıralama işini MapReduce ile yapan google, daha önceden Google Dosya Sistemi (Google File System) içinde yer alan 1TB (tera byte) olan 1 milyar tane 100 bytle’lık kayıtları karşılaştırarak sıralıyordu. Bu bilgiyi önceleri 910 bilgisayar 209 saniyede sıralarken daha sonra 1000 bilgisayar 68 saniyede sıralayordu.