bildirgec.org

bots hakkında tüm yazılar

TurkTelekom Dünya’da spam birincisi

delizade | 20 February 2008 09:51

bir süre önce O’reilly radar* sitesindeki yorumlarda büyük bir terslik farkedilir. Bu sorun görülür görülmez mesele araştırılmış ve sonuçta bir spam atağı görülmüş.

>”nasıl olur da spam algılayıcı sistem geçilebilir?”

Kullandıkları sistem “reCaptcha” isminde ücretsiz bir insan-bilgisayar algılama aracı. Bu araç, hepimizin yakından bildiği “gör-ya da duy,algıla ve yaz” sistemi ile girişin insan tarafından yapılıp yapılmadığını tespit ediyor.

reCaptcha: robot musun, yoksa insan mı?

delizade | 13 February 2008 15:30

bir site girişi esnasında robot-insan ayrımı yapmak artık ir zorunluluk. Bu sorunun çözümü harika bir fikirdi: gördüğünü ya da duyduğunu algılayarak,seçerek giriş yapmak. Bunu ancak bir insan yapabilir çünkü.

reCaptcha bu araclardan biri. Captcha* sistemini oldukça ayrıntılı ve hassas olarak uygulamaya çalışan Captcha sisteminin ücretsiz bir versiyonu. Şu ana kadar 20.000 kadar sitenin kullandığı, 2000 insanın tam gün çalışması ile girilebilecek kadar kitabın dijital ortama alınarak analizinin yapılığı bir sistem.

daha önce girdiğim bir bildiride de reCaptcha ‘dan bahsetmiştim. Bu araç, bünyesinde barındırdığı metin okuma analizleri datası ile bu hizmeti kusursuz sunmaya çalışıyor. Nasıl mı?

google beni nasıl buldu?

tavhane | 08 January 2008 13:38

bir çok kişi merak etmiştir. hiç bir yere web sitemi eklemediğim halde bu google beni nasıl buluyor ve nasıl sitemi sayfasına ekliyor diye.

sorunun cevabı aslında çok basit. google teknolojisi botlar (robotlar). google botları internet üzerinde var olan tüm IP adreslerini teker teker, sıralı bir algoritmada tarayıp, bu ip adreslerine giriş yapıyorlar. yani google sizin web sitenize websiteniz.com olarak girmiyor, 85.158.77.85 … 85.158.77.86 (sıralı) giriyor. web sitenize giren robot, önce web sitenizde bir robots.txt varmı diye bakar. eğer varsa ona göre hareket eder, yoksa tüm içeriği veritabanına kaydedip google’da yayınlanma kuyruğuna atar. robot web sitenizde geçerken, google tarafından zararlı olarak nitelendirilebilecek bir içeriğe rastlarsa bu notu düşerek veritabanına siteyi kaydeder. olası zararlı içeriğe sahip içerikli siteler, google çalışanları tarafından manuel olarak son kez kontrol edilerek yayınlanır.