Cum functioneaza si cat dureaza indexarea in google
In primul rand ce este un bot? Un bot (ma refer strict la botii de webcrawling) este un program care tot timplu se plimba pe diferite pagini web si creaza o baza de date pe care se pot face cautari.
Google-ul are 2 boti mai importanti: Freshbot si DeepCrawl.
Primul are ca scop cautarea de link-uri si updatarea bazei de date referitoare la un site. Daca aveti o sectiune de news de exemplu v-ati dori ca Freshbot sa o viziteze zilnic daca se poate sa indexeze orice noua schimbare. Cum internetul este insa destul de mare freshbot viziteaza in medie un site cam la 1-2 saptamani. Zic in medie pentru un site cum este cnn-ul care are popularitate mare si care primeste stiri noi de cateva ori pe zi, va fi probabil indexat de cateva ori pe zi. Este de retinut ca google-ul indexeaza mai des site-uri al caror continut se schimba des.
DeepCrawl indexeaza siturile noi gasite de Freshbot, in ordinea popularitatii (defapt a numarului de referinte catre situl respectiv). Aceasta indexare poate dura destul de mult pentru un site nou, mai ales daca acesta nu este inscris in directoare de situri sau nu are link-uri de pe alte site-uri in general.
Daca un site nu are nici un link, de nicaieri, nimeni nu ii face submit la google (http://www.google.com/addurl/) el probabil nu va fi indexat. De ce zic probabil? Pentru s-au mai intamplat cazuri in care zone secrete a unui site au fost indexate desi nu erau linkuri catre ele. Explicatia a fost cineva a dat click de pe un link aflat in acea zona secreta, link care a condus catre un site care isi publica logurile de referer (referer se refera la adresa de unde a venit utilizatorul si este furnizat de browser, complet transparent utilizatorului), loguri pe care google-ul le-a citit.
Inapoi la Articole pentru webmasteri