Cikkek
 

Pörög a Google

A Google bejelentette, hogy elkészült a webkeresője új indexelési eljárásával. A Caffeine kódnevű megoldás 50 százalékkal gyorsabb indexelést tesz lehetővé, mint a korábbi, azaz a tartalmak még gyorsabban kerülhetnek be a találatok közé.

A Google indexeire eddig sem volt számottevő panasz, ugyanis a nagyobb oldalakon megjelenő új oldalak már eddig is perceken belül megjelentek a Google-ben, a változás ezért inkább a ritkábban látogatott oldalaknak, kisebb szájtoknak, különálló domaineknek jelenthet érezhető gyorsulást. Mivel a keresések indításakor valójában nem a teljes webet, hanem "csak" a Google indexei között böngészünk, ezért mégis fontos, hogy ez a valós állapotokhoz minél közelebbit mutasson.
Rétegek helyett régiók a fontosak, a régi, eddig működő rendszerben a Google rétegekre osztotta az internetet, s ezek közül a fontosabbak, nagyobb és látogatottabb, gyakrabban változó oldalak indexelése gyakrabban történt meg, mint másoké. Az alap réteg, amibe a futottak még kategóriájú oldalak tartoznak, mindössze néhány hetente frissültek, míg például a híroldalak, blogok szinte percenként. Az eddigi megoldás minden alkalommal a teljes webet vette figyelembe, s emiatt szükségszerűen lassú volt a folyamat bizonyos szint alatt.
A helyzet a Google szerint azonban hosszabb távon tarthatatlan volt, a weben megjelenő információmennyiség növekedése ugrásszerű, a felhasználók pedig sokkal komolyabb elvárásokkal kezdenek bele egy keresésbe, mint korábban. Az internetezők a legfrissebb és legrelevánsabb tartalmat szeretné megkapni, miközben a tartalmat közzétevők elvárják, hogy azonnal megjelenjenek a találatok között. A Caffeine éppen azért jött létre, hogy a Google lépést tarthasson az igények fejlődésével.
Az új kereső index működése annyiban tér el a régitől, hogy a webet már nem egészében, hanem kis részekben kezeli, viszont az adatok frissítése teljesen folyamatos és közvetlen. Ha a robotok új, vagy megváltozott tartalmat észlelnek valahol, akkor az direkt módon bekerül az élő indexbe. Természetesen a teljesítmény is növekedett, s a Caffeine másodpercenként több százezer oldalt jár végig. A teljes adatbázis jelenleg közel 100 millió gigabájt, saz újdonságok naponta további százezer gigabájt nagyságrendnyi adatot érintenek az indexben.
És nincs még vége, a Caffeine létrejötte azonban nem elsősorban az óriási méretek miatt volt fontos, hanem a még gyorsabb, még relevánsabb találatok lehetősége miatt. A hivatalos blogbejegyzés emellett kilátásba helyez további újdonságokat is, de konkrétan nem árulták el, hogy mire lehet számítani.