Goog­le, Craw­ling und der Site-Ope­ra­tor

Sie haben eine neue Web­seite – aber wer­den Ihre Kun­den sie im Inter­net fin­den?
Die meis­ten Benut­zer, die im Inter­net irgend­et­was suchen, tun das über eine Goog­le-Suche – wer also im Inter­net gefun­den wer­den will, der stellt sicher, dass Goog­le sei­ne Sei­te kennt. Hier erfah­ren Sie, wie Goog­le funk­tio­niert und wie Sie Ihre Web­seite dem Goog­le-Index hin­zu­fü­gen.

Goog­le, Craw­ling und der Site-Ope­ra­­tor
4.8 (95%) 8 Bewertung[en]

Wie funk­tio­niert eigent­lich Goog­le?

Goo­g­les obers­te Prio­ri­tät ist es, sei­ne Nut­zer zufrie­den zu stel­len. Nut­zer sind dann zufrie­den, wenn sie gleich auf der ers­ten Ergeb­nis­sei­te die gesuch­te Web­seite, das gesuch­te Pro­dukt oder die Ant­wort auf ihre aktu­el­le Fra­ge fin­den. Daher muss es Goog­le gelin­gen, die ange­bo­te­nen Sei­ten im Inter­net zu unter­su­chen und ihre Rele­vanz für den Leser im Hin­blick auf das Such­wort best­mög­lich fest­zu­stel­len.
Der ers­te Schritt für Goog­le ist es also, das gesam­te Ange­bot zu ken­nen, also jede Sei­te im Inter­net zu besu­chen und sich Noti­zen zum Inhalt der Sei­te zu machen. Da ein Mensch natür­lich schnell über­for­dert wäre, bedient sich Goog­le eines Bots, auch Craw­ler oder Spi­der genannt, der im Inter­net surft und per­ma­nent Sei­ten inde­xiert. Nur Web­seiten, die von Goog­le gecrawlt bzw. inde­xiert wur­den, kön­nen als Such­ergeb­nis­se bei Goog­le ange­zeigt wer­den. Sie erle­ben auf Goog­le also kei­ne Suche in Echt­zeit, son­dern bekom­men Sei­ten ange­zeigt, die bereits vor­her geprüft und inde­xiert wur­den.

Ist mei­ne Sei­te bei Goog­le inde­xiert?

Das ist ein­fach her­aus­zu­fin­den: Geben Sie in das Goog­le Such­feld den so genann­ten „site:“-Operator zusam­men mit Ihrer Domain, im Foto­bei­spiel „site:sixhop.net“ ein. Such­ergeb­nis­se von Ihrer Sei­te soll­ten jetzt ganz oben ange­zeigt wer­den (oran­ge­far­be­ne Pfei­le). Außer­dem zeigt Goog­le gleich unter dem Such­feld die Anzahl aller inde­xier­ten Ergeb­nis­se un die dafür benö­tig­te Zeit an (oran­ge­far­be­ner Kas­ten).

screenshot von einer suche nach sixhop.net mit dem "site-operator"

 

Sind vie­le Sei­ten im Index vor­han­den, oder möch­ten sie über­prü­fen, ob bestimm­te Unterseiten/Dokumente auf Ihrer Web­seite inde­xiert sind, las­sen sich die Ergeb­nis­se der site:-Abfrage mit ver­schie­de­nen Kri­te­ri­en ver­fei­nern:

• site:www.ihre-domain.de/unterordner/
zeigt aus­schließ­lich alle inde­xier­ten Sei­ten aus dem Ver­zeich­nis /unterordner/ an

• site:www.ihre-domain.de Such­be­griff
zeigt aus­schließ­lich alle inde­xier­ten Sei­ten an, wel­che den Inhalt „Such­be­griff“ besit­zen

• site:www.ihre-domain.de inurl:begriff
zeigt aus­schließ­lich alle inde­xier­ten Sei­ten an, wel­che das Wort „begriff“ in der URL besit­zen

• site:www.ihre-domain.de intitel:begriff
zeigt aus­schließ­lich alle inde­xier­ten Sei­ten an, wel­che das Wort „begriff“ im Tit­le besit­zen

• site:www.ihre-domain.de filetype:pdf
zeigt aus­schließ­lich alle inde­xier­ten Datei­en des gewähl­ten Datei­typs (hier: alle .pdf Datei­en) an.

 

Hil­fe – mei­ne Sei­te (oder eine Unter­sei­te) ist nicht bei Goog­le inde­xiert

Der Goog­le Craw­ler durch­sucht jeden Tag das Inter­net und inde­xiert dabei sehr sehr vie­le Sei­ten. Mil­li­ar­den. Wirk­lich! Trotz­dem kann es pas­sie­ren, dass eini­ge Web­seiten (noch) nicht gefun­den wur­den. Dies kann ver­schie­de­ne Grün­de haben:
• Die Web­seite ist nicht mit genug ande­ren Web­sites ver­knüpft. Das kann gera­de bei Lan­ding­pa­ges der Fall sein, die nur von Soci­al Media Posts aus auf Ihre Web­seite ver­lin­ken.
• Sie haben die Web­site gera­de erst ver­öf­fent­licht und Goog­le konn­te die Sei­te noch nicht craw­len.
• Der Auf­bau der Web­site erschwert es Goog­le, den Inhalt der Sei­te effek­tiv zu craw­len
• Goog­le hat beim Ver­such, Ihre Web­site zu craw­len, eine Feh­ler­mel­dung erhal­ten.

Wenn Ihre Web­seite neu ist, oder nur ein­zel­ne Unter­sei­ten inde­xiert sind, stel­len Sie die feh­len­den Sei­ten ein­fach mit Hil­fe der „Sub­mit URL“-Funktion bei Goog­le ein.

Außer­dem ist es rat­sam, fol­gen­de Tipps aus Goo­g­les „Richt­li­ni­en für Web­mas­ter“ zu beach­ten:
• Gestal­ten Sie Ihre Web­site mit einer klar struk­tu­rier­ten Sei­ten­hier­ar­chie.
• Erstel­len Sie eine hilf­rei­che, infor­ma­ti­ve Web­site und ver­fas­sen Sie Sei­ten, die den Inhalt klar und ein­deu­tig beschrei­ben.
• Über­le­gen Sie sich, wel­che Such­be­grif­fe Nut­zer ein­ge­ben wür­den, um nach Ihrer Sei­te zu suchen. Ver­wen­den Sie die­se Begrif­fe mehr­fach auf Ihrer Web­seite.
• Wenn Sie ein Con­tent-Manage­ment-Sys­tem ver­wen­den, z. B. Joom­la! oder Word­Press, ver­ge­wis­sern Sie sich, dass das Sys­tem Sei­ten und Links erstellt, die von Such­ma­schi­nen gecrawlt wer­den kön­nen.

Pla­nen Sie, ihre Web­seite noch häu­fi­ger zu ver­än­dern oder zu erwei­tern? Mel­den Sie Ihre Web­seite bei der Goog­le Search Con­so­le an! Dort kön­nen Sie zum Bei­spiel eine Sitemap Ihrer Sei­te ein­rei­chen, Feh­ler­mel­dun­gen beim Craw­len über­prü­fen und das Craw­len über­dies mit einer robots.txt steu­ern.

Klingt kom­pli­ziert? Lesen Sie hier alles zur Ein­rich­tung der Goog­le Search Con­so­le.

Die­sen Bei­trag tei­len