Google, Craw­ling und der Site-Operator

Sie haben eine neue Web­seite – aber wer­den Ihre Kun­den sie im Inter­net finden?
Die meis­ten Benut­zer, die im Inter­net irgend­et­was suchen, tun das über eine Google-Suche – wer also im Inter­net gefun­den wer­den will, der stellt sicher, dass Google sei­ne Sei­te kennt. Hier erfah­ren Sie, wie Google funk­tio­niert und wie Sie Ihre Web­seite dem Google-Index hinzufügen.

4.7/5 – (36 votes) 

Wie funk­tio­niert eigent­lich Google?

Goo­gles obers­te Prio­ri­tät ist es, sei­ne Nut­zer zufrie­den zu stel­len. Nut­zer sind dann zufrie­den, wenn sie gleich auf der ers­ten Ergeb­nis­sei­te die gesuch­te Web­seite, das gesuch­te Pro­dukt oder die Ant­wort auf ihre aktu­el­le Fra­ge fin­den. Daher muss es Google gelin­gen, die ange­bo­te­nen Sei­ten im Inter­net zu unter­su­chen und ihre Rele­vanz für den Leser im Hin­blick auf das Such­wort best­mög­lich festzustellen.
Der ers­te Schritt für Google ist es also, das gesam­te Ange­bot zu ken­nen, also jede Sei­te im Inter­net zu besu­chen und sich Noti­zen zum Inhalt der Sei­te zu machen. Da ein Mensch natür­lich schnell über­for­dert wäre, bedient sich Google eines Bots, auch Craw­ler oder Spi­der genannt, der im Inter­net surft und per­ma­nent Sei­ten inde­xiert. Nur Web­seiten, die von Google gecrawlt bzw. inde­xiert wur­den, kön­nen als Such­ergeb­nis­se bei Google ange­zeigt wer­den. Sie erle­ben auf Google also kei­ne Suche in Echt­zeit, son­dern bekom­men Sei­ten ange­zeigt, die bereits vor­her geprüft und inde­xiert wurden.

Ist mei­ne Sei­te bei Google indexiert?

Das ist ein­fach her­aus­zu­fin­den: Geben Sie in das Google Such­feld den so genann­ten „site:“-Operator zusam­men mit Ihrer Domain, im Foto­bei­spiel „site:sixhop.net“ ein. Such­ergeb­nis­se von Ihrer Sei­te soll­ten jetzt ganz oben ange­zeigt wer­den (oran­ge­far­be­ne Pfei­le). Außer­dem zeigt Google gleich unter dem Such­feld die Anzahl aller inde­xier­ten Ergeb­nis­se un die dafür benö­tig­te Zeit an (oran­ge­far­be­ner Kasten).

screenshot von einer suche nach sixhop.net mit dem "site-operator"

 

Sind vie­le Sei­ten im Index vor­han­den, oder möch­ten sie über­prü­fen, ob bestimm­te Unterseiten/Dokumente auf Ihrer Web­seite inde­xiert sind, lassen sich die Ergeb­nis­se der site:-Abfrage mit ver­schie­de­nen Kri­te­ri­en verfeinern:

• site:www.ihre-domain.de/unterordner/
zeigt aus­schließ­lich alle inde­xier­ten Sei­ten aus dem Ver­zeich­nis /unterordner/ an

• site:www.ihre-domain.de Suchbegriff
zeigt aus­schließ­lich alle inde­xier­ten Sei­ten an, wel­che den Inhalt „Such­be­griff“ besitzen

• site:www.ihre-domain.de inurl:begriff
zeigt aus­schließ­lich alle inde­xier­ten Sei­ten an, wel­che das Wort „begriff“ in der URL besitzen

• site:www.ihre-domain.de intitel:begriff
zeigt aus­schließ­lich alle inde­xier­ten Sei­ten an, wel­che das Wort „begriff“ im Title besitzen

• site:www.ihre-domain.de filetype:pdf
zeigt aus­schließ­lich alle inde­xier­ten Datei­en des gewähl­ten Datei­typs (hier: alle .pdf Datei­en) an.

 

Hil­fe – mei­ne Sei­te (oder eine Unter­sei­te) ist nicht bei Google indexiert

Der Google Craw­ler durch­sucht jeden Tag das Inter­net und inde­xiert dabei sehr sehr vie­le Sei­ten. Mil­li­ar­den. Wirk­lich! Trotz­dem kann es pas­sie­ren, dass eini­ge Web­seiten (noch) nicht gefun­den wur­den. Dies kann ver­schie­de­ne Grün­de haben:
• Die Web­seite ist nicht mit genug ande­ren Web­sites ver­knüpft. Das kann gera­de bei Landing­pa­ges der Fall sein, die nur von Social Media Posts aus auf Ihre Web­seite verlinken.
• Sie haben die Web­site gera­de erst ver­öf­fent­licht und Google konn­te die Sei­te noch nicht crawlen.
• Der Auf­bau der Web­site erschwert es Google, den Inhalt der Sei­te effek­tiv zu crawlen
• Google hat beim Ver­such, Ihre Web­site zu craw­len, eine Feh­ler­mel­dung erhalten.

Wenn Ihre Web­seite neu ist, oder nur ein­zel­ne Unter­sei­ten inde­xiert sind, stel­len Sie die feh­len­den Sei­ten ein­fach mit Hil­fe der „Sub­mit URL“-Funktion bei Google ein.

Außer­dem ist es rat­sam, fol­gen­de Tipps aus Goo­gles „Richt­li­ni­en für Web­mas­ter“ zu beachten:
• Gestal­ten Sie Ihre Web­site mit einer klar struk­tu­rier­ten Seitenhierarchie.
• Erstel­len Sie eine hilf­rei­che, infor­ma­ti­ve Web­site und ver­fas­sen Sie Sei­ten, die den Inhalt klar und ein­deu­tig beschreiben.
• Über­le­gen Sie sich, wel­che Such­be­grif­fe Nut­zer ein­ge­ben wür­den, um nach Ihrer Sei­te zu suchen. Ver­wen­den Sie die­se Begrif­fe mehr­fach auf Ihrer Webseite.
• Wenn Sie ein Con­tent-Manage­ment-Sys­tem ver­wen­den, z. B. Joom­la! oder Word­Press, ver­ge­wis­sern Sie sich, dass das Sys­tem Sei­ten und Links erstellt, die von Such­ma­schi­nen gecrawlt wer­den können.

Pla­nen Sie, ihre Web­seite noch häu­fi­ger zu ver­än­dern oder zu erwei­tern? Mel­den Sie Ihre Web­seite bei der Google Search Con­so­le an! Dort kön­nen Sie zum Bei­spiel eine Site­map Ihrer Sei­te ein­rei­chen, Feh­ler­mel­dun­gen beim Craw­len über­prü­fen und das Craw­len über­dies mit einer robots.txt steuern.

Klingt kom­pli­ziert? Lesen Sie hier alles zur Ein­rich­tung der Google Search Con­so­le.