Ich bin doch einigermassen überrascht und bitte um Rat von Wissenden.
Seit mehreren Tagen habe ich seitenweise Artikel über mein Hardwareprojekt NAS mit Raid5 aus Zenega geschrieben. Merkwürdigerweise finde ich die Projektseiten in Google und gigablast überhaupt nicht, obwohl sie von den Bots abgeklappert wurden. Searchmsn hingegen macht es ganz vorbildlich. Google zeigt nur die Seiten aus dem Blog und verweist auch nur zur Eingangsseite. Das Problem ist aber, nach einigen Tagen ist der Artikel nicht mehr auf Seite eins und der Surfer wird den Artikel gar nicht finden, wenn er nicht die Site eigene Livesearch Funktion benutzt, die aber auch ihre Tücken hat. Mich interessiert, ob es vielleicht an der Art liegt, mit der die Artikel verlinkt sind? Meine Projektseiten sind mit dem Plugin statistische Seiten generiert und haben eine andere Struktur mit /pages/ drin.
[UPDATE] heute, am05.03.2006 finde ich mit dieser Suche auch Einträge auf Google
bed@Keller:~/logs$ grep -i googlebot *2|grep pages
66.249.66.98 - - [23/Feb/2006:18:40:02 +0100] "GET /s9y/index.php?/pages/10Nega.html HTTP/1.1" 200 6752 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.98 - - [23/Feb/2006:18:40:03 +0100] "GET /s9y/index.php?/pages/nasr5.html HTTP/1.1" 200 6736 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.98 - - [24/Feb/2006:02:40:06 +0100] "GET /s9y/index.php?/pages/10Nega.html HTTP/1.1" 200 6826 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.98 - - [24/Feb/2006:02:40:10 +0100] "GET /s9y/index.php?/pages/nasr5.html HTTP/1.1" 200 6821 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.98 - - [25/Feb/2006:02:40:00 +0100] "GET /s9y/index.php?/pages/wlanacx54.html HTTP/1.1" 200 6721 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.98 - - [25/Feb/2006:02:40:07 +0100] "GET /s9y/index.php?/pages/nasr5.html HTTP/1.1" 200 6851 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.98 - - [25/Feb/2006:02:41:30 +0100] "GET /s9y/index.php?/pages/10Nega.html HTTP/1.1" 200 6824 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.98 - - [25/Feb/2006:12:57:51 +0100] "GET /s9y/index.php?/pages/raidtab.html HTTP/1.1" 200 7300 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.98 - - [25/Feb/2006:12:57:54 +0100] "GET /s9y/index.php?/pages/Partitionierung.html HTTP/1.1" 200 6668 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.98 - - [25/Feb/2006:15:37:16 +0100] "GET /s9y/index.php?/pages/Controller.html HTTP/1.1" 200 6456 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.72.202 - - [26/Feb/2006:00:45:24 +0100] "GET /s9y/index.php?/pages/raid5ueberleg.html HTTP/1.1" 200 6692 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Hier mal zur Ansicht ein Ausschnitt vom Log dargestellt sind nur gooblebotzugriffe auf meine Projektseiten
Also es ist mir wirklich nicht anders erklärbar, vielleicht sollte ich wirklich den Begriff pages meiden und was anderes nehmen.
Google schreibt dazu in ihrer FAQ:
11. Warum werden die von Googlebot durchlaufenen Seiten meiner Website nicht in Ihrem Index angezeigt?
Es
sollte Sie nicht beunruhigen, wenn Sie die Dokumente, die Googlebot
durchlaufen hat, nicht sofort in der Google-Suchmaschine entdecken.
Dokumente werden kurz nach dem Durchlauf in unseren Index eingegeben.
Mitunter werden von Googlebot abgerufene Dokumente aus verschiedenen
Gründen nicht in den Index aufgenommen (z.B. wenn es sich anscheinend
um Duplikate anderer Webseiten handelt).
Da frage ich mich, was kurz bedeutet.
[UPDATE] heute, am05.03.2006 finde ich mit dieser Suche auch Einträge auf Google