getreidemuehlen
-


Hinweise


Antwort
 
LinkBack Themen-Optionen Thema durchsuchen Thema bewerten
Alt 27.07.2005, 15:54   #1
TP-Insider
 
Benutzerbild von Jupp
 
Registriert seit: Jul 2004
Ort: Mönchengladbach
Jupp bringt sich richtig ein

Google spidert Homepage nicht komplett


Wie der Titel schon sagt, wird meine Homepage von Google nicht komplett gespidert... Zwar schaut der Googlebot regelmäßig vorbei, allerdings ist er auch genauso schnell wieder weg, ohne die Unterseiten zu spidern...

Die robots.txt sieht folgendermaßen aus:
Code:
User-agent: *
Disallow: /css/
Disallow: /img/
Disallow: /inc/
Disallow: /js/
Disallow: /new/
Disallow: /tipprunde/
Disallow: /tmpl/
Disallow: /lauth/
An sich denke ich, dass meine Seite eigentlich relativ SuMa-freundlich ist...

Was mir aufgefallen ist ist, dass Links auf die HP verweisen von anderen Seiten, die mir nicht bekannt sind (z.b. http://cyblog.de/item/50177, http://216.239.59.104/search).

Könnte sich der Sache mal jemand befassen? Das wäre klasse
__________________

GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
Jupp ist offline   Mit Zitat antworten


Alt 27.07.2005, 17:35   #2
TP-Greis
 
Benutzerbild von Boris
 
Registriert seit: Mar 2001
Ort: Berlin, Germany
Boris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKE
Tja, Google ignoriert gern Seiten, deren URL so aussieht: ?PHPSESSID=d102138afa4ca1feca5aa89abb59f21a
__________________
My software never has bugs. It just develops random features ...

» DevShack - die Website des freien Webentwicklers Boris
Boris ist offline   Mit Zitat antworten
Alt 27.07.2005, 18:05   #3
TP-Specialist
 
Benutzerbild von rewboss
 
Registriert seit: Mar 2005
Ort: Unterfranken
rewboss ist ein richtiges Arbeitstier - DANKErewboss ist ein richtiges Arbeitstier - DANKErewboss ist ein richtiges Arbeitstier - DANKErewboss ist ein richtiges Arbeitstier - DANKErewboss ist ein richtiges Arbeitstier - DANKErewboss ist ein richtiges Arbeitstier - DANKE
Zitat:
Zitat von Jupp
Was mir aufgefallen ist ist, dass Links auf die HP verweisen von anderen Seiten, die mir nicht bekannt sind (z.b. http://cyblog.de/item/50177, http://216.239.59.104/search).
Also, die zweite URL, die mit der IP-Adresse, ist Google. Frag mich nicht, was die andere Seite ist -- anscheinend postet da einer irgendwelche Suchmaschinenergebnisse. Du bist unter "Saufspiele" zu finden.

Hast du übrigens ein Problem damit, wenn andere Leute Links von ihrer Website auf deine setzen? Wenn ja, sollst du deine Website schleunigst verschwinden lassen. Aber du kannst ja selber den verweisenden Links folgen, um zu gucken, wie die Leute dich finden...
rewboss ist offline   Mit Zitat antworten
Alt 28.07.2005, 13:16   #4
TP-Insider
 
Benutzerbild von Jupp
 
Registriert seit: Jul 2004
Ort: Mönchengladbach
Jupp bringt sich richtig ein
Zitat:
Zitat von Boris
Tja, Google ignoriert gern Seiten, deren URL so aussieht: ?PHPSESSID=d102138afa4ca1feca5aa89abb59f21a
Hm... Wo kommen die Anhängsel denn her? Geht das automatisch, sobald ich eine Session starte? Die Session brauche ich nur, wenn der Besucher eingeloggt ist. In der index.php steht folgendes:
PHP-Code:
session_start();

if(!
$_SESSION["user_id"]) {
    
session_destroy();

Also ich starte die Session, wenn jedoch keine User-ID gesetzt ist, soll sie wieder destroyed werden, dann brauchts auch nicht die Google-störenden Anhengsel... (so hab ich mir das jedenfalls vorgestellt...)

Zitat:
Zitat von rewboss
Hast du übrigens ein Problem damit, wenn andere Leute Links von ihrer Website auf deine setzen? Wenn ja, sollst du deine Website schleunigst verschwinden lassen.
Gute Idee...
Natürlich habe ich kein Problem mit Links auf meine Seite... Im Gegenteil. Jedoch war mir die verlinkende Seite etwas schleierhaft.
__________________

GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
Jupp ist offline   Mit Zitat antworten
Alt 28.07.2005, 13:33   #5
TP-Greis
 
Benutzerbild von Boris
 
Registriert seit: Mar 2001
Ort: Berlin, Germany
Boris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKE
Zitat:
Hm... Wo kommen die Anhängsel denn her? Geht das automatisch, sobald ich eine Session starte?
In dem Moment, wo Du session_start() benutzt, wird die Session entweder in einem Cookie angelegt oder halt über die URL übertragen. Und da Google eher keine Cookies anlegen lässt, erhält er Deine URLs mit der SESSIONID ... und ignoriert daher alle Unterseiten.
__________________
My software never has bugs. It just develops random features ...

» DevShack - die Website des freien Webentwicklers Boris
Boris ist offline   Mit Zitat antworten
Alt 28.07.2005, 13:39   #6
TP-Insider
 
Benutzerbild von Jupp
 
Registriert seit: Jul 2004
Ort: Mönchengladbach
Jupp bringt sich richtig ein
Also nutzt das session_destroy(); auch nichts...

Wie könnte ich denn alternativ auf einen Login überprüfen, ohne Session? Da will mir im Moment nichts einfallen...
__________________

GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
Jupp ist offline   Mit Zitat antworten
Alt 28.07.2005, 13:43   #7
TP-Greis
 
Benutzerbild von Boris
 
Registriert seit: Mar 2001
Ort: Berlin, Germany
Boris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKE
Du kannst versuchen, via htaccess es zu unterbinden, dass Sessions in der URL abgelegt werden. So kriegt Google normale Links (Google braucht sich ja nicht einzuloggen).

Allerdings sperrst Du so auch normale User aus, die es nicht erlauben, dass man Cookies bei ihnen anlegt. Aber a) kannst Du das einfach voraussetzen und b) ist das so sicherer, wenn Sessions nicht in der URL übertragen werden.

Schreib das in die .htaccess:
Code:
php_flag session.use_trans_sid 0 
php_flag session.use_only_cookies 1
__________________
My software never has bugs. It just develops random features ...

» DevShack - die Website des freien Webentwicklers Boris
Boris ist offline   Mit Zitat antworten
Alt 28.07.2005, 13:47   #8
TP-Insider
 
Benutzerbild von Jupp
 
Registriert seit: Jul 2004
Ort: Mönchengladbach
Jupp bringt sich richtig ein
Zitat:
Zitat von Boris
Allerdings sperrst Du so auch normale User aus, die es nicht erlauben, dass man Cookies bei ihnen anlegt.
Das setze ich so oder so vorraus
Zitat:
Zitat von Boris
Schreib das in die .htaccess:
Code:
php_flag session.use_trans_sid 0 
php_flag session.use_only_cookies 1
Das wäre genial, nur leider gibt's dann nen 500er...
__________________

GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
Jupp ist offline   Mit Zitat antworten
Alt 28.07.2005, 13:58   #9
TP-Greis
 
Benutzerbild von Boris
 
Registriert seit: Mar 2001
Ort: Berlin, Germany
Boris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKE
Tja, dann geht es leider nicht bei Dir (Dein Hoster erlaubt das nicht). Hm ... wär ein Fall für unsere Traum_Dynamiker!
__________________
My software never has bugs. It just develops random features ...

» DevShack - die Website des freien Webentwicklers Boris
Boris ist offline   Mit Zitat antworten
Alt 04.08.2005, 08:17   #10
TP-Insider
 
Benutzerbild von Jupp
 
Registriert seit: Jul 2004
Ort: Mönchengladbach
Jupp bringt sich richtig ein
es ist zum verzweifeln... mittlerweile sind die links alle okay, jedoch spidert google nach wie vor nur den index... es stehen doch alle links ganz sauber in einer liste... woran könnte es noch liegen, dass die links nicht beachtet werden?
__________________

GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
Jupp ist offline   Mit Zitat antworten
Alt 04.08.2005, 08:37   #11
wys
TP-Insider
 
Registriert seit: Jul 2004
wys bringt sich richtig einwys bringt sich richtig ein
Vielleicht daran:
<meta name="robots" content="noarchive">

Soweit ich hörte, werden dann zwar vom Googlebot die Unterseiten indiziert, aber bei der einfachen Suche in Google nicht angezeigt.

Ohne Gewähr!

lg
wys
wys ist offline   Mit Zitat antworten
Alt 04.08.2005, 10:36   #12
TP-Greis
 
Benutzerbild von Boris
 
Registriert seit: Mar 2001
Ort: Berlin, Germany
Boris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKEBoris ist ein richtiges Arbeitstier - DANKE
Stimmt - mach das raus. Beachte auch, dass Google nicht jeden Tag vorbei kommt (auch nicht jede Woche), das kann bissel dauern.
__________________
My software never has bugs. It just develops random features ...

» DevShack - die Website des freien Webentwicklers Boris
Boris ist offline   Mit Zitat antworten
Alt 05.08.2005, 16:55   #13
TP-Insider
 
Benutzerbild von Jupp
 
Registriert seit: Jul 2004
Ort: Mönchengladbach
Jupp bringt sich richtig ein
Zitat:
Zitat von wys
Vielleicht daran:
<meta name="robots" content="noarchive">
das hab ich erst nachher reingemacht, wollte versuchen, das google die alten urls der domain löscht und neu spidert...

Zitat:
Zitat von Boris
Beachte auch, dass Google nicht jeden Tag vorbei kommt (auch nicht jede Woche), das kann bissel dauern.
ich seh ja in meinen statistiken, dass der GoogleBot jeden zweiten tag mal reinschaut... naja ich wart erst mal ab, wenn sich nichts tut (wovon ich ausgehe), poste ich nochmal... wer in der zwischenzeit noch ideen hat, woran es liegen könnte... nur her damit!
__________________

GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
Jupp ist offline   Mit Zitat antworten
Antwort

  Aktuelles Thema
  TP Hilfe Forum > Traum-Talk > Webdesign & Co. > Suchmaschinen
Google spidert Homepage nicht komplett Google spidert Homepage nicht komplett
« Wie hoch ist der Einsatz? | Das lange s »

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu


Alle Zeitangaben in WEZ +2. Es ist jetzt 14:50 Uhr.

Powered by: vBulletin Version 3.7 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd. / Search Engine Friendly URLs by vBSEO 3.2.0 ©2008, Crawlability, Inc.
Traum-Projekt.com | Suchen | Archiv | Impressum | Kontakt | | | Nach oben |



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67