 |
| Hinweise |
Willkommen im TP-Hilfe-Forum!Dies ist ein Forum zu den Themen Photoshop, Dreamweaver, Flash, Selbständigkeit und mehr, in dem Du Hilfe, Anleitung oder eine Lösung zu Deinen Problemen erhältst. Aktuell bist Du in unseren Foren als Gast mit reinen Leserechten unterwegs. Wenn Du Dich registrierst, kannst Du eigene Themen verfassen, deine Frage stellen und privat mit anderen TPlern kommunizieren. Weitere Foren werden zugänglich, und Du wirst – falls gewünscht – per Mail über neue Beiträge informiert. Die Registrierung ist schnell und kostenlos. Sollten bei der Registrierung Fragen auftauchen, reicht ein Klick in unsere Hilfe - Häufig gestellte Fragen oder eine kurze Mitteilung an das Support-Team. Viel Spaß bei Traum-Projekt.com |
27.07.2005, 15:54
|
#1
|
|
TP-Insider
Registriert seit: Jul 2004
Ort: Mönchengladbach
|
Google spidert Homepage nicht komplett
Wie der Titel schon sagt, wird meine Homepage von Google nicht komplett gespidert... Zwar schaut der Googlebot regelmäßig vorbei, allerdings ist er auch genauso schnell wieder weg, ohne die Unterseiten zu spidern...
Die robots.txt sieht folgendermaßen aus:
Code:
User-agent: *
Disallow: /css/
Disallow: /img/
Disallow: /inc/
Disallow: /js/
Disallow: /new/
Disallow: /tipprunde/
Disallow: /tmpl/
Disallow: /lauth/
An sich denke ich, dass meine Seite eigentlich relativ SuMa-freundlich ist...
Was mir aufgefallen ist ist, dass Links auf die HP verweisen von anderen Seiten, die mir nicht bekannt sind (z.b. http://cyblog.de/item/50177, http://216.239.59.104/search).
Könnte sich der Sache mal jemand befassen? Das wäre klasse 
__________________
GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
|
|
|
27.07.2005, 17:35
|
#2
|
|
TP-Greis
Registriert seit: Mar 2001
Ort: Berlin, Germany
|
Tja, Google ignoriert gern Seiten, deren URL so aussieht: ?PHPSESSID=d102138afa4ca1feca5aa89abb59f21a 
__________________
“My software never has bugs. It just develops random features ...”
» DevShack - die Website des freien Webentwicklers Boris
|
|
|
27.07.2005, 18:05
|
#3
|
|
TP-Specialist
Registriert seit: Mar 2005
Ort: Unterfranken
|
Also, die zweite URL, die mit der IP-Adresse, ist Google. Frag mich nicht, was die andere Seite ist -- anscheinend postet da einer irgendwelche Suchmaschinenergebnisse. Du bist unter "Saufspiele" zu finden.
Hast du übrigens ein Problem damit, wenn andere Leute Links von ihrer Website auf deine setzen? Wenn ja, sollst du deine Website schleunigst verschwinden lassen. Aber du kannst ja selber den verweisenden Links folgen, um zu gucken, wie die Leute dich finden...
|
|
|
28.07.2005, 13:16
|
#4
|
|
TP-Insider
Registriert seit: Jul 2004
Ort: Mönchengladbach
|
Zitat:
|
Zitat von Boris
Tja, Google ignoriert gern Seiten, deren URL so aussieht: ?PHPSESSID=d102138afa4ca1feca5aa89abb59f21a 
|
Hm... Wo kommen die Anhängsel denn her? Geht das automatisch, sobald ich eine Session starte? Die Session brauche ich nur, wenn der Besucher eingeloggt ist. In der index.php steht folgendes:
PHP-Code:
session_start();
if(!$_SESSION["user_id"]) { session_destroy(); }
Also ich starte die Session, wenn jedoch keine User-ID gesetzt ist, soll sie wieder destroyed werden, dann brauchts auch nicht die Google-störenden Anhengsel... (so hab ich mir das jedenfalls vorgestellt...)
Zitat:
|
Zitat von rewboss
Hast du übrigens ein Problem damit, wenn andere Leute Links von ihrer Website auf deine setzen? Wenn ja, sollst du deine Website schleunigst verschwinden lassen.
|
Gute Idee... 
Natürlich habe ich kein Problem mit Links auf meine Seite... Im Gegenteil. Jedoch war mir die verlinkende Seite etwas schleierhaft.
__________________
GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
|
|
|
28.07.2005, 13:33
|
#5
|
|
TP-Greis
Registriert seit: Mar 2001
Ort: Berlin, Germany
|
Zitat:
|
Hm... Wo kommen die Anhängsel denn her? Geht das automatisch, sobald ich eine Session starte?
|
In dem Moment, wo Du session_start() benutzt, wird die Session entweder in einem Cookie angelegt oder halt über die URL übertragen. Und da Google eher keine Cookies anlegen lässt, erhält er Deine URLs mit der SESSIONID ... und ignoriert daher alle Unterseiten. 
__________________
“My software never has bugs. It just develops random features ...”
» DevShack - die Website des freien Webentwicklers Boris
|
|
|
28.07.2005, 13:39
|
#6
|
|
TP-Insider
Registriert seit: Jul 2004
Ort: Mönchengladbach
|
Also nutzt das session_destroy(); auch nichts...
Wie könnte ich denn alternativ auf einen Login überprüfen, ohne Session? Da will mir im Moment nichts einfallen... 
__________________
GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
|
|
|
28.07.2005, 13:43
|
#7
|
|
TP-Greis
Registriert seit: Mar 2001
Ort: Berlin, Germany
|
Du kannst versuchen, via htaccess es zu unterbinden, dass Sessions in der URL abgelegt werden. So kriegt Google normale Links (Google braucht sich ja nicht einzuloggen).
Allerdings sperrst Du so auch normale User aus, die es nicht erlauben, dass man Cookies bei ihnen anlegt. Aber a) kannst Du das einfach voraussetzen und b) ist das so sicherer, wenn Sessions nicht in der URL übertragen werden.
Schreib das in die .htaccess:
Code:
php_flag session.use_trans_sid 0
php_flag session.use_only_cookies 1
__________________
“My software never has bugs. It just develops random features ...”
» DevShack - die Website des freien Webentwicklers Boris
|
|
|
28.07.2005, 13:47
|
#8
|
|
TP-Insider
Registriert seit: Jul 2004
Ort: Mönchengladbach
|
Zitat:
|
Zitat von Boris
Allerdings sperrst Du so auch normale User aus, die es nicht erlauben, dass man Cookies bei ihnen anlegt.
|
Das setze ich so oder so vorraus
Zitat:
|
Zitat von Boris
Schreib das in die .htaccess:
Code:
php_flag session.use_trans_sid 0
php_flag session.use_only_cookies 1
|
Das wäre genial, nur leider gibt's dann nen 500er... 
__________________
GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
|
|
|
28.07.2005, 13:58
|
#9
|
|
TP-Greis
Registriert seit: Mar 2001
Ort: Berlin, Germany
|
Tja, dann geht es leider nicht bei Dir (Dein Hoster erlaubt das nicht). Hm ... wär ein Fall für unsere Traum_Dynamiker! 
__________________
“My software never has bugs. It just develops random features ...”
» DevShack - die Website des freien Webentwicklers Boris
|
|
|
04.08.2005, 08:17
|
#10
|
|
TP-Insider
Registriert seit: Jul 2004
Ort: Mönchengladbach
|
es ist zum verzweifeln... mittlerweile sind die links alle okay, jedoch spidert google nach wie vor nur den index... es stehen doch alle links ganz sauber in einer liste...  woran könnte es noch liegen, dass die links nicht beachtet werden? 
__________________
GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
|
|
|
04.08.2005, 08:37
|
#11
|
|
TP-Insider
Registriert seit: Jul 2004
|
Vielleicht daran:
<meta name="robots" content="noarchive">
Soweit ich hörte, werden dann zwar vom Googlebot die Unterseiten indiziert, aber bei der einfachen Suche in Google nicht angezeigt.
Ohne Gewähr!
lg
wys
|
|
|
04.08.2005, 10:36
|
#12
|
|
TP-Greis
Registriert seit: Mar 2001
Ort: Berlin, Germany
|
Stimmt - mach das raus. Beachte auch, dass Google nicht jeden Tag vorbei kommt (auch nicht jede Woche), das kann bissel dauern.
__________________
“My software never has bugs. It just develops random features ...”
» DevShack - die Website des freien Webentwicklers Boris
|
|
|
05.08.2005, 16:55
|
#13
|
|
TP-Insider
Registriert seit: Jul 2004
Ort: Mönchengladbach
|
Zitat:
|
Zitat von wys
Vielleicht daran:
<meta name="robots" content="noarchive">
|
das hab ich erst nachher reingemacht, wollte versuchen, das google die alten urls der domain löscht und neu spidert...
Zitat:
|
Zitat von Boris
Beachte auch, dass Google nicht jeden Tag vorbei kommt (auch nicht jede Woche), das kann bissel dauern.
|
ich seh ja in meinen statistiken, dass der GoogleBot jeden zweiten tag mal reinschaut... naja ich wart erst mal ab, wenn sich nichts tut (wovon ich ausgehe), poste ich nochmal... wer in der zwischenzeit noch ideen hat, woran es liegen könnte... nur her damit! 
__________________
GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?
|
|
|
|
Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
|
|
|
| Themen-Optionen |
Thema durchsuchen |
|
|
|
| Thema bewerten |
|
|
Forumregeln
|
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.
HTML-Code ist aus.
|
|
|
Alle Zeitangaben in WEZ +2. Es ist jetzt 14:50 Uhr.
|
 |