+ Antworten
Ergebnis 1 bis 13 von 13

Thema: Google spidert Homepage nicht komplett

  1. #1
    TP-Insider Jupp bringt sich richtig ein Avatar von Jupp
    Registriert seit
    Jul 2004
    Ort
    Mönchengladbach
    Beiträge
    771

    Google spidert Homepage nicht komplett

    Wie der Titel schon sagt, wird meine Homepage von Google nicht komplett gespidert... Zwar schaut der Googlebot regelmäßig vorbei, allerdings ist er auch genauso schnell wieder weg, ohne die Unterseiten zu spidern...

    Die robots.txt sieht folgendermaßen aus:
    Code:
    User-agent: *
    Disallow: /css/
    Disallow: /img/
    Disallow: /inc/
    Disallow: /js/
    Disallow: /new/
    Disallow: /tipprunde/
    Disallow: /tmpl/
    Disallow: /lauth/
    An sich denke ich, dass meine Seite eigentlich relativ SuMa-freundlich ist...

    Was mir aufgefallen ist ist, dass Links auf die HP verweisen von anderen Seiten, die mir nicht bekannt sind (z.b. http://cyblog.de/item/50177, http://216.239.59.104/search).

    Könnte sich der Sache mal jemand befassen? Das wäre klasse

    bemsen.de


    GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?


  2. #2
    TP-Greis Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Avatar von Boris
    Registriert seit
    Mar 2001
    Ort
    Stuttgart & Kornwestheim
    Beiträge
    9.420
    Tja, Google ignoriert gern Seiten, deren URL so aussieht: ?PHPSESSID=d102138afa4ca1feca5aa89abb59f21a
    My software never has bugs. It just develops random features ...

    » DevShack - die Website des freien Webentwicklers Boris

  3. #3
    TP-Specialist rewboss ist ein richtiges Arbeitstier - DANKE rewboss ist ein richtiges Arbeitstier - DANKE rewboss ist ein richtiges Arbeitstier - DANKE rewboss ist ein richtiges Arbeitstier - DANKE rewboss ist ein richtiges Arbeitstier - DANKE rewboss ist ein richtiges Arbeitstier - DANKE Avatar von rewboss
    Registriert seit
    Mar 2005
    Ort
    Unterfranken
    Beiträge
    2.639
    Zitat Zitat von Jupp
    Was mir aufgefallen ist ist, dass Links auf die HP verweisen von anderen Seiten, die mir nicht bekannt sind (z.b. http://cyblog.de/item/50177, http://216.239.59.104/search).
    Also, die zweite URL, die mit der IP-Adresse, ist Google. Frag mich nicht, was die andere Seite ist -- anscheinend postet da einer irgendwelche Suchmaschinenergebnisse. Du bist unter "Saufspiele" zu finden.

    Hast du übrigens ein Problem damit, wenn andere Leute Links von ihrer Website auf deine setzen? Wenn ja, sollst du deine Website schleunigst verschwinden lassen. Aber du kannst ja selber den verweisenden Links folgen, um zu gucken, wie die Leute dich finden...

  4. #4
    TP-Insider Jupp bringt sich richtig ein Avatar von Jupp
    Registriert seit
    Jul 2004
    Ort
    Mönchengladbach
    Beiträge
    771
    Zitat Zitat von Boris
    Tja, Google ignoriert gern Seiten, deren URL so aussieht: ?PHPSESSID=d102138afa4ca1feca5aa89abb59f21a
    Hm... Wo kommen die Anhängsel denn her? Geht das automatisch, sobald ich eine Session starte? Die Session brauche ich nur, wenn der Besucher eingeloggt ist. In der index.php steht folgendes:
    PHP-Code:
    session_start();

    if(!
    $_SESSION["user_id"]) {
        
    session_destroy();

    Also ich starte die Session, wenn jedoch keine User-ID gesetzt ist, soll sie wieder destroyed werden, dann brauchts auch nicht die Google-störenden Anhengsel... (so hab ich mir das jedenfalls vorgestellt...)

    Zitat Zitat von rewboss
    Hast du übrigens ein Problem damit, wenn andere Leute Links von ihrer Website auf deine setzen? Wenn ja, sollst du deine Website schleunigst verschwinden lassen.
    Gute Idee...
    Natürlich habe ich kein Problem mit Links auf meine Seite... Im Gegenteil. Jedoch war mir die verlinkende Seite etwas schleierhaft.

    bemsen.de


    GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?


  5. #5
    TP-Greis Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Avatar von Boris
    Registriert seit
    Mar 2001
    Ort
    Stuttgart & Kornwestheim
    Beiträge
    9.420
    Hm... Wo kommen die Anhängsel denn her? Geht das automatisch, sobald ich eine Session starte?
    In dem Moment, wo Du session_start() benutzt, wird die Session entweder in einem Cookie angelegt oder halt über die URL übertragen. Und da Google eher keine Cookies anlegen lässt, erhält er Deine URLs mit der SESSIONID ... und ignoriert daher alle Unterseiten.
    My software never has bugs. It just develops random features ...

    » DevShack - die Website des freien Webentwicklers Boris

  6. #6
    TP-Insider Jupp bringt sich richtig ein Avatar von Jupp
    Registriert seit
    Jul 2004
    Ort
    Mönchengladbach
    Beiträge
    771
    Also nutzt das session_destroy(); auch nichts...

    Wie könnte ich denn alternativ auf einen Login überprüfen, ohne Session? Da will mir im Moment nichts einfallen...

    bemsen.de


    GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?


  7. #7
    TP-Greis Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Avatar von Boris
    Registriert seit
    Mar 2001
    Ort
    Stuttgart & Kornwestheim
    Beiträge
    9.420
    Du kannst versuchen, via htaccess es zu unterbinden, dass Sessions in der URL abgelegt werden. So kriegt Google normale Links (Google braucht sich ja nicht einzuloggen).

    Allerdings sperrst Du so auch normale User aus, die es nicht erlauben, dass man Cookies bei ihnen anlegt. Aber a) kannst Du das einfach voraussetzen und b) ist das so sicherer, wenn Sessions nicht in der URL übertragen werden.

    Schreib das in die .htaccess:
    Code:
    php_flag session.use_trans_sid 0 
    php_flag session.use_only_cookies 1
    My software never has bugs. It just develops random features ...

    » DevShack - die Website des freien Webentwicklers Boris

  8. #8
    TP-Insider Jupp bringt sich richtig ein Avatar von Jupp
    Registriert seit
    Jul 2004
    Ort
    Mönchengladbach
    Beiträge
    771
    Zitat Zitat von Boris
    Allerdings sperrst Du so auch normale User aus, die es nicht erlauben, dass man Cookies bei ihnen anlegt.
    Das setze ich so oder so vorraus
    Zitat Zitat von Boris
    Schreib das in die .htaccess:
    Code:
    php_flag session.use_trans_sid 0 
    php_flag session.use_only_cookies 1
    Das wäre genial, nur leider gibt's dann nen 500er...

    bemsen.de


    GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?


  9. #9
    TP-Greis Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Avatar von Boris
    Registriert seit
    Mar 2001
    Ort
    Stuttgart & Kornwestheim
    Beiträge
    9.420
    Tja, dann geht es leider nicht bei Dir (Dein Hoster erlaubt das nicht). Hm ... wär ein Fall für unsere Traum_Dynamiker!
    My software never has bugs. It just develops random features ...

    » DevShack - die Website des freien Webentwicklers Boris

  10. #10
    TP-Insider Jupp bringt sich richtig ein Avatar von Jupp
    Registriert seit
    Jul 2004
    Ort
    Mönchengladbach
    Beiträge
    771
    es ist zum verzweifeln... mittlerweile sind die links alle okay, jedoch spidert google nach wie vor nur den index... es stehen doch alle links ganz sauber in einer liste... woran könnte es noch liegen, dass die links nicht beachtet werden?

    bemsen.de


    GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?


  11. #11
    wys
    wys ist offline
    TP-Insider wys bringt sich richtig ein wys bringt sich richtig ein
    Registriert seit
    Jul 2004
    Beiträge
    774
    Vielleicht daran:
    <meta name="robots" content="noarchive">

    Soweit ich hörte, werden dann zwar vom Googlebot die Unterseiten indiziert, aber bei der einfachen Suche in Google nicht angezeigt.

    Ohne Gewähr!

    lg
    wys

  12. #12
    TP-Greis Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Boris lebt für das TP und seine User Avatar von Boris
    Registriert seit
    Mar 2001
    Ort
    Stuttgart & Kornwestheim
    Beiträge
    9.420
    Stimmt - mach das raus. Beachte auch, dass Google nicht jeden Tag vorbei kommt (auch nicht jede Woche), das kann bissel dauern.
    My software never has bugs. It just develops random features ...

    » DevShack - die Website des freien Webentwicklers Boris

  13. #13
    TP-Insider Jupp bringt sich richtig ein Avatar von Jupp
    Registriert seit
    Jul 2004
    Ort
    Mönchengladbach
    Beiträge
    771
    Zitat Zitat von wys
    Vielleicht daran:
    <meta name="robots" content="noarchive">
    das hab ich erst nachher reingemacht, wollte versuchen, das google die alten urls der domain löscht und neu spidert...

    Zitat Zitat von Boris
    Beachte auch, dass Google nicht jeden Tag vorbei kommt (auch nicht jede Woche), das kann bissel dauern.
    ich seh ja in meinen statistiken, dass der GoogleBot jeden zweiten tag mal reinschaut... naja ich wart erst mal ab, wenn sich nichts tut (wovon ich ausgehe), poste ich nochmal... wer in der zwischenzeit noch ideen hat, woran es liegen könnte... nur her damit!

    bemsen.de


    GCM d- s: a-- C++$ UL P L+ E--- W++ N o? K- w+ !O !M !V PS+ PE Y PGP- t+ 5? X R- tv- b- DI- !D G e h! r++ z?


+ Antworten

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

     

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51