Eurokicker
-


Hinweise


Antwort
 
LinkBack Themen-Optionen Thema durchsuchen Thema bewerten
Alt 13.02.2003, 09:45   #1
TP-Specialist
 
Benutzerbild von Paco
 
Registriert seit: Sep 2001
Ort: Rhein-Main
Paco macht sich hier sehr viel Mühe

robots.txt erklären


habe mal hier die robots.txt von drweb gesaugt:

User-agent: *
Disallow: /images/
Disallow: /diverses/
Disallow: /search
Disallow: /styles/
Disallow: /includes/
Disallow: /muster/
Disallow: /quiz/
Disallow: /quiz2/
Disallow: /test/
Disallow: /tour/
Disallow: /Templates/
Disallow: /spielwiese/

User-agent: FDSE
Disallow: /diverses/
Disallow: /images/
Disallow: /shop/
Disallow: /includes/
Disallow: /muster/
Disallow: /quiz/
Disallow: /quiz2/
Disallow: /tour/
Disallow: /Templates/
Disallow: /spielwiese/
Disallow: /plus/

User-agent: MSIECrawler
Disallow: /

User-agent: Googlebot
Disallow: /*.gif$
Disallow: /*.jpg$


Kann mir jemand anhand dessen erklären wie das geht? Was bewirkt das Ganze - wenn mir da jemand ein paar nähere Erläuterungen zu machen könnte wäre es echt toll.
Auf drweb habe ich schon gelesen, aber nicht ganz verstanden was das ganze GENAU bedeutet.

Paco ist offline   Mit Zitat antworten


Alt 13.02.2003, 18:35   #2
TP-Junior
 
Registriert seit: Jan 2003
Ort: Oberösterreich
Wunki macht alles soweit korrekt
also ich fang mal an :

Zitat:
User-agent: *
.. bedeutet : für alle Robots, Spiders..

Zitat:
Disallow: /images/
.. diesen Ordner nicht in der Suchmaschine indizieren !

Zitat:
User-agent: FDSE
Gilt nur für FDSE - frag mich bitte nicht welcher Spider das ist

Zitat:
Disallow: /*.gif$
.. bedeutet : Ich will nicht an der Bildersuche von Google teilnehmen bzw. keine gifs spidern !

MfG
Wunki
Wunki ist offline   Mit Zitat antworten
Alt 14.02.2003, 06:57   #3
TP-Specialist
 
Benutzerbild von Paco
 
Registriert seit: Sep 2001
Ort: Rhein-Main
Paco macht sich hier sehr viel Mühe
Was tun robots und spider genau - und was ist von denen der Unterschied?

Sollte man eine robot.txt haben?????
Paco ist offline   Mit Zitat antworten
Alt 14.02.2003, 09:33   #4
TP-Supporter
 
Benutzerbild von xStream
 
Registriert seit: Dec 2002
Ort: Neumünster [Nördlich von HH]
xStream macht alles soweit korrekt
Eine robots.txt braucht man glaube ich nur noch wenn man bestimmte Verzeichnisse, Dateitypen etc. nicht von Robots durchgehen lassen will...
Ein Robot/Spider ist im Prinzip ein Script von einer Suchmaschine, dass sämtliche neuangemeldeten URLs durchsucht.
Es speichert entweder die Beschreibung aus deinen Meta- Tags und den Titel oder/und die ersten 150 Zeichen im Body- Tag.
Du kannst z.B. via Meta- Tag festlegen, ob die robots alle Links auf der Seite weiterverfolgen und ebenfalls in den Index aufnehmen sollen.
Wenn du diese Funktion aktiviert hast, aber jetzt z.B. nicht möchtest, dass Google die Seiten im Verzeichniss "ichmagkeingoogle" nicht durchsucht, kannst du das durch die robots.txt steuern...

(wie immer ohne Gewähr )
__________________
what the hell are u waiting for??
<< make some noise
xStream ist offline   Mit Zitat antworten
Alt 14.02.2003, 10:19   #5
TP-Specialist
 
Benutzerbild von Paco
 
Registriert seit: Sep 2001
Ort: Rhein-Main
Paco macht sich hier sehr viel Mühe
Danke. Das hat mir weitergeholfen.
Grüßle
Paco ist offline   Mit Zitat antworten
Alt 15.02.2003, 03:24   #6
TP-Special Mod
 
Benutzerbild von Thomas
 
Registriert seit: May 2001
Ort: Arnsberg - Sauerland
Thomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine User
man sollte (nach meinen Recherchen in den diversen "Fach-Sites") immer eine robots.txt anlegen

diese Datei "animiert" viele Suchrobots aus irgendeinem Grunde nun mal, sich die Site genauer anzuschauen.

wenn man (wie wohl oft) eine Site hat, die man wirklich komplett von allen Suchmaschinen gescannt haben möchte, legt man einfach eine völlig leere robots.txt-Datei an und läd diese in den root

macht fast keine Arbeit und schadet auf keinen Fall
Thomas ist offline   Mit Zitat antworten
Alt 15.02.2003, 10:15   #7
TP-Supporter
 
Benutzerbild von carlsson
 
Registriert seit: Feb 2001
Ort: Chiemgau
carlsson macht sich hier sehr viel Mühe
Hallo zusammen, direkt beim Onkel Doktor (dr.web) findet man auch eine gute Detailbeschreibung zur robots.txt

der Link dorthin

der carlsson
carlsson ist offline   Mit Zitat antworten
Alt 15.02.2003, 12:29   #8
TP-Specialist
 
Benutzerbild von Paco
 
Registriert seit: Sep 2001
Ort: Rhein-Main
Paco macht sich hier sehr viel Mühe
Zitat:
Original geschrieben von carlsson
Hallo zusammen, direkt beim Onkel Doktor (dr.web) findet man auch eine gute Detailbeschreibung zur robots.txt

der Link dorthin

der carlsson

Hi ich weiß - siehe thread eins - aber hier im Forum habe ich es erst so richtig verstanden.

@ thomas
yep, das habe ich auch gehört und auch deshalb gemacht thx
Paco ist offline   Mit Zitat antworten
Alt 22.04.2003, 20:21   #9
TP-Specialist
 
Registriert seit: Jul 2002
matthias hilft, wo's gehtmatthias hilft, wo's gehtmatthias hilft, wo's gehtmatthias hilft, wo's geht
hier ein robots.txt generator.. praktisch praktisch ..
matthias ist offline   Mit Zitat antworten
Antwort

  Aktuelles Thema
  TP Hilfe Forum > Traum-Talk > Webdesign & Co. > Suchmaschinen
robots.txt erklären robots.txt erklären
« Grub: Suchmaschine mit User-Unterstützung | Google kauft wichtigen Partner der Konkurrenz »

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu


Alle Zeitangaben in WEZ +2. Es ist jetzt 03:43 Uhr.

Powered by: vBulletin Version 3.7 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd. / Search Engine Friendly URLs by vBSEO 3.2.0 ©2008, Crawlability, Inc.
Traum-Projekt.com | Suchen | Archiv | Impressum | Kontakt | | | Nach oben |



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67