art-d-sign
-


Hinweise


Antwort
 
LinkBack Themen-Optionen Thema durchsuchen Thema bewerten
Alt 31.08.2004, 12:11   #1
TP-Insider
 
Benutzerbild von Parisienne
 
Registriert seit: Sep 2001
Ort: Bern, CH
Parisienne macht alles soweit korrekt
Question

robots.txt disallow, allow


Liebe TP-ler

Ich habe eine Site (einen Shop) mit mehreren Unterordner. Der Hauptordner sollte nicht durch Suchmaschinen indexiert werden, gewisse Unterordner aber schon. Also habe ich eine Robots-Datei erstellt, die so aussieht:
Code:
#SPORTS-PUBLISHING robots.txt vom 31.08.2004

User-agent: *
Disallow: /catalog/
Allow: /catalog/moveshop
Allow: /catalog/singletrailmap
Allow: /catalog/trailheidi
Allow: /catalog/tranzbag
Allow: /catalog/ssp_film
Bei einem Robots-Checker erscheint nun die Meldung Allows sei ein unbekannter Befehl. Allerdings habe ich auf verschiedenen Webseiten gelesen, dass man allow benutzen kann

Wisst ihr mehr darüber? Danke. Parisienne.

Meine Sitestruktur sieht im übrigen so aus:
Miniaturansicht angehängter Grafiken
robots-txt-disallo-allow-site_struktur.gif  

Geändert von Parisienne (31.08.2004 um 12:43 Uhr).
Parisienne ist offline   Mit Zitat antworten


Alt 31.08.2004, 12:22   #2
TP-Veteran
 
Benutzerbild von Nina
 
Registriert seit: Feb 2004
Ort: Berlin
Nina ist ein richtiges Arbeitstier - DANKENina ist ein richtiges Arbeitstier - DANKENina ist ein richtiges Arbeitstier - DANKENina ist ein richtiges Arbeitstier - DANKE
Benutzen Sie im Zweifelsfall so viel wie möglich die Angabe Disallow: und so wenig wie möglich die Angabe Allow:. Der Grund ist, dass Disallow: früher in die Spezifikation der robots.txt aufgenommen wurde und von mehr Robots verstanden wird als Allow:.
Quelle

Ein Working Draft der IETF führt neben der Disallow Anweisung auch die Allow Anweisung ein.
Da die Allow Anweisung aber erst später als der eigentliche Standard eingeführt wurde, wird sie noch nicht von allen Robots unterstützt. Von daher sollte man sich nicht darauf verlassen und lieber nur Disallow benutzen.

Quelle

Allgemein bezweifle ich ehrlich gesagt dass Robots damit zurecht kommen wenn du die 1. Struktur für sie sperrst und dann drunter liegende Folder freigiebst. Gib also lieber die drunter liegenden Ordner und Files die du nicht freigeben willst als DISALLOW an. Das ist zwar mehr Arbeit, aber dafür sicherer.
__________________
pro Barrierefreiheit | ena Webstudio - Webdesign aus Berlin / Adlershof

CSS: Bug-Lösungen für IE, Firefox und Co. | Best of CSS - Methoden die man kennen sollte

Wenn ein Mann zurückweicht, weicht er zurück. Eine Frau weicht nur zurück, um besser Anlauf nehmen zu können.
(Zsa Zsa Gabor)

Geändert von Nina (31.08.2004 um 12:26 Uhr).
Nina ist offline   Mit Zitat antworten
Alt 31.08.2004, 12:32   #3
TP-Insider
 
Benutzerbild von Parisienne
 
Registriert seit: Sep 2001
Ort: Bern, CH
Parisienne macht alles soweit korrekt
das ist doch etwas sehr umständlich. weil ich im verzeichnis das ich sperre, nicht nur ein paar unterordner sind, sondern gegen die 80 files. die müsste ich dann also alle sperren
darum bin ich auf die variante mit den allows gekommen...
Parisienne ist offline   Mit Zitat antworten
Antwort

  Aktuelles Thema
  TP Hilfe Forum > Traum-Talk > Webdesign & Co. > Suchmaschinen
robots.txt disallo, allow robots.txt disallo, allow
« Google mit Seitenvorschau-Bilder ... | Site-Suchmaschine mit Fuzzy Logic »

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Lab vielleicht per robots.txt für Suchmaschinen sperren? Thomas Suchmaschinen 6 26.01.2004 20:04
Robots.txt bewusstwerdung HTML Puristen 2 03.08.2003 11:33
robots.txt erklären Paco Suchmaschinen 8 22.04.2003 21:21
Meta Tags troz robots.txt in jeder seite? Dannys HTML Puristen 8 02.05.2002 17:16
Weiß jemand was die Datei robots.txt ist?! JanBreier Suchmaschinen 2 26.06.2001 19:40


Alle Zeitangaben in WEZ +2. Es ist jetzt 19:08 Uhr.

Powered by: vBulletin Version 3.7 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd. / Search Engine Friendly URLs by vBSEO 3.2.0 ©2008, Crawlability, Inc.
Traum-Projekt.com | Suchen | Archiv | Impressum | Kontakt | | | Nach oben |



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67