power-box.de
-


Hinweise


Antwort
 
LinkBack Themen-Optionen Thema durchsuchen Thema bewerten
Alt 02.04.2002, 20:11   #1
sky
TP-Member
 
Registriert seit: Mar 2002
sky macht alles soweit korrekt

Frage zu robot.txt


Hallo an alle!

ich habe da eine Frage zu der Datei robits.txt!

Könnte mir jemand mal ein Beispiel schreiben, das die Suchmaschinen nur die index.html und die von mir vorgebenen Meta Tags aufnimmt! Also keine Unterseiten und einzelne Frames!

Und wo muss ich diese Datei ablegen und muss ich die in ASCII oder BINÄR auf meinen Server übertragen!??

Kann ich eine solche Datei mit meinem Notepad machen??

thx sky
sky ist offline   Mit Zitat antworten


Alt 02.04.2002, 20:18   #2
TP-Greis
 
Benutzerbild von Lars
 
Registriert seit: Jun 2001
Ort: Bonn-Altstadt
Lars bringt sich richtig ein
Hier die Datei, die Du mit dem Notepad bearbeiten kannst:

Code:
# Beispiel fuer eine robots.txt

User-Agent: *         # gilt fuer alle Spider
Disallow: /verz1/
Disallow: /verz2/
Disallow: /verz3/     # die Liste um alle gesperrten Verzeichnisse ergaenzen
Disallow: /datei1.htm
Disallow: /datei2.htm # die Liste um alle gesperrten Dateien ergaenzen
Lade sie einfach im ASCII-Modus in das Root-Verzeichnis Deiner Website.
__________________
Give up yourself into the moment — The time is now.

Geändert von Lars (02.04.2002 um 20:49 Uhr).
Lars ist offline   Mit Zitat antworten
Alt 02.04.2002, 20:25   #3
sky
TP-Member
 
Registriert seit: Mar 2002
sky macht alles soweit korrekt
Hallo!

schon mal danke für die schnelle Antwort!

Aber was ist mein Root Verzeichniss?

Und kann ich die Datei nun so übernehmen? Oder muss ich sie nach meinen Verzeichnissen und Dateien modifizieren?

thx sky
sky ist offline   Mit Zitat antworten
Alt 02.04.2002, 20:26   #4
TP-Greis
 
Benutzerbild von Lars
 
Registriert seit: Jun 2001
Ort: Bonn-Altstadt
Lars bringt sich richtig ein
Root ist da, wo die Datei liegt, die der Server als erstes ausgibt, in der Regel die index.htm oder ähnliche.

Die Liste musst Du natürlich an Deine Struktur anpassen!
__________________
Give up yourself into the moment — The time is now.
Lars ist offline   Mit Zitat antworten
Alt 02.04.2002, 20:45   #5
TP-Special Mod
 
Benutzerbild von Thomas
 
Registriert seit: May 2001
Ort: Arnsberg - Sauerland
Thomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine User
Smile

noch zwei gute Links zum Thema:

www.drweb.de/suchmaschinen/robots.shtml

www.avantart.com/techtalk/robots.html
Thomas ist offline   Mit Zitat antworten
Alt 04.04.2002, 10:45   #6
sky
TP-Member
 
Registriert seit: Mar 2002
sky macht alles soweit korrekt
hallo schmobi and all!

Danke schonmal!!!

Nur noch eine Frage!

wenn meine ganzen HTML Seiten in Ordnern liegen und sich nur die index.htm im Stammverzeichnis als *.htm befindet, reicht es dann, wenn ich nur die Ordner sperre??

Danke sky
sky ist offline   Mit Zitat antworten
Alt 04.04.2002, 11:27   #7
TP-Greis
 
Benutzerbild von Lars
 
Registriert seit: Jun 2001
Ort: Bonn-Altstadt
Lars bringt sich richtig ein
Eine kurze und präzise Antwort: Ja.
__________________
Give up yourself into the moment — The time is now.
Lars ist offline   Mit Zitat antworten
Alt 15.04.2002, 20:26   #8
sky
TP-Member
 
Registriert seit: Mar 2002
sky macht alles soweit korrekt
Hallo an Euch!

Kann ich das oben genannte Problem auch mit den META TAGS erreichen, so wie hier z.B.

<meta name="robots" content="INDEX, NOFOLLOW">

Wird dann nur meine Index.htm eingetragen und die Links auf dieser index.htm werden nicht verfolgt und eingetragen???

Habe ich das richtig verstanden??

danke sky
sky ist offline   Mit Zitat antworten
Alt 15.04.2002, 20:34   #9
TP-Special Mod
 
Benutzerbild von Thomas
 
Registriert seit: May 2001
Ort: Arnsberg - Sauerland
Thomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine UserThomas lebt für das TP und seine User
Arrow

richtig "sicher" ist weder die <meta> noch die robots.txt - Variante
du weisst nie genau, ob der Spider alle meta's liest genauso wenig sind sie "verplichtet" die robots zu "lesen"

aber beide Möglichkeiten kombinieren, ist sicher kein Fehler, entscheidender ist m. E. der robots.txt
Thomas ist offline   Mit Zitat antworten
Alt 15.04.2002, 20:37   #10
sky
TP-Member
 
Registriert seit: Mar 2002
sky macht alles soweit korrekt
Hallo...

danke schonmal und den robots.txt kann ich einfach im Editor tippen und als robots.txt speicher und in mein Stammverzeichnis spielen???

danke sky
sky ist offline   Mit Zitat antworten
Alt 15.04.2002, 20:47   #11
TP-Greis
 
Benutzerbild von Lars
 
Registriert seit: Jun 2001
Ort: Bonn-Altstadt
Lars bringt sich richtig ein
Zitat:
Original geschrieben von schmobi
Eine kurze und präzise Antwort: Ja.
__________________
Give up yourself into the moment — The time is now.
Lars ist offline   Mit Zitat antworten
Alt 16.04.2002, 07:32   #12
sky
TP-Member
 
Registriert seit: Mar 2002
sky macht alles soweit korrekt
Hallo an Euch beide!!!

besten besten dank für Eure Hilfe!!!

gruss sky
sky ist offline   Mit Zitat antworten
Alt 16.04.2002, 08:16   #13
TP-Specialist
 
Benutzerbild von Paco
 
Registriert seit: Sep 2001
Ort: Rhein-Main
Paco macht sich hier sehr viel Mühe
Lightbulb

Und die robots.txt muss keinerlei Verknüpfung zu irgendwelchen Dateien oder sonstiges haben??? Einfach blank im root auf dem Server?
Paco ist offline   Mit Zitat antworten
Alt 16.04.2002, 08:55   #14
TP-Insider
 
Benutzerbild von #!/usr/bin/beer
 
Registriert seit: Jan 2002
Ort: Akhragan
#!/usr/bin/beer bringt sich richtig ein#!/usr/bin/beer bringt sich richtig ein
Zitat:
Original geschrieben von schmobi
Eine kurze und präzise Antwort: Ja.
__________________
میں کانچ کھا سکتا ہوں اور مجھے تکلیف نہیں ہوتی.
நான் கண்ணாடி சாப்பிடுவேன், அதனால் எனக்கு ஒரு கேடும் வராது
#!/usr/bin/beer ist offline   Mit Zitat antworten
Alt 16.04.2002, 09:14   #15
TP-Specialist
 
Benutzerbild von Paco
 
Registriert seit: Sep 2001
Ort: Rhein-Main
Paco macht sich hier sehr viel Mühe
Arrow

Ein kurzes, präzises Danke schön.

code:--------------------------------------------------------------------------------
# Beispiel fuer eine robots.txt

User-Agent: * # gilt fuer alle Spider
Disallow: /verz1/
Disallow: /verz2/
Disallow: /verz3/ # die Liste um alle gesperrten Verzeichnisse ergaenzen
Disallow: /datei1.htm
Disallow: /datei2.htm # die Liste um alle gesperrten Dateien ergaenzen

--------------------------------------------------------------------------------


Jetzt nerve ich mal weiter...
Also, auf meinem Server liegen z.B. images und Test-Ordner. und auf der Ebene wo die index.html liegt, liegen auch viele andere html-Dateien.
Wo sperre ich die Dateien, die mit der index.html auf einer Ebene liegen.Muss ich dann Disallow: mittelframe.html schreiben? Oder Disallow: /mittelframe.html
Und bei den Ordnern Disallow:/images/

Nähere Erläuterungen wären echt klasse!
Paco ist offline   Mit Zitat antworten
Antwort

  Aktuelles Thema
  TP Hilfe Forum > Web-Editoren & Coding > HTML Puristen
Frage zu robot.txt Frage zu robot.txt
« JS - Formular Problem | Formular textarea farbig »

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu


Alle Zeitangaben in WEZ +2. Es ist jetzt 10:57 Uhr.

Powered by: vBulletin Version 3.7 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd. / Search Engine Friendly URLs by vBSEO 3.2.0 ©2008, Crawlability, Inc.
Traum-Projekt.com | Suchen | Archiv | Impressum | Kontakt | | | Nach oben |



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67