 |
| Hinweise |
Willkommen im TP-Hilfe-Forum!Dies ist ein Forum zu den Themen Photoshop, Dreamweaver, Flash, Selbständigkeit und mehr, in dem Du Hilfe, Anleitung oder eine Lösung zu Deinen Problemen erhältst. Aktuell bist Du in unseren Foren als Gast mit reinen Leserechten unterwegs. Wenn Du Dich registrierst, kannst Du eigene Themen verfassen, deine Frage stellen und privat mit anderen TPlern kommunizieren. Weitere Foren werden zugänglich, und Du wirst – falls gewünscht – per Mail über neue Beiträge informiert. Die Registrierung ist schnell und kostenlos. Sollten bei der Registrierung Fragen auftauchen, reicht ein Klick in unsere Hilfe - Häufig gestellte Fragen oder eine kurze Mitteilung an das Support-Team. Viel Spaß bei Traum-Projekt.com |
26.05.2004, 08:12
|
#1
|
|
TP-Specialist
Registriert seit: Aug 2002
Ort: Nähe Wien
|
regexp: html 4 -> xhtml 1.0
morgen
ich suche und suche und suche ... und finde nicht!
kennt jemand von euch ein fertiges script, dass die tags aus html 4 per regexp zu xhtml 1.0 transportieren kann?
also <br> zu <br /> usw. wär ja noch in meinem können gelegen, aber die img-tags, input-tags usw. nicht mehr ganz...
es geht dabei und große codeblöcke in einem tabellenfeld, da mir das cms leider (noch dazu schlechten, d.h. auch großgeschriebenen) html 4 code ausgibt - und dafür brauch ich eine tägliche routine, die mir das bereinigt (da täglich änderungen passieren).
danke 
|
|
|
26.05.2004, 11:51
|
#2
|
|
TP-Veteran
Registriert seit: Dec 2002
Ort: london
|
1. Warum veränderst du nicht einfach die Codesnippets im CMS?
2. Warum machst du das Dokument nicht einfach als HTML4.0? Das verbietet ja niemand...
3. Willst du es als Programm oder quasi als outputfilter in php?
|
|
|
26.05.2004, 11:54
|
#3
|
|
TP-Specialist
Registriert seit: Aug 2002
Ort: Nähe Wien
|
hi
ad 1: geht nicht. das ist ein sog. spaw-editor, der nach browsereigenheiten den code einfügt - sehr seltsame sache
ad 2: spinnst du?  kennst mich nicht? harhar
ad 3: ich lass das script periodisch (z.b. 1x am tag, erster zugriff nach 0 uhr) drüberlaufen, damit es eventuelle änderungen des letzten tages bereinigt. kann auch möglich sein, dass ich es stündlich laufen lass, das hängt von der scriptdauer in den tabellen ab
|
|
|
26.05.2004, 12:15
|
#4
|
|
TP-Senior
Registriert seit: Nov 2003
|
Zitat:
|
Zitat von prefix
ad 2: spinnst du?  kennst mich nicht? harhar
|
Darauf hab ich gewartet...
Schade, htmlarea kann das auch nicht...:
"The HTML output by htmlArea is generated by the built in functionality of Internet Explorer. For that reason, there is no easy way to have it output XHTML. If we were going to do it, the way to do so would be to parse the HTML after it's output by IE and convert it to XHTML. That's something we hope to do at some point."
@prefix
Kennste HTML Tidy?
Vielleicht kannste hiermit was anfangen.
Geändert von Jehu (26.05.2004 um 12:18 Uhr).
|
|
|
26.05.2004, 12:21
|
#5
|
|
TP-Specialist
Registriert seit: Aug 2002
Ort: Nähe Wien
|
hehe, kenn ich natürlich
naja, es ist in diesem cms einfach so, dass die module den ganzen code für jede seite in eine tabelle schreiben (ein feld!).
und genau dort setz ich an.
ich kenn ja meine pappenheimer, wie z.b. den <BR> (ja, wirklich groß vom cms :hammer), den html-4-img-tag usw. - ich bastel mir die function gleich selber, hab den ganzen vormittag gegoogelt und leider keine fertige gefunden -halt so wild
danke dir 
|
|
|
26.05.2004, 12:22
|
#6
|
|
TP-Specialist
Registriert seit: Feb 2002
Ort: Wien
|
Hallo Prefix
Also mit cronjobs o. Ä. würde ich da nicht herumfummeln, wohl eher das CMS wechseln, wenn es diese Anpassung der Ausgabe nicht unterstützt  .
Du hast im Grunde mehrere Möglichkeiten, XHTML-konform auszugeben:
1. Rich Text Editor (RTE), oder wie er bei dir auch immer heißt, abschalten und den User nur Text eigeben lassen. -> wird sich in der Praxis nicht als zielführend erweisen, wenn der Benutzer HTML-Tags eingeben muss
2. Den RTE anpassen, damit er genau das tut, was du willst. Das geht allerdings nicht mit jedem CMS. Das einzige OS-CMS, das ich kenne, das wirklich sauberen Code generieren kann und bei dem der RTE vollständig anpassbar ist: Typo3. Mit den meisten anderen wirst du Probleme haben, sauberen Code zu produzieren. Typo3 kann XHTML transitional standardmäßig ausgeben, für strict muss man wohl einiges anpassen.
Also wenns wirklich sauber sein soll, würde ich ein anderes CMS nehmen, falls der Editor bei dir nicht anpassbar ist. Alles andere ist Pfusch
Gruß,
Jürgen
|
|
|
26.05.2004, 12:36
|
#7
|
|
TP-Senior
Registriert seit: Nov 2003
|
Zitat:
|
Zitat von Jürgen
Alles andere ist Pfusch 
|
Stimmt schon, aber doch ne schöne Aufgabe...
Ich stell mir das so vor:
Das Script guggt, welche Artikel seit dem letzten Durchlauf neu sind,
nimmt den (unsauberen) HTML-Code aus der DB
übergibt das ganze an htmltidy
übernimmt die Rückgabe von htmltidy und schreibt sie in die DB.
... mal so ganz grob ...
könnte aber vom Aufwand her wohl ähnlich sein, wie die RegExp-Lösung...
Du könntest doch auch die RegExp-Lösung transparent einbauen, damit der unsaubere Code immer onTheFly in sauberen umgewandelt wird, sobald die Seite aufgerufen wird. Ok, ok... Performance. Aber: Gibts denn keine Probleme, wenn du mit dem CMS die "sauberen" Daten zum editieren aufrufst und dann wieder "unsauberes" HTML drübergenudelt wird?
|
|
|
26.05.2004, 13:30
|
#8
|
|
TP-Specialist
Registriert seit: Feb 2002
Ort: Wien
|
Zitat:
|
Zitat von Jehu
Stimmt schon, aber doch ne schöne Aufgabe... 
|
Naja, wenn man sonst nichts zu tun hat  . Ganz generell würde ich eher eine Software einsetzen, die bereits XHTML-konform ausgeben kann, als nachträglich Dinge zu ändern, die hardcoded im CMS implementiert sind. Das Problem ist ja nicht nur die Ausgabe der Tags an sich, sondern das gesamte Contentrendering, das bei den meisten CMS sehr zu wünschen übrig lässt. Ich nehme an, dass bei Contenido (ist es wohl?) sogar mit font-Tags und Blindgifs u. ä. gerendert wird und nicht mit CSS!
Zitat:
|
Du könntest doch auch die RegExp-Lösung transparent einbauen, damit der unsaubere Code immer onTheFly in sauberen umgewandelt wird, sobald die Seite aufgerufen wird.
|
Wird wohl auch nicht so einfach sein, wenn das CMS über einen Seitencache verfügt, dann muss man auch darauf Rücksicht nehmen.
Zitat:
|
Aber: Gibts denn keine Probleme, wenn du mit dem CMS die "sauberen" Daten zum editieren aufrufst und dann wieder "unsauberes" HTML drübergenudelt wird?
|
Nein, das CMS parsed den Code, der aus dem Rich Text editor kommt, jedesmal neu und tauscht die unsauberen Tags aus bzw. lässt sie bei der Bearbeitung gar nicht zu. Man kann dadurch auch ungeniert Word-HTML in das Feld einfügen und es kommt ein astreiner Code in die Datenbank 
Ich würde eben wie gesagt bei der Quelle des Übels ansetzen und nicht am Ende.
Geändert von Jürgen (26.05.2004 um 13:33 Uhr).
|
|
|
26.05.2004, 13:50
|
#9
|
|
TP-Senior
Registriert seit: Nov 2003
|
Hasse rächd! 
|
|
|
26.05.2004, 14:48
|
#10
|
|
TP-Specialist
Registriert seit: Aug 2002
Ort: Nähe Wien
|
hm, also typo 3 wäre denk ich für die seiten, die ich derzeit erarbeite, kaum sinnvoll, da der einarbeitungszeitraum doch zu groß wäre. es handelt sich um gemeinden / klein- und mittelunternehmen, für welche contenido an sich eigentlich maßgeschneidert ist (auch von der redaktion her). hab ja einige cms durchgetestet, und contenido ist meiner ansicht nach doch eine gute lösung. ev. auch www.der-dirigent.at, das mit contenido eng in zusammenhang steht.
naja, da ich in den nächsten monaten einiges zu realisieren habe und nicht die zeit dazu aufbringen kann, jetzt weiter nach dem idealen cms zu suchen, werde ich denke ich für die jetzt anstehenden arbeiten mal contenido anzupassen versuchen - auch wenn es keine ideale lösung ist 
|
|
|
26.05.2004, 14:52
|
#11
|
|
TP-Senior
Registriert seit: Nov 2003
|
und lässt du uns teilhaben, an deiner Pionierarbeit? *hechel*
|
|
|
26.05.2004, 14:55
|
#12
|
|
TP-Specialist
Registriert seit: Aug 2002
Ort: Nähe Wien
|
na sicher doch, das wird ja wohl machbar sein 
|
|
|
26.05.2004, 15:10
|
#13
|
|
TP-Specialist
Registriert seit: Feb 2002
Ort: Wien
|
Zitat:
|
Zitat von prefix
hm, also typo 3 wäre denk ich für die seiten, die ich derzeit erarbeite, kaum sinnvoll, da der einarbeitungszeitraum doch zu groß wäre. es handelt sich um gemeinden / klein- und mittelunternehmen, für welche contenido an sich eigentlich maßgeschneidert ist (auch von der redaktion her). hab ja einige cms durchgetestet, und contenido ist meiner ansicht nach doch eine gute lösung. ev. auch www.der-dirigent.at, das mit contenido eng in zusammenhang steht.
|
Sicher ist der Einarbeitungszeitraum bei Typo3 um vieles höher. Aber gerade für Gemeinden und Mittelunternehmen ist das Ding wirklich ideal. Für eine Mini-Präsenz mit 5 Seiten absolut oversized, klar. Aber Gemeinden sind ja wohl eh meistens stark im Netz vertreten.
Und mit der Anpassung wirst du denke ich wirklich deine liebe Not haben. Contenido und auch Dedi lassen meines Wissens eine Konfiguration des HTML-Editors nicht zu. Und wenn du barrierefrei ausgeben willst, kriegst du spätestens mit dem Contentrendering Probleme. Und was machst du, wenn der Redakteur aus Word copy + paste macht und das im HTML-Editor vom CMS einfügt? Die ganzen Tags mit einer Routine ausfiltern und den Code säubern? Da hast du wohl länger damit zu tun  Da würde ich dann eher zu Contribute wechseln, wenn dir Typo3 zu aufwändig ist. Zwar kein richtiges CMS, aber wenn es die Anforderungen zulassen, der sauberste Code, den es gibt 
|
|
|
26.05.2004, 15:25
|
#14
|
|
TP-Specialist
Registriert seit: Aug 2002
Ort: Nähe Wien
|
hm, also in contenido gibt es die tabelle con_code, die bei der ausgabe gezogen wird. dort drin steht der gesamte quelltext, der zu säubern ist.
natürlich wäre es aus performance-gründen mehr als unklug, das immer dann zu säubern, wenn es ausgegeben wird - logo. aber durch eine routine, welche z.b. alle 3 stunden drüberläuft, zuerst jenen satz säubert, der angefragt wird (und danach automatisch die anderen), könnte das ein ansatz sein.
an sich steht die validität im vordergrund - ordentliche barrierefreiheit lässt sich imho mit contenido in version 4.4.x sowieso kaum bis gar nicht verwirklichen, wenn dem backend-benutzer erlaubt ist, formulare usw. zu gestalten.
ist dem aber nicht der fall; d.h. der backend-user darf nur inhalte ändern; sieht die sache schon wieder anders aus und zumindest wai a(ev. sogar aa) ist durchaus drin (da man ja formulare usw. vorgibt und diese nicht änderbar sind).
die module in contenido sind recht leicht anpassbar, sodass auch hier keine probleme gegeben sind - es sind halt nur die verdammten spaw-tags, und dort in erster linie die großgeschriebenen html-4-tags sowie input, img usw. - aber auch die schlecht produzierten table-argumente (die werden das hauptproblem sein).
es muss hier eine sinnvolle lösung geben, und ich werde sie finden
ich halte euch auf dem laufenden, auch wenn es wider erwarten nicht klappen sollte :ba
|
|
|
26.05.2004, 15:53
|
#15
|
|
TP-Specialist
Registriert seit: Feb 2002
Ort: Wien
|
Das Problem hats ja in Typo3 auch bis vor kurzem gegeben und es war eine mörderische Arbeit, den Code sauberzubekommen. Da haben sich schon einige die Zähne dran ausgebissen  . Seit 3.6 ist das zum Glück anders.
Du musst ja alle Eventualitäten, die der Benutzer "verbrochen" haben könnte, in die Säuberung mit einbeziehen, wenn du dem Spaw-Editor freien Lauf lässt bzw. lassen musst. Wie gesagt - z. B. Text aus Word  . Und das sind auch nur Inhaltsänderungen und nicht mehr. Und dass du damit wai a oder aa herausbringst, halte ich für ein Gerücht  . Da muss man schon schwereres Geschütz als Contenido auffahren, wenn du mich fragst - oder man hat einen Haufen Arbeit...
Ich hab mich in der letzten Zeit mit dem Problem der standardkonformen Ausgabe beschäftigt - nur eben in Typo3 und nicht in Contenido  Bin mal gespannt, wie das weitergeht.
Geändert von Jürgen (26.05.2004 um 15:56 Uhr).
|
|
|
|
Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
|
|
|
| Themen-Optionen |
Thema durchsuchen |
|
|
|
| Thema bewerten |
|
|
Forumregeln
|
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.
HTML-Code ist aus.
|
|
|
Alle Zeitangaben in WEZ +2. Es ist jetzt 06:38 Uhr.
|
 |