schau mal auf die Einstellungen im Extension Manager - das setzt gewisse Programme vorraus
Heyjo!
Ich habe bei mir indexed search und crawler installiert ...
Funktioniert auch alles wunderbar! Selbst Inhalte von verlinkten pdf-Files werden angezeigt und lassen sich durchsuchen.
Diese files werden jedoch nur dem index hinzugefügt, wenn sie "normal" verlinkt sind!
Ich habe auf meiner Seite einen kleinen Downloadbereich mit Skripten und Vorlesungsfolien im pdf-Format. Nun ist es so, dass die Inhalte der über das content element "Filelinks" verlinkten Datein nicht indexiert werden.
Woran kann das liegen?
Kann ich da irgendetwas machen, damit auch die Inhalte dieser Datein (pdf und zip) über die Suche zugänglich sind?
Vielen Dank!
schau mal auf die Einstellungen im Extension Manager - das setzt gewisse Programme vorraus
TYPO3 · MySQLDumper · dislabs
·
manche Mühlen mahlen schneller ...
"Ich habe Rücken"
Horst Schlämmer
Hatte ich mir schon gedacht, dass man das falsch verstehen könnte
Ich meinte nicht, dass überhaupt keine pdfs oder zips gelesen werden, sondern, dass sie nicht gelesen werden wenn sie über das content element filelinks eingefüht werden.
Erstelle ich ein content element vom typ text und verlinke eine pdf oder zip datei, dann stehen die inhalte dieser datein über die suche zur verfügung!
Die Programme pdftotext, pdfinfo und unzip laufen auf dem server und sind richtig konfiguriert...
es geht ledigich darum, dass die indexierung bei filelinks über gleichnamiges content element nicht funktioniert ;-)
Danke :-)
Hier der passus aus der doc:
External media (pdf, doc, html, txt) is tricky. External media is always detected as links to local files in the content of a TYPO3 page which is being indexed. But external media can the linked to from more than one page. So the index_section table may hold many entries for a single external phash-record, one for each position it's found. Also it's important to notice that external media is only indexed or updated if a “parent” TYPO3 page is re-indexed. Only then will the links to the external files be found. In a searching operation external media will be listed only once (grouping by phash), but say two TYPO3 pages are linking to the document, then only one of them will be shown as the path where the link can be found. However if both TYPO3 pages are not available, then the document will not be shown.
TYPO3 · MySQLDumper · dislabs
·
manche Mühlen mahlen schneller ...
"Ich habe Rücken"
Horst Schlämmer
hm...
ok danke
war bestimmt gut gemeint, aber kann ich irgendwie nix mit anfangen ...
es sind ja nicht einmal externe files ... sondern sie liegen im dateisystem...
die datein sind auch nur auf einer seite verlinkt ... also nur ein link auf der kompletten seite, der auf eine datei verweist...
... mittlerweile hat crawler ein paar von den pdf files geindexed ... aber auch nur die von einer bestimmten gruppe ... also konkret von dem einen prof, dess vorlesungsfolien es sind... (und an anderer stelle noch ein paar pdf-files, die ich selbst erstellt habe)
... gibt es vll irgendeine einstellung in pdf, die es verhindert, dass diese seiten durchsucht werden?
danke :-)
Hallo.
Weiß hier jemand mittlerweile Rat?
Habe auch eine Seite, auf der ich eigene Extensions programmieren will. Manche dieser Exts haben auch (auf der Seite gespreicherte) PDFs. Wie kann man die in die indexed_search aufnehmen (das WAR doch die originale Frage,nicht ?)
Liebe Grüße
Simon
That s maybe the 1000 post about it. But I am having trouble to configure the index search for PDF files...
I configured it once and indexed all PDFs in my website. But now It is not working anymore and the PDF, that are already indexed are not showing in the List. As I am not the only one working in the project.I tried to use the same configuration as befor and nothing happens. Could anyone point me please in the right direction? Thanks in advance!
Marcus
Geändert von Marcus.Souza (17.01.2011 um 15:42 Uhr)
Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)