+ Antworten
Ergebnis 1 bis 7 von 7

Thema: indexed search pdf downloads nicht durchsucht

  1. #1
    TP-Insider P4r4 macht sich hier sehr viel Mühe Avatar von P4r4
    Registriert seit
    Feb 2002
    Beiträge
    550

    indexed search pdf downloads nicht durchsucht

    Heyjo!

    Ich habe bei mir indexed search und crawler installiert ...
    Funktioniert auch alles wunderbar! Selbst Inhalte von verlinkten pdf-Files werden angezeigt und lassen sich durchsuchen.
    Diese files werden jedoch nur dem index hinzugefügt, wenn sie "normal" verlinkt sind!
    Ich habe auf meiner Seite einen kleinen Downloadbereich mit Skripten und Vorlesungsfolien im pdf-Format. Nun ist es so, dass die Inhalte der über das content element "Filelinks" verlinkten Datein nicht indexiert werden.

    Woran kann das liegen?
    Kann ich da irgendetwas machen, damit auch die Inhalte dieser Datein (pdf und zip) über die Suche zugänglich sind?

    Vielen Dank!

  2. #2
    TP-Special Mod steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User Avatar von steffenk
    Registriert seit
    Feb 2005
    Ort
    Haan / NRW
    Beiträge
    12.869
    schau mal auf die Einstellungen im Extension Manager - das setzt gewisse Programme vorraus


    TYPO3 · MySQLDumper · dislabs
    ·
    manche Mühlen mahlen schneller ...
    "Ich habe Rücken"
    Horst Schlämmer


  3. #3
    TP-Insider P4r4 macht sich hier sehr viel Mühe Avatar von P4r4
    Registriert seit
    Feb 2002
    Beiträge
    550
    Hatte ich mir schon gedacht, dass man das falsch verstehen könnte

    Ich meinte nicht, dass überhaupt keine pdfs oder zips gelesen werden, sondern, dass sie nicht gelesen werden wenn sie über das content element filelinks eingefüht werden.

    Erstelle ich ein content element vom typ text und verlinke eine pdf oder zip datei, dann stehen die inhalte dieser datein über die suche zur verfügung!

    Die Programme pdftotext, pdfinfo und unzip laufen auf dem server und sind richtig konfiguriert...

    es geht ledigich darum, dass die indexierung bei filelinks über gleichnamiges content element nicht funktioniert ;-)

    Danke :-)

  4. #4
    TP-Special Mod steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User steffenk lebt für das TP und seine User Avatar von steffenk
    Registriert seit
    Feb 2005
    Ort
    Haan / NRW
    Beiträge
    12.869
    Hier der passus aus der doc:

    External media (pdf, doc, html, txt) is tricky. External media is always detected as links to local files in the content of a TYPO3 page which is being indexed. But external media can the linked to from more than one page. So the index_section table may hold many entries for a single external phash-record, one for each position it's found. Also it's important to notice that external media is only indexed or updated if a “parent” TYPO3 page is re-indexed. Only then will the links to the external files be found. In a searching operation external media will be listed only once (grouping by phash), but say two TYPO3 pages are linking to the document, then only one of them will be shown as the path where the link can be found. However if both TYPO3 pages are not available, then the document will not be shown.


    TYPO3 · MySQLDumper · dislabs
    ·
    manche Mühlen mahlen schneller ...
    "Ich habe Rücken"
    Horst Schlämmer


  5. #5
    TP-Insider P4r4 macht sich hier sehr viel Mühe Avatar von P4r4
    Registriert seit
    Feb 2002
    Beiträge
    550
    hm...
    ok danke
    war bestimmt gut gemeint, aber kann ich irgendwie nix mit anfangen ...

    es sind ja nicht einmal externe files ... sondern sie liegen im dateisystem...
    die datein sind auch nur auf einer seite verlinkt ... also nur ein link auf der kompletten seite, der auf eine datei verweist...

    ... mittlerweile hat crawler ein paar von den pdf files geindexed ... aber auch nur die von einer bestimmten gruppe ... also konkret von dem einen prof, dess vorlesungsfolien es sind... (und an anderer stelle noch ein paar pdf-files, die ich selbst erstellt habe)
    ... gibt es vll irgendeine einstellung in pdf, die es verhindert, dass diese seiten durchsucht werden?

    danke :-)

  6. #6
    TP-Newbie simon_born macht alles soweit korrekt
    Registriert seit
    Mar 2010
    Beiträge
    3
    Hallo.

    Weiß hier jemand mittlerweile Rat?

    Habe auch eine Seite, auf der ich eigene Extensions programmieren will. Manche dieser Exts haben auch (auf der Seite gespreicherte) PDFs. Wie kann man die in die indexed_search aufnehmen (das WAR doch die originale Frage,nicht ? )

    Liebe Grüße
    Simon

  7. #7
    TP-Newbie Marcus.Souza macht alles soweit korrekt
    Registriert seit
    Jan 2011
    Beiträge
    3
    Zitat Zitat von simon_born Beitrag anzeigen
    Hallo.

    Weiß hier jemand mittlerweile Rat?

    Habe auch eine Seite, auf der ich eigene Extensions programmieren will. Manche dieser Exts haben auch (auf der Seite gespreicherte) PDFs. Wie kann man die in die indexed_search aufnehmen (das WAR doch die originale Frage,nicht ? )

    Liebe Grüße
    Simon
    That s maybe the 1000 post about it. But I am having trouble to configure the index search for PDF files...
    I configured it once and indexed all PDFs in my website. But now It is not working anymore and the PDF, that are already indexed are not showing in the List. As I am not the only one working in the project.I tried to use the same configuration as befor and nothing happens. Could anyone point me please in the right direction? Thanks in advance!

    Marcus
    Geändert von Marcus.Souza (17.01.2011 um 15:42 Uhr)

+ Antworten

Ähnliche Themen

  1. Antworten: 6
    Letzter Beitrag: 15.03.2010, 09:44
  2. Indexed search durchsucht Inhalte nicht!
    Von poli-dori im Forum TYPO3
    Antworten: 4
    Letzter Beitrag: 28.03.2007, 15:23
  3. Indexed Search im Multi-Tree
    Von mat81 im Forum TYPO3
    Antworten: 7
    Letzter Beitrag: 21.12.2006, 17:44
  4. Suchfunktion, die auch die Datenbank durchsucht.
    Von blockbaster im Forum Webdesign allgemein
    Antworten: 7
    Letzter Beitrag: 17.03.2006, 19:25
  5. Suchformular welches die Web-Site durchsucht .....
    Von Müllerchen im Forum Dreamweaver & andere Webeditoren
    Antworten: 3
    Letzter Beitrag: 06.09.2003, 15:08

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

     

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51