![]() |
| | LinkBack | Themen-Optionen | Thema bewerten | Ansicht |
|
#1
| |||
| |||
Hallo Alle zusammen, ich wollte Euch von einer Lösung eines o.g. Problems von dem ich vor paar Wochen geschrieben hab', berichten. Es ging dabei darum, dass weder die pdf- noch die doc- Anhänge durchsucht wurden; xls, ppt, txt und rtf dagegen schon. Ich habe mir natürlich die entsprechenden Konvertierungstools wie pdftotext als auch catdoc heruntergeladen und installiert und deren Pfade dem Typo3 mitgeteilt. Da ich diese Pakete als Quelltexte bekommen habe, musste ich sie vorerst kompilieren. Dies habe ich mit dem djgpp von Delurie getan. Leider hat es nachher nicht funktioniert und nach langem herumprobieren habe ich bemerkt, dass das pdftotext nur bis 118 Zeichen in der Kommandozeile akzeptiert. Erst ein Bekannte hat bemerkt, dass dies eine 16-bit Version war, denn nach dem Programmaufruf in der DOS- Konsole und dem Prompt-Rückkehr sind in dem aktuellen Pfad alle langen Verzeichnisnamen in die kürzeren mit ~ umgewandelt. Dies habe ich dem Programm-Author berichtet und der hat mir daraufhin geraten es mit dem cl- Kompiler, aus dem MS VisualStudio zu kompilieren. Und nachher hat's geklappt! Dann war auch Re-indexieren im Typo3 und somit die Index-Suche möglich geworden. Mit dem catdoc war die gleiche Situation. Doch hier habe ich bereits vorkompiliertes Programm gekriegt also musste ich was anders suchen. Da bin ich im Internet auf ein Paket namens Picnix gestoßen, was die meisten Kommando-Progs aus Unix/Linux (cat, chmod, wget, ls, ...) in der Win 32-bit Version enthält; sehr nützlich! Kurzerhand habe ich im Typo3 den Pfad dazu mitgeteilt und im Skript class.external_parser.php auch entsprechende Anpassungen vorgenommen- es wurde seitdem das cat benutzt.Jetzt läuft alles wie geschmiert Noch ein Tip: das Word-Dokument sollte besser als "Nur text" aber mit der Endung doc abgespeichert werden, sonst werden alle Format-Angaben mitgespeichert, wonach sowieso niemand suchen wird, außerdem nimmt das unnötig viel Platz in Anspruch. Dabei können allerdings keine Tabellen u.Ä. gespeichert werden also lieber gleich als rtf abspeichern. Zu allerletzt Noch meine System-Angaben: Win XP Pro, Typo3 3.8.1 (quickstart), Apache 2.0, PHP 4.4.1, MySQL 4.1 Dies war mein wort zum Wochenende, hoffe es hilft jemandem |
|
#2
| ||||
| ||||
| Vielen lieben Dank für deine ausführliche Beschreibung des Problems und der dazugehörigen Lösung. Toll! Ganz lieben Gruss Junior |
![]() |
| Lesezeichen |
| Themen-Optionen | |
| Ansicht | Thema bewerten |
| |
Ähnliche Themen | ||||
| Thema | Autor | Forum | Antworten | Letzter Beitrag |
| Index Search + SourceOptimization = kein CSS! | Mister Fu | Indexed Search | 0 | 25.04.08 13:56 |
| Google Index Problem | Mopps | TYPO3 4.x Fragen und Probleme | 1 | 23.06.07 08:23 |
| Index Search Suchen in PDFs und Word Datein funzen nich | alex_stocker | Indexed Search | 0 | 24.10.06 18:23 |
| Index Search nur auf einer Seite | capct | Indexed Search | 0 | 17.07.06 18:29 |
| dr_wiki: wo search und index markup einfügen | ghoti | Alle anderen Extensions | 1 | 01.07.06 17:53 |