Antwort
 
LinkBack Themen-Optionen Thema bewerten Ansicht
  #1  
Alt 27.01.06, 09:24
Forum Newbie
 
Registriert seit: 14.12.05
Alter: 34
Beiträge: 47

Index-Search 2.1.3 - pdf und doc- Problem


Hallo Alle zusammen,

ich wollte Euch von einer Lösung eines o.g. Problems von dem ich vor paar Wochen geschrieben hab', berichten.
Es ging dabei darum, dass weder die pdf- noch die doc- Anhänge durchsucht wurden; xls, ppt, txt und rtf dagegen schon.
Ich habe mir natürlich die entsprechenden Konvertierungstools wie pdftotext als auch catdoc heruntergeladen und installiert und deren Pfade dem Typo3 mitgeteilt. Da ich diese Pakete als Quelltexte bekommen habe, musste ich sie vorerst kompilieren. Dies habe ich mit dem djgpp von Delurie getan. Leider hat es nachher nicht funktioniert und nach langem herumprobieren habe ich bemerkt, dass das pdftotext nur bis 118 Zeichen in der Kommandozeile akzeptiert. Erst ein Bekannte hat bemerkt, dass dies eine 16-bit Version war, denn nach dem Programmaufruf in der DOS- Konsole und dem Prompt-Rückkehr sind in dem aktuellen Pfad alle langen Verzeichnisnamen in die kürzeren mit ~ umgewandelt. Dies habe ich dem Programm-Author berichtet und der hat mir daraufhin geraten es mit dem cl- Kompiler, aus dem MS VisualStudio zu kompilieren. Und nachher hat's geklappt! Dann war auch Re-indexieren im Typo3 und somit die Index-Suche möglich geworden.
Mit dem catdoc war die gleiche Situation. Doch hier habe ich bereits vorkompiliertes Programm gekriegt also musste ich was anders suchen. Da bin ich im Internet auf ein Paket namens Picnix gestoßen, was die meisten Kommando-Progs aus Unix/Linux (cat, chmod, wget, ls, ...) in der Win 32-bit Version enthält; sehr nützlich! Kurzerhand habe ich im Typo3 den Pfad dazu mitgeteilt und im Skript class.external_parser.php auch entsprechende Anpassungen vorgenommen- es wurde seitdem das cat benutzt.
Jetzt läuft alles wie geschmiert

Noch ein Tip: das Word-Dokument sollte besser als "Nur text" aber mit der Endung doc abgespeichert werden, sonst werden alle Format-Angaben mitgespeichert, wonach sowieso niemand suchen wird, außerdem nimmt das unnötig viel Platz in Anspruch. Dabei können allerdings keine Tabellen u.Ä. gespeichert werden also lieber gleich als rtf abspeichern.

Zu allerletzt Noch meine System-Angaben:
Win XP Pro, Typo3 3.8.1 (quickstart), Apache 2.0, PHP 4.4.1, MySQL 4.1

Dies war mein wort zum Wochenende, hoffe es hilft jemandem
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!Spurl this Post!Reddit! Diesen Post bei linksilo.de bookmarken!
Mit Zitat antworten
  #2  
Alt 29.01.06, 23:29
Benutzerbild von Junior
TYPO3 Forum Team
Administrator
 
Registriert seit: 18.08.04
Ort: Zürich
Alter: 33
Beiträge: 2.814
Junior eine Nachricht über Skype™ schicken

Vielen lieben Dank für deine ausführliche Beschreibung des Problems und der dazugehörigen Lösung. Toll!

Ganz lieben Gruss

Junior
__________________
TYPO3forum.net empfiehlt Domain Factory als Hoster!


Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!Spurl this Post!Reddit! Diesen Post bei linksilo.de bookmarken!
Mit Zitat antworten
Antwort

Lesezeichen

Themen-Optionen
Ansicht Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Index Search + SourceOptimization = kein CSS! Mister Fu Indexed Search 0 25.04.08 13:56
Google Index Problem Mopps TYPO3 4.x Fragen und Probleme 1 23.06.07 08:23
Index Search Suchen in PDFs und Word Datein funzen nich alex_stocker Indexed Search 0 24.10.06 18:23
Index Search nur auf einer Seite capct Indexed Search 0 17.07.06 18:29
dr_wiki: wo search und index markup einfügen ghoti Alle anderen Extensions 1 01.07.06 17:53


Alle Zeitangaben in WEZ +1. Es ist jetzt 15:18 Uhr.


Powered by vBulletin® Version 3.7.3 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0