![]() |
| | LinkBack | Themen-Optionen | Thema bewerten | Ansicht |
|
#1
| ||||
| ||||
Hallo Leute! Das Problem: ein einziges Mal hat der Crawler die Seiten indiziert, und zwar nach einem Serverneustart, aber danach konnte ich ihn nicht mehr zum Arbeiten bewegen. Hier die Details: Habe die letzten Stunden damit verbracht, sowohl das Manual als auch diverse Forenbeiträge zu studieren, werde aber nicht schlau daraus. Mein Page TSConfig der Root-Seite beinhaltet folgendes: Typoscript-Code:
Auch habe ich einen Typo3-User mit Namen "_cli_crawler" angelegt, das stimmt doch, oder? Jedenfalls erhalte ich keinerlei Fehlermeldung beim Starten des cronjobs, trotzdem wird nicht mal eine einzige Seite indiziert. Erst nach einem Serverneustart wird auch mit der Indizierung begonnen. Nach Abschluss der Indizierung (dauert ca. 5 Minuten) sind dann alle Seiten im Index. Allerdings wird, obwohl minütlich der crawler startet (steht jedenfalls unter "CLI status"), keine weitere Indizierung mehr vorgenommen, sodaß Änderungen nicht berücksichtigt werden. Im crontab steht bei mir Code: * * * * * /opt/lampp/htdocs/mysite/typo3conf/ext/crawler/cli/crawler_cli.phpsh In der /var/log/messages steht nur Code: Oct 19 11:46:01 linux /usr/sbin/cron[4877]: (root) CMD (/opt/lampp/htdocs/mysite/typo3conf/ext/crawler/cli/crawler_cli.phpsh) Oct 19 11:47:01 linux /usr/sbin/cron[4886]: (root) CMD (/opt/lampp/htdocs/mysite/typo3conf/ext/crawler/cli/crawler_cli.phpsh) Oct 19 11:48:01 linux /usr/sbin/cron[4909]: (root) CMD (/opt/lampp/htdocs/mysite/typo3conf/ext/crawler/cli/crawler_cli.phpsh) Außerdem habe ich auf der Root-Seite eine Indexierungseinstellung eingetragen, die 3 Ebenen berücksichten soll. Was fehlt denn hier bloß? Einmal hat's ja geklappt, auch wenn ich nicht weiß warum?! Und brauche ich überhaupt alle genannten Konfigurationen? Also crontab, Indexierungseinstellung und Page-TS-Config??? Oder ist da was überflüssig? Immerhin startet der crontab minütlich, die Indexierungseinstellungen stündlich. Meine Konfiguration: - Typo3 4.0.2 - Indexed Search 2.9.2 - Site Crawler 1.1.0 Viele Grüße aus Südtirol! Lemon Geändert von lemon (25.10.06 um 16:27 Uhr). |
|
#2
| |||
| |||
| Keiner 'ne Idee? |
|
#3
| |||
| |||
| Kommt schon, irgend jemand wird den Crawler doch benutzen, oder? |
|
#4
| |||
| |||
| Hast Du es nun geschafft? Hänge nämlich an genau dem selben Problem: Das Script wird vom Cronjob minütlich aufgerufen, aber nichts tut sich - d.h. das Last Seen im Backend verändert nicht das Datum/Zeit und es wird auch nichts gecrawlt. Habe in den Newsgroups gelesen, dass das Script wohl beim Aufrufen der init.php an der Anmeldung zur DB scheitern soll.... Gruß Jackzone |
|
#5
| ||||
| ||||
| Hast du Typoscript-Code:
Gruß Peter
__________________ An eagle soars, but a weasel never gets sucked into a jet engine! TYPO3 schreibt sich TYPO3! |
|
#6
| ||||
| ||||
| Ja, Typoscript-Code:
|
|
#7
| ||||
| ||||
| Typoscript-Code:
ist bei mir ebenfalls eingetragen. Ich habe nun versucht die crawler_cli.phpsh zu debuggen und habe nach jeder Zeile eine echo-Ausgabe vorgenommen - und genau die Zeile mit PHP-Code: Gruß, Jackzone |
|
#8
| |||
| |||
| Mal was neues: Der Rechner bei uns, auf dem es nicht läuft, ist ein vor kurzem neu aufgesetzter Ubuntu-Server (Linux mit LAMP). Habe hier aber noch einen weiteren Testserver (Windows mit XAMPP) drauf und auf dem funktioniert der Crawler mit Aufruf über Kommandozeile bestens |
|
#9
| |||
| |||
Problem gefunden: *grrrr* auf dem Ubuntu-Server waren nur php5-cgi / php-cgi installiert und nicht php5 / php selbst (halt Linux-Noob). Daher konnte wohl die crawler_cli.phpsh nicht richtig interpretiert werden Nun wird der Cronjob minütlich gestartet und auch der Status im Backend wird auf "start" gesetzt und die Seiten indexiert ![]() Gruß, Jackzone |
![]() |
| Lesezeichen |
| Themen-Optionen | |
| Ansicht | Thema bewerten |
| |
Ähnliche Themen | ||||
| Thema | Autor | Forum | Antworten | Letzter Beitrag |
| indexed_search & crawler; Probleme beim crawlen externer URL | ThH | Indexed Search | 2 | 29.07.08 06:10 |
| error site crawler | leecat | Indexed Search | 0 | 24.04.08 19:01 |
| Gelöst Site Crawler konfigurieren | Tycho | Indexed Search | 3 | 07.02.08 07:34 |
| Crawler Extension: kompletten Seitenbaum crawlen | sw-student | Indexed Search | 5 | 11.06.07 13:12 |
| Site Crawler - Error Meldung | jannsen | Indexed Search | 0 | 23.03.07 15:13 |