Antwort
 
LinkBack Themen-Optionen Thema bewerten Ansicht
  #1  
Alt 30.10.06, 12:51
Forum Zuschauer
 
Registriert seit: 12.10.06
Beiträge: 9
Frage

Problem mit RealURL und Crawler


Ich habe RealURL (1.1.3) und den Site Crawler (1.1.0) installiert.
Leider generiert der Crawler die URL's immer noch im Standard Typo3-Format (.../index.php?id=x), was dann natürlich zu einem "page not found" (404) führt.

Weiss jemand, wie man das richtigstellt?

Danke und Grüsse
wanderer
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!Spurl this Post!Reddit! Diesen Post bei linksilo.de bookmarken!
Mit Zitat antworten
  #2  
Alt 30.10.06, 14:23
Forum Freak
 
Registriert seit: 27.02.05
Alter: 21
Beiträge: 527
Spyker eine Nachricht über ICQ schicken

ich weiß ja nicht ob ich richtig liege mit dem was ich jetzt erzähle, aber ich tuhe es einfach mal....

RealURL und SiteCrawler ist schnuppe.
SiteCrawler gehört zu index_search und sollte weder im Konfikt, noch ergäzent zu RealURL sein.

wenn du index.php?id=x URL´s bekommst (z.B.) aus dem normalen T3 Menü, dann stimmt was mit deiner RealURL Konfiguration nicht.

Die würde ich einmal prüfen.

Wie gesagt, das oben ist Halbwissen, weil ich noch nicht den genauen sinn im Crawler gesehen habe und ihn dementsprechend noch nicht nutze.

Beste,
Tim
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!Spurl this Post!Reddit! Diesen Post bei linksilo.de bookmarken!
Mit Zitat antworten
  #3  
Alt 30.10.06, 15:18
Forum Zuschauer
 
Registriert seit: 12.10.06
Beiträge: 9

Danke für die rasche Antwort Spyker!
Leider hilft es mir im Moment nicht weiter (Ich bin noch ein Newbie in Sachen Typo3).

Den crawler möchte ich einsetzen, damit alle Seiten indiziert werden. So wie ich die Dok des indexed_search verstanden habe muss man alle Seiten mindestens einmal abrufen, damit sie indexiert werden.
Das hat auch funktioniert, bis ich RealURL installiert habe. RealURL selbst funktioniert an sich gut, nur eben den crawler bringe ich nicht dazu die URLs im RealURL-Format zu erstellen.

Ich habe auch cwt_cacheall ausprobiert, diese Extension cacht allerdings die geschützten Seiten nicht.

Gibt es evtl. noch eine andere Extension, welche dafür sorgt dass alle Seiten indexiert werden?
Oder liege ich da sonst irgendwie falsch?

cheers, wanderer
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!Spurl this Post!Reddit! Diesen Post bei linksilo.de bookmarken!
Mit Zitat antworten
  #4  
Alt 30.10.06, 15:58
Forum Freak
 
Registriert seit: 27.02.05
Alter: 21
Beiträge: 527
Spyker eine Nachricht über ICQ schicken

Zitat:
Zitat von wanderer
Gibt es evtl. noch eine andere Extension, welche dafür sorgt dass alle Seiten indexiert werden?
Oder liege ich da sonst irgendwie falsch?
Also ich lasse meine Seite von Google indizieren Der Bot ist ja auch spätestens nach 2 Tagen wieder da und nimmt die neuen Seiten mit, bzw. Cachet alte. Ansonsten sind da auch noch die User die ja auch Ihren Beitrag dazu geben.

Beste,
Tim
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!Spurl this Post!Reddit! Diesen Post bei linksilo.de bookmarken!
Mit Zitat antworten
  #5  
Alt 30.10.06, 17:53
Forum Zuschauer
 
Registriert seit: 12.10.06
Beiträge: 9

Die Website ist noch auf dem localhost, und da lasse ich Google natürlich nicht ran. Für den Online-Betrieb wäre das schon eine Möglichkeit. Aber die geschützten Seiten darf er auch dann nicht indexieren, denn dann wären sie ja nicht mehr geschützt... ;-)

Aber ich möchte natürlich, dass den Usern stets der gesamte Index bei der Suche zur Verfügung steht, und nicht nur diejenigen Seiten die schon von jemandem besucht wurden. Es sollte doch irgenwie (mit Typo3 oder einer Ext.) möglich sein sicherzustellen, dass alle Seiten, die indexiert werden sollen auch indexiert werden. Und das auch dann wenn RealURL im Einsatz ist.

Der crawler sollte (wenn ich dessen Dok richtig verstehe) eigentlich genau dies ermöglichen, aber ich finde im Moment einfach nicht heraus, wie ich ihn dazu bringe URLs zu generieren, die dem RealURL Format entsprechen.

cheers, wanderer
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!Spurl this Post!Reddit! Diesen Post bei linksilo.de bookmarken!
Mit Zitat antworten
  #6  
Alt 02.11.06, 21:16
Forum Zuschauer
 
Registriert seit: 12.10.06
Beiträge: 9

Gelöst: Problem mit RealURL und crawler


Mittlerweile habe ich das Problem gelöst. Es war ein simpler typo im tt_news_index.baseUrl der TSConfig: Unterstrich statt Bindestrich... :sad:

Das konnte nun wirklich niemand wissen...
Trotzdem, vielen Dank Spyker!

Immerhin weiss ich nun folgendes:
  • "Alte" URLs (e.g. index.php?id=...) funktionieren auch unter RealURL
  • Der Crawler funktioniert tadellos (wenn man ihn richtig konfiguriert)
  • Nicht 16 Stunden am Tag arbeiten, sonst sieht man diese verf... Unterstriche nicht mehr

cheers, wanderer
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!Spurl this Post!Reddit! Diesen Post bei linksilo.de bookmarken!
Mit Zitat antworten
Antwort

Lesezeichen

Themen-Optionen
Ansicht Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Realurl Problem Marduk TYPO3 4.x Fragen und Probleme 5 01.04.08 23:23
RealUrl Problem ibex TYPO3 4.x Backend 8 24.09.07 13:06
Gelöst Problem mit realURL theidmann Suchmaschinenfreundliche URLs (SEO) 2 14.09.07 08:54
Problem mit RealURL mip|David Suchmaschinenfreundliche URLs (SEO) 11 13.09.07 13:47
Site Crawler Problem im Info Modul theholy13 Indexed Search 6 27.08.07 11:13


Alle Zeitangaben in WEZ +1. Es ist jetzt 05:21 Uhr.


Powered by vBulletin® Version 3.7.3 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0