Die Crux mit Textpattern und WordPress

Ich hatte hier vor ein paar Jahren mehrere Beiträge aus einem Blog importiert. Dieses lief mit Textpattern und ich wollte die Beiträge in ein WordPress migrieren. Das hat soweit auch gut geklappt, bis auf eine Sache, mit der ich noch heute Probleme habe und die ich leider erst spät herausfand: der Slug (wie man das so schön in WordPress-Sprech nennt) wurde teilweise nicht übernommen, falsch oder nicht generiert.

Symptome: In den Titeln der Textpattern-Beiträge wurde jeweils ein „Non Breaking Space“ zwischen den letzten beiden Wörtern eingefügt, um Hurenkinder zu vermeiden. Leider hat das damals verwendete Script diesen Fall nicht berücksichtigt und dementsprechend dieses mit   eingefügte, geschützte Leerzeichen nicht – wie beim normalen Leerzeichen – mit einem Strich ersetzt, sondern setzte einfach beide Wörter zusammen. So wurde beispielsweise aus pixelscheucher.de/neue-buecher-im-schrank/ ein pixelscheucher.de/neue-buecher-imschrank/. Teilweise hat auch es auch mit den Umlauten nicht funktioniert, so dass auch aus Bücher kein buecher wurde, sondern bucher. An manchen Stellen wurde auch, ich vermute den Fehler hier allerdings im Import-Tool, überhaupt kein Slug erstellt, so dass der jeweilige Beitrag gar nicht aufgerufen werden kann.

Die Folge sind bislang viele 404-Errors, die ich vor allem in den Google Webmaster Tools regelmäßig begutachte und nach und nach korrigiere. Bis dato habe ich an die 100 solcher Fehler, die aber nicht alle auf diesen Export-Import-Vorgang zurückzuführen sind. Ab und an verbringe ich also meine Freizeit damit, URLs zu korrigieren. Manche Beiträge lösche ich auch direkt, da sie inzwischen blödsinnig geworden sind.




Veröffentlicht von

Michel Balzer

Michel ist der Autor des Pixelscheucher-Blog und bloggt seit ca. 2004. Er arbeitet in Essen als Frontend-Entwickler und -Designer in einer kleinen Agentur. mehr über Michel und den Pixelscheucher.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.