Springen naar inhoud

Utf-8 artefacten opsporen in database


  • Log in om te kunnen reageren

#1

Ruben01

    Ruben01


  • >1k berichten
  • 2902 berichten
  • Ervaren gebruiker

Geplaatst op 24 augustus 2009 - 13:35

Ik zit met het volgende probleem.
Een database in UTF-8 is opnieuw ingevoegd maar blijkbaar als een ISO-codering (ISO-8859-1).
Bepaalde tekens uit oude berichten zoals ť en Ž worden weergegeven in verschillende tekens die overeen komen met de bytes uit de UTF-8 codering.

Ik vraag me af of het mogelijk is een klein script op de database los te laten om de UTF-8 artefacten op te sporen en ervoor te zorgen dat alle oude berichten opnieuw leesbaar zijn.

Iemand die zo'n script kent ?
BOINC mee met het WSF-team: <a href="http://www.wetenscha...howtopic=60653" target="_blank">http://www.wetenscha...topic=60653</a>

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

Ger

    Ger


  • >5k berichten
  • 16444 berichten
  • Technicus

Geplaatst op 28 augustus 2009 - 08:03

Ik weet niet of je via de command line kunt werken, maar in dat geval kun je misschien iets met dit artikel? http://climbtothesta...tents-to-utf-8/
"Knowledge speaks, but wisdom listens."
- Jimi Hendrix -





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures