Utf-8 artefacten opsporen in database

Ruben01

Ik zit met het volgende probleem.

Een database in UTF-8 is opnieuw ingevoegd maar blijkbaar als een ISO-codering (ISO-8859-1).

Bepaalde tekens uit oude berichten zoals é en ë worden weergegeven in verschillende tekens die overeen komen met de bytes uit de UTF-8 codering.

Ik vraag me af of het mogelijk is een klein script op de database los te laten om de UTF-8 artefacten op te sporen en ervoor te zorgen dat alle oude berichten opnieuw leesbaar zijn.

Iemand die zo'n script kent ?

Ger

Ik weet niet of je via de command line kunt werken, maar in dat geval kun je misschien iets met dit artikel? http://climbtothestars.org/archives/2004/0...tents-to-utf-8/

Wetenschapsforum

Laatste berichten

Nieuwsberichten

Utf-8 artefacten opsporen in database

Utf-8 artefacten opsporen in database

Re: Utf-8 artefacten opsporen in database