Utf-8 artefacten opsporen in database
- Berichten: 2.902
Utf-8 artefacten opsporen in database
Ik zit met het volgende probleem.
Een database in UTF-8 is opnieuw ingevoegd maar blijkbaar als een ISO-codering (ISO-8859-1).
Bepaalde tekens uit oude berichten zoals é en ë worden weergegeven in verschillende tekens die overeen komen met de bytes uit de UTF-8 codering.
Ik vraag me af of het mogelijk is een klein script op de database los te laten om de UTF-8 artefacten op te sporen en ervoor te zorgen dat alle oude berichten opnieuw leesbaar zijn.
Iemand die zo'n script kent ?
Een database in UTF-8 is opnieuw ingevoegd maar blijkbaar als een ISO-codering (ISO-8859-1).
Bepaalde tekens uit oude berichten zoals é en ë worden weergegeven in verschillende tekens die overeen komen met de bytes uit de UTF-8 codering.
Ik vraag me af of het mogelijk is een klein script op de database los te laten om de UTF-8 artefacten op te sporen en ervoor te zorgen dat alle oude berichten opnieuw leesbaar zijn.
Iemand die zo'n script kent ?
BOINC mee met het WSF-team: <a href="http://www.wetenschapsforum.nl/index.ph ... opic=60653" target="_blank">http://www.wetenschapsforum.nl/index.ph ... c=60653</a>
- Berichten: 17.659
Re: Utf-8 artefacten opsporen in database
Ik weet niet of je via de command line kunt werken, maar in dat geval kun je misschien iets met dit artikel? http://climbtothestars.org/archives/2004/0...tents-to-utf-8/
"Knowledge speaks, but wisdom listens."
- Jimi Hendrix -
- Jimi Hendrix -