JAVA opslagprobleem (nu met juiste html-bestand)

Moderators: jkien, Xilvo

Reageer
Berichten: 10

JAVA opslagprobleem (nu met juiste html-bestand)

Ik heb een html-bestand met uitdrukkingen en gezegdes.
Bij elke uitdrukking/gezegde staat een korte omschrijving ervan.
 
Ik wil dit html-bestand om zetten naar een tekstbestand(JSON-formaat)
Hiervoor heb ik een parser in Java ontwikkeld.
 
Dit tekstbestand wil ik weer als input gebruiken voor een app.
De tags en vreemde tekens worden eruit gefilterd of omgezet in andere geldige tekens.
 
Voorbeeld:
Input: 
<dd><b>De hete aardappel doorschuiven.</b></dd>

<dd><small>Een vervelende beslissing aan een ander overlaten.</small></dd>

</dl>

</dd>

</dl>

<dl>

<dd>

<dl>
 
Output:
{"V":"U","A":"DE HETE AARDAPPEL DOORSCHUIVEN.","O":"Een vervelende beslissing aan een ander overlaten."},
 
Het probleem is dat niet alle regels worden omgezet.
 
Alles wat  na 
 
<dd><b>Armslag krijgen.</b></dd>

<dd><small>Meer mogelijkheden krijgen.</small></dd>

</dl>

</dd>

</dl>
 
komt,  wordt niet opgeslagen.
 
De code is op zich niet zo spannend, maar ik zie denk ik iets over het hoofd.
Het lijkt erop dat bij het opslaan niet goed gaat.
 
Graag hulp hierbij.
 
bvd, Johan Schut
 
 


Bijgevoegde Bestanden
Bijlagen

[De extensie htm is uitgeschakeld en kan niet langer worden weergegeven.]

SPEL_DATA.TXT
(8 KiB) 76 keer gedownload
WikiData.zip
(2.98 KiB) 75 keer gedownload

Berichten: 7.072

Re: JAVA opslagprobleem (nu met juiste html-bestand)

Het probleem zit in de afhandeling van de entry "Boter aan de galg zijn". Hierin zit een <a>-tag die niet goed afgehandeld wordt door 'filterenTags' (komt in een oneindige lus). Omdat je een buffered writer gebruikt, wordt de data per 8 kiB naar de schijf geschreven. Dit gebeurt wel met de eerste 8 kiB (die toevallig rond de 'Armslag krijgen'-entry eindigt).

Berichten: 10

Re: JAVA opslagprobleem (nu met juiste html-bestand)

Zag het net ook.
 
Maar toch bedankt.
 
Groetjes, Johan

Reageer