Dit is een test van alle cleanup-mechanismen in CleanupHtml.

=== LEGACY CODES: Versie/encoding tags ===

De regel hierboven bevat een versie/encoding tag die volledig verwijderd moet worden.

=== LEGACY CODES: Font tags ===

Afbeelding 2
Afbeelding 2

Dit moet vet worden

Bovenstaande tekst tussen Bold en Romein moet in <strong></strong> staan.

Dit moet cursief worden

Bovenstaande tekst tussen Italic en Romein moet in <i></i> staan.

Vet zonder afsluitende Romein tag

Deze bold tag zonder Romein erachter moet ook in <strong></strong> staan.

Cursief zonder afsluitende Romein tag

Deze italic tag zonder Romein erachter moet ook in <i></i> staan.

Een losse Romein tag die gewoon verwijderd moet worden.

Een onbekende font tag die ook verwijderd moet worden.

=== LEGACY CODES: @-stuurcodes die verwijderd worden ===

Deze tekst blijft staan, alleen wordt verwijderd.

Deze tekst blijft staan, alleen wordt verwijderd.

Deze fotobeschrijving blijft, wordt verwijderd.

Jan de Fotograaf - wordt verwijderd.

Deze kop wordt verwijderd inclusief de tag.

Deze tekst wordt verwijderd inclusief de tag.

Deze kop wordt ook verwijderd inclusief de tag.

=== LEGACY CODES: @-stuurcodes met vervanging ===

Jan Schrijver uit Willemstad

Bovenstaande auteursnaam moet in <i></i> staan.

Belangrijk nieuwsbericht

Bovenstaande kop moet een lichtgrijze achtergrond krijgen met bold.

Dit is de inhoud van een kadertekst die lichtgrijs wordt.

Bovenstaande tekst moet een lichtgrijze achtergrond krijgen.

=== LEGACY CODES: Gecombineerd voorbeeld (zoals echt voorkomt) ===

Kunst van Isla-afval

Tinkebell. met Oleum Shell Isla de Curaçao in Landhuis Bloemhof

Van een onzer verslaggevers

Willemstad - De Nederlandse kunstenaar Tinkebell. presenteert vanaf vandaag de tentoonstelling.

Geschiedenis

De Isla-raffinaderij werd in 1915 door Shell gebouwd om Venezolaanse olie te verwerken.

Expositie

In 'Oleum Shell Isla de Curaçao' schildert Tinkebell. het oorspronkelijke mangrovebos.

Met dank aan de redactie

=== HTML CLEANUP: &nbsp; en non-breaking spaces ===

<p>Deze&nbsp;tekst&nbsp;bevat&nbsp;non-breaking&nbsp;spaces die gewone spaties moeten worden.</p>

=== HTML CLEANUP: Lege span tags ===

<span> </span>

<span></span>

<span>Deze tekst blijft, maar de span tags worden verwijderd</span>

=== HTML CLEANUP: Lege paragrafen ===

<p></p>

<p> </p>

<p><br></p>

<p><br/><br></p>

<p> </p>

=== HTML CLEANUP: Meerdere opeenvolgende br tags ===

<p>Eerste regel<br><br><br><br>Tweede regel met maar 1 br ertussen</p>

=== HTML CLEANUP: br aan begin/einde van paragrafen ===

<p><br>Tekst die niet met br moet beginnen</p>

<p>Tekst die niet met br moet eindigen<br></p>

=== HTML CLEANUP: Inline styles en class attributen ===

<p>Alle attributen moeten verwijderd worden, tekst blijft.</p>

=== HTML CLEANUP: Meerdere spaties ===

<p>Deze tekst heeft teveel spaties.</p>

=== HTML CLEANUP: Witruimte in paragrafen ===

<p> Witruimte aan het begin </p>

=== HTML CLEANUP: Lege formatting tags na cleanup ===

<strong> </strong>

<i> </i>

<p><strong></strong></p>

<p><i></i></p>

=== EINDE TEST ===

<p>Als alles correct werkt bevat het resultaat geen stuurcodes, geen lege tags, geen overbodige attributen en zijn alle font-tags correct omgezet naar HTML formatting.</p>