Schalken
Cor Schalken was schoolhoofd van de lagere school in Stompwijk. Tijdens zijn verblijf in Stompwijk, maar ook later toen hij met pensioen was en niet meer in Stompwijk woonde, verzorgde hij een aantal fotoboeken. Die fotoboeken gingen als warme broodjes over de toonbank. In vrijwel ieder Stompwijks huishouden zijn zijn boeken te vinden. Naar de Schalkenpagina.
Voor zover wij kunnen nagaan heeft hij een vijftal boeken gepubliceerd, maar helaas zijn de boeken gemaakt voor het computertijdperk en dat betekent dat zijn kopij uit getypte tekst (met een ouderwetse schrijfmachine) bestond. Zijn teksten werden vervolgens gekopieerd, 'gebonden' en verkocht.
De lijst met woorden uit zijn boeken die worden gepresenteerd op de Schalkenpagina bevat termen die gevormd zijn door een OCR-proces. Met behulp van dit proces wordt uit een gescande bladzijde de tekst gereproduceerd. Het plaatje verandert in een tekst! En het is die tekst die u gepresenteerd krijgt.
Het OCR proces werkt echter niet vlekkeloos. Zo af en toe wordt een letter of zelfs een woord niet herkend. Dat gebeurt vooral als de oorspronkelijke tekst niet meer perfect is. Het papier kan beschadigd zijn of smerig en dat levert fouten op in het herkenningsproces. Een andere storende factor is de vermenging van tekst met plaatjes en dat is nu juist precies wat wij vinden in de boeken van Cor Schalken.
Veel foto's (helaas nogal eens in een slechte staat, althans naar huidige maatstaven gerekend) met ook nog eens wisselende lettertypes. Cor had zelfs de gewoonte om met een pen nog iets in zijn getypte tekst bij te schrijven. Dan wordt het dus niks.
In de lijst met woorden zult u dan ook geregeld 'rare' karakters tegenkomen of woorden waar één letter van fout is. Houd daar rekening mee bij het selecteren. Het volgende voorbeeld spreekt voor zich: Hensveen voor Wensveen, Annerlaan voor Ammerlaan, etc