I GEBRUIKERSHANDLEIDING GEBRUIKERSHANDLEIDING foreword.
II Readiris Pro © 1990-2006 I.R.I.S. Alle rechten voorbehouden OCR technologie door I.R.I.S. Connectionist, AutoFormat en linguïstische technologie door I.R.I.S. ICR en streepjescodelectuurtechnologie door I.R.I.S. © 1990-2006 I.R.I.S. Alle rechten voorbehouden foreword.
III GEBRUIKERSHANDLEIDING B ESP AAR ESPAAR TIJD , VER TIK HET TE HER TIKKEN ! VERTIK HERTIKKEN Gelukwensen bij de aanschaf van Readiris. Deze software zal u ongetwijfeld belangrijke hulp bieden bij het hernemen van uw teksten, tabellen, grafisch materiaal, streepjescodes en zelfs handgeschreven teksten! Hoe efficiënt computers ook mogen zijn, u moet de informatie altijd wel nog eerst invoeren.
IV zelflerende technieken die afgeleid zijn van neuraal netwerk. Het systeem kan door de contextuele analyse nieuwe karakters aanleren: taalkundige kennis over lettergrepen en woorden verbetert de OCR-prestatie. Readiris ondersteunt wel 126 talen: alle Amerikaanse en Europese talen worden herkend, inclusief de Centraal-Europese talen, de Baltische talen, het Grieks en de Cyrillische (“Russische”) talen.
V GEBRUIKERSHANDLEIDING identiek aan het oorspronkelijke document. En aangezien Readiris moeiteloos grijswaarden en kleurscans ondersteunt kunt u tegelijk al uw grafisch materiaal hernemen - het maakt niets uit of het zwart-wit illustraties, zwart-wit foto’s of kleurfoto’s betreft. Wanneer een document tabellen bevat, zal Readiris die “herorganiseren” in heuse cellen en de celgrenzen herscheppen naar het voorbeeld van de oorspronkelijke tabel.
VI “Lees Mij” bestand en documentatie .............................................................................................. 1-8 Handschriftformulier ......................................................................................................................... 1-8 Registreer om mee te spreken! ..................................................................................... 1-8 Beroep doen op productondersteuning .....................................................................
VII GEBRUIKERSHANDLEIDING Andere apparaten, andere resolutie ........................................................................... 2-86 Standaard instelling bewaren ..................................................................................... 2-91 Specifieke instellingen bewaren ................................................................................. 2-92 Documenten scannen ................................................................................................
VIII Acrobat en Reader zijn (geregistreerde) handelsmerken van Adobe. Excel, Windows en Word zijn geregistreerde handelsmerken van Microsoft. Intel is een geregistreerd handelsmerk van Intel. foreword.
1-1 GEBRUIKERSHANDLEIDING Hoofdstuk 1 INSTALLATIE Dit hoofdstuk bespreekt de systeemvereisten en de installatie van de Readiris software. S YSTEEMVEREISTEN Dit zijn de minimale systeemvereisten om Readiris te gebruiken: een 486 Intel PC of compatibele computer. Een Pentium PC is aanbevolen. 64 MB RAM. 128 MB RAM is aanbevolen om beelden in grijswaarden en kleuren te verwerken. 120 MB vrije ruimte op de harde schijf.
1-2 ROM station en wacht u tot het installatieprogramma begint te lopen. Voer de instructies uit die op het scherm verschijnen. Mocht de installatie niet opstarten wanneer u de CD-ROM in de CD-ROM lezer laadt, start dan het installatieprogramma MENU.EXE op om de software te installeren. Gebruikers van Windows XP, Windows 2000 en Windows NT 4.0 moeten nagaan of zij over de nodige toegangsrechten beschikken - contacteer zo nodig de systeembeheerder.
1-3 GEBRUIKERSHANDLEIDING Zo wordt standaard ook de elektronische handleiding op uw harde schijf gekopieerd, maar u kunt die ook op de CD-ROM laten staan. (Installeer tevens, mocht dat nodig blijken, de Adobe Reader software die toelaat de softwaredocumentatie te raadplegen.) Het installatieprogramma creëert automatisch het submenu "I.R.I.S. toepassingen - Readiris" onder het menu "Programma’s". Datzelfde geldt voor een snelkoppeling naar Readiris op het Windows bureaublad.
1-4 Volg de instructies die op het scherm verschijnen om de Readiris software te verwijderen. S OFTW ARE - OPTIES OFTWARE INST ALLEREN INSTALLEREN Er zijn drie software-opties beschikbaar voor Readiris: de complementen “Aziatische OCR-module”, “Arabische OCR-module” en “Hebreeuwse OCRmodule”. De “Arabische OCR-module” is exclusief beschikbaar voor gebruikers van Readiris Corporate.
1-5 GEBRUIKERSHANDLEIDING Arabische OCR-module” OCR-module laat u toe Zoals de naam al aangeeft laat de “Arabische Arabische documenten te herkennen. (Deze software-optie is enkel beschikbaar voor gebruikers van Readiris Corporate!) chapter1.
1-6 Hebreeuwse OCR-module” De “Hebreeuwse OCR-module houdt evenmin verrassingen in: ze laat u Hebreeuwse documenten herkennen. chapter1.
1-7 GEBRUIKERSHANDLEIDING Ook die extra software wordt op een zelfstartende CD-ROM geleverd. Wanneer u de optie “Aziatische OCR-module” installeert, wordt er specifieke documentatie toegevoegd die uitlegt hoe u Aziatische documenten kunt herkennen. chapter1.
1-8 V ER WANTE ERW T OEP ASSINGEN INST ALLEREN OEPASSINGEN INSTALLEREN Naargelang de softwareversie die u aanschafte, kan Readiris vergezeld zijn van een evaluatie-versie van het aanverwante product Cardiris, een organizer voor visitekaartjes visitekaartjes. Indien dit gratis software-pakket meegeleverd is op de Readiris CD-ROM, wordt het net als Readiris geïnstalleerd door de zelfstartende CD-ROM in het station te laden en de instructies uit te voeren die op het scherm verschijnen.
1-9 GEBRUIKERSHANDLEIDING Een pictogram in het submenu "I.R.I.S. toepassingen - Readiris" onder het menu "Programma’s" brengt u rechtstreeks naar de I.R.I.S. website website. Dat kan ook vanuit het startscherm van Readiris en aan de hand van het commando "I.R.I.S. op het Internet" onder het menu "Hulp" van Readiris. chapter1.
1 - 10 G EÏNST ALLEERDE EÏNSTALLEERDE BEST ANDEN BESTANDEN Het installatieprogramma maakt een map aan waarin de Readiris bestanden zich bevinden. Probeer nooit Readiris of sommige van zijn modules te verwijderen door handmatig programmabestanden te wissen. Gebruik hiervoor de Windows “(un)installwizard”. Zie hierboven. “Lees Mij” bestand en documentatie README.HTM MANUAL.PDF “Lees Mij” bestand (in HTML formaat) Gebruikershandleiding (in Adobe Acrobat formaat) Handschriftformulier TEMPLATE.
1 - 11 GEBRUIKERSHANDLEIDING De Readiris registratiewizard die u vindt onder het menu "Registreren" van de Readiris software loodst u in luttele ogenblikken door het registratieproces. chapter1.
1 - 12 Naargelang de softwareversie, ontvangt u in ruil de softwaresleutel die u kunt nodig hebben om de Readiris software na één maand te blijven gebruiken. B EROEP DOEN OP PRODUCTONDERSTEUNING Het commando "Productondersteuning" in het "Hulp" menu van Readiris beschrijft hoe u beroep kunt doen op de technische ondersteuning. Beschrijf duidelijk het probleem dat u ervaart en verschaf ons alle nuttige informatie betreffende Readiris, uw scanner en uw computersysteem. chapter1.
1 - 13 GEBRUIKERSHANDLEIDING Maar eer u een beroep doet op de productondersteuning, bevelen we aan dat u nagaat of er software-updates beschikbaar zijn om te downloaden. Gebruik hiervoor het bevel "Updates Zoeken" onder het menu "Hulp". chapter1.
1 - 14 chapter1.
2-1 GEBRUIKERSHANDLEIDING Hoofdstuk 2 EEN RONDLEIDING Readiris is een geavanceerd OCR-pakket dat talrijke krachtige functies bevat. We zullen in dit hoofdstuk deze mogelijkheden doorlopen en vele tips betreffende het gebruik van Readiris toevoegen. R EADIRIS OPST AR TEN OPSTAR ARTEN Klik op de Readiris applicatie in het submenu "I.R.I.S. Toepassingen - Readiris" of klik op de snelkoppeling van de Readiris applicatie op uw bureaublad.
2-2 DE EERSTE SESSIE IS UNIEK Naargelang de versie van de software die u heeft aangekocht, kan de eerste sessie wat apart verlopen. U kunt namelijk uitgenodigd worden om uw licentie te registreren. Als dat het geval is, is het gebruik van uw Readiris softwarelicentie beperkt tot één maand. Door te registreren ontvangt u van I.R.I.S. gratis de softwaresleutel die u toelaat om het programma na 30 dagen te blijven gebruiken.
2-3 GEBRUIKERSHANDLEIDING Aanvankelijk zijn sommige commando’s grijs: ze betreffen de preview. Zolang er geen beeld geladen is, zijn ze niet voorhanden. Dat geldt ook voor de beeldknoppenbalk aan de rechterkant van het programmavenster: deze balk bevat alle commando’s die u tijdens de voorvertoning chapter2.
2-4 nodig heeft. De algemene toolbalk links geeft snelle toegang tot de frequente bevelen van algemene aard. Om te vernemen welk bevel achter welke knop schuilt, kunt u uw muis een tijdje boven een knop houden: een tooltip zal u vertellen welke functie de knop vervult. De beeldzone is de plaats waar de gescande beelden worden getoond. U kunt beeldbestanden naar deze zone (en naar het Readiris pictogram) slepen om ze te herkennen.
2-5 GEBRUIKERSHANDLEIDING Daarnaast wordt het documentpaneel afgebeeld onder het gescand beeld. Het geeft statistische data weer en geeft informatie over alle gescande beelden - de beeldbron en beeldresolutie, de duur van het scannen en herkennen enz. (Het documentpaneel is ook uitgerust met tooltips...) VAN ST AR T GAAN MET EEN EERSTE OEFENING STAR ART De beste manier om vertrouwd te raken met het gebruik van Readiris is ongetwijfeld de software gebruiken. Een aantal vooraf gescande beelden chapter2.
2-6 wordt bij de software geleverd; ze laten u toe om van start te gaan, zelfs als u nog geen scanner op uw PC aangesloten hebt. Laten we ermee van start gaan. Met de knop "Bron" op de algemene knoppenbalk geeft u aan of u de scanner of een vooraf gescand beeld gebruikt als beeldbron. Readiris ondersteunt kleurbeelden, beelden in grijswaarden en zwart-wit beelden. Met Readiris kunt u Adobe Acrobat PDF documenten, DCX faxen (een meerbladige versie van het Paintbrush formaat), DjVu beelden (*.djv, *.
2-7 GEBRUIKERSHANDLEIDING U wordt uitgenodigd om een beeldbestand te kiezen. Selecteer het bestand DUTCH.JPG in de map "Samples", een submap van Readiris. Daar dit een kleurbeeld is, wordt het niet enkel van de harde schijf gelezen: er wordt tevens een zwart-wit versie aangemaakt voor het OCR-proces. Tenslotte wordt het beeld getoond in de beeldzone. De paginaknoppenbalk en het documentpaneel geven aan dat er één bladzijde in het geheugen geladen is. chapter2.
2-8 Een derde manier om vooraf gescande beelden te openen is het gebruik van drag and drop”: drop sleep beeldbestanden van de Windows Verkenner naar de “drag beeldzone of naar het pictogram van Readiris en ze worden onmiddellijk geopend. chapter2.
2-9 GEBRUIKERSHANDLEIDING En er is nog een manier om beelden te openen vanuit de Windows Verkenner: klik op een beeldbestand met de rechter muisknop en selecteer het commando "Herkennen" van het "Context" menu. (Dit bevel verschijnt enkel indien het bestandstype door Readiris ondersteund wordt.) chapter2.
2 - 10 Eén en ander betekent niet dat de herkenning ogenblikkelijk wordt uitgevoerd: de gebruiker behoudt de volledige controle over het OCR-proces. Readiris wordt gewoon opgestart en het beeld wordt in het geheugen geladen. De beeldknoppenbalk bevat alle commando's die nuttig zijn tijdens de beeldpreview: u vindt er tools om de zones van belang aan te duiden, om het beeld te roteren, om in- en uit te zoomen enz.
2 - 11 GEBRUIKERSHANDLEIDING "Bekijken" bevat diezelfde bevelen en voegt twee extra zoomniveau’s toe: u kunt het beeld laten afbeelden op 50% en 200% van zijn ware grootte. Bij de werkelijke grootte beantwoordt één beeldpixel aan één schermpixel. (Er zijn overigens versnellingstoetsen beschikbaar voor alle de zoomniveau’s.) De zoomniveau’s zijn overigens tevens beschikbaar via de rechter muisknop.
2 - 12 U kunt tevens met de rechter muisknop dubbelklikken om op een deel van het gescande beeld in te zoomen op werkelijke grootte. Klik de rechter muisknop een tweede keer om opnieuw uit te zoomen. grootglas gebruikmaken om in te zoomen op Tenslotte kunt u van het ver vergrootglas details van het gescand document. Het vergrootglas is ook beschikbaar op het "Context" menu wanneer u met de rechter muisknop boven het beeld klikt. chapter2.
2 - 13 GEBRUIKERSHANDLEIDING Druk op Escape of klik met de muis om het vergrootglas weer te doen verdwijnen! E ÉN, EEN GESCAND BEELD ANAL YSEREN ANALYSEREN Nu het beeld gescand is, kunt u aangeven welke delen u wilt omzetten in bewerkbare tekst door kaders, zogenaamde “vensters”, rond de zones van belang te tekenen. Overigens kan Readiris dit automatisch voor u doen wanneer u de optie "Paginaanalyse" activeert met de knop "Opties" op de hoofdknoppenbalk (of onder het menu "Instelling"). chapter2.
2 - 14 De automatische pagina-analyse is bijzonder nuttig wanneer u in kolommen geschikte tekst moet herkennen en documenten met een ingewikkelde lay-out die mogelijkerwijze illustraties en tabellen bevatten. chapter2.
2 - 15 GEBRUIKERSHANDLEIDING De pagina-analyse maakt gebruik van drie venstertypes venstertypes: er zijn tekstvensters, grafische vensters en tabelvensters. Readiris onderscheidt de tekstblokken van de tabellen en de grafische zones die foto’s, illustraties enz. bevatten. (We komen verder terug op de opslag van figuren en de herkenning van tabellen.) Twee extra venstertypes moeten altijd handmatig worden getekend: streepjescodevensters en handschriftvensters.
2 - 16 aanmaken om zo bladzijden te verwerken met witte tekst op een zwarte achtergrond. Zie verderop.) A NDERHALF, VENSTERS SOR TEREN SORTEREN Readiris detecteert niet alleen de verschillende zones, maar sorteert die ook: standaard worden de vensters van boven naar onder, van links naar rechts gesorteerd zodat in kolommen geschikte documenten goed verwerkt worden. Natuurlijk kunt u de sorteervolgorde wijzigen. Om dit te doen klikt u op de knop "Sorteren" op de beeldknoppenbalk.
2 - 17 GEBRUIKERSHANDLEIDING Standaard is de pagina-analyse geactiveerd. Om Readiris te dwingen de huidige pagina te analyseren - u hebt bijvoorbeeld de pagina-analyse per ongeluk uitgeschakeld, u heeft sommige vensters gewist en nu wilt u de pagina-analyse herhalen enz. -, klikt u op de knop "Pagina Analyseren" in de beeldknoppenbalk. chapter2.
2 - 18 Selecteer de taal van het document eer u de pagina-analyse uitvoert bij Aziatische, Arabische en Hebreeuwse documenten. Voor die talen worden er speciale routines gebruikt: de spatie tussen twee lijnen is meestal groter dan het geval is in Westerse documenten, de tekst bestaat uit kleine icoontjes (“ideogrammen”) die in Westerse documenten wel eens als grafische zone kunnen worden gezien, en de tekst kan van rechts naar links, van boven naar beneden lopen.
2 - 19 GEBRUIKERSHANDLEIDING bevatten vaak foto’s die de boorden van het blad raken of er is een achtergrondfoto die de hele bladzijde bedekt enz. T WEE, BEELDEN MANUEEL BEVENSTEREN De pagina-analyse is de automatische manier om gescande pagina’s te bevensteren. Maar u kunt de zones van een beeld ook handmatig aangeven met de venstertools van Readiris! chapter2.
2 - 20 (We gaven al aan dat streepjescode- en handschriftvensters altijd manueel worden getekend door de gebruiker: de pagina-analyse detecteert dergelijke zones immers niet!) Om een rechthoekig kader te tekenen rond een te hernemen zone, selecteert u de corresponderende tool in de beeldknoppenbalk. Sleep de cursor van de linker boven hoek van het venster naar de tegenovergestelde hoek rechts onder. (Zijden kleiner dan 1 mm zijn niet toegelaten, ze zouden overigens niet één karakter bevatten.
2 - 21 GEBRUIKERSHANDLEIDING De vensters worden automatisch gesorteerd naarmate ze gecreëerd worden: nummers geven de volgorde aan. U kunt ook “onregelmatige” tekstblokken tekenen door polygone vensters rond dergelijke tekstzones te trekken. Veelhoekige vensters creëert men door rechthoekige vensters te versmelten: van zodra twee rechthoeken (van hetzelfde type) elkaar raken, worden ze automatisch omgezet in één venster! Het is alsof u een huis bouwt door de ene kamer na de andere toe te voegen...
2 - 22 knop) in de beeldknoppenbalk en klikt u op het venster. Vierkanten markeerpunten verschijnen op elke hoek en in het midden van de vensterzijden. Klik de muisknop ergens anders om de selectie van vensters ongedaan te maken. Om aanvullende vensters te selecteren, houdt u de Shift knop ingedrukt maken terwijl u op de bijkomende vensters klikt.
2 - 23 GEBRUIKERSHANDLEIDING in een interne buffer, het commando "Wissen" wist het (de) venster(s) onherroepelijk. Wanneer u vensters plakt, worden ze ingevoegd worden op hun originele plaats; het is de taak van de gebruiker ze te verplaatsen naar hun nieuwe locatie.
2 - 24 Als u documenten met een identieke opmaak wilt herkennen - bijvoorbeeld een rapport van 50 bladzijden waar de hoofding en de voetnoten om evidente redenen worden uitgesloten -, kunt u één sjabloon hanteren voor alle 50 pagina’s. Wanneer u een sjabloon in het geheugen laadt, wordt de pagina-analyse automatisch uitgeschakeld. De vensterlay-out blijft van kracht totdat u de paginaanalyse opnieuw activeert in de beeldknoppenbalk.
2 - 25 GEBRUIKERSHANDLEIDING chapter2.
2 - 26 MET READIRIS KUNT U DE HELE WERELD ROND! Nu de vensters correct getekend zijn, bent u bijna klaar om de karakterherkenning uit te voeren. We zeggen “bijna”, want u heeft de taal en de instellingen van het document nog niet gecontroleerd! De taalinstelling vindt u op de hoofdknoppenbalk terug. Klik op de knop "Taal" om de taal van het document aan te passen. chapter2.
2 - 27 GEBRUIKERSHANDLEIDING (Dit bevel geeft u ook toegang tot de herkenningsmodi “snel” en “precies”. Hierover straks meer!) U kunt een lettertoets indrukken om onmiddellijk naar een taal te gaan: als u momenteel Nederlands geselecteerd hebt en u wilt Quechua selecteren drukt u op de "Q" toets op uw klavier om onmiddellijk naar het Quechua te gaan. Wanneer verschillende talen dezelfde beginletter hebben drukt u herhaalde malen op deze chapter2.
2 - 28 toets om de verschillende opties te doorlopen. Bijvoorbeeld: Readiris leest Deens en Duits. Door éénmaal op "D" te drukken, selecteert u het Deens, door een tweede maal op "D" te drukken selecteert u het Duits en door een derde maal op de "D" toets te drukken keert u terug naar het Deens. (Om naar een andere letter te gaan, bijvoorbeeld T, drukt u op de toets BackSpace voor u de "T" toets indrukt.
2 - 29 GEBRUIKERSHANDLEIDING Indien u daarentegen met Windows ME of 98 werkt, selecteert u het pictogram "Software Toevoegen/Wissen" onder het "Controlepaneel" om uit te zoeken of de Windows module "Veeltalige Ondersteuning" al op uw PC geïnstalleerd is. chapter2.
2 - 30 Om Aziatische, Arabische en Hebreeuwse documenten op het scherm af te beelden en te bewerken, kunt u een Aziatische, Arabische en Hebreeuwse versie van het Windows besturingssysteem installeren.
2 - 31 GEBRUIKERSHANDLEIDING Raadpleeg het “Read Me” bestand van Readiris als u over dit onderwerp meer wilt vernemen! De correcte taal kiezen is van essentieel belang. Op basis van de geselecteerde taal, zal het programma weten welke karakterset dient herkend te worden. De veeltalige ondersteuning garandeert dat u “exotische” karakters zoals ß, ñ, γ en ø correct herkent. Ten tweede maakt het programma uitgebreid gebruik van linguïstische databanken om de resultaten te valideren.
2 - 32 Griekse, Cyrillische, Hebreeuwse en Aziatische documenten - vele eigennamen, merknamen enz. worden geschreven in het Latijns alfabet - zal Readiris automatisch naar het correcte alfabet grijpen. Met andere woorden, u kunt een gemengd alfabet activeren van Griekse, Cyrillische, Hebreeuwse of Aziatische karakters in combinatie met Latijnse karakters. Wees er zeker van dat u "Grieks-Engels" geselecteerd hebt of een gepaste Cyrillische taalinstelling - bijvoorbeeld "Oekraïens-Engels".
2 - 33 GEBRUIKERSHANDLEIDING Wanneer u het resultaat met de tekstverwerker opent ziet het er zo uit - het kan gebeuren dat u een Cyrillisch lettertype moet activeren om de Russische tekst correct weer te geven op het beeldscherm. chapter2.
2 - 34 Om andere talen te mengen moet u die taal selecteren met de meest uitgebreide karakterset. Stel dat u een document heeft waar de Franse vertaling naast de Nederlandse tekst staat: u moet het Frans selecteren om ervoor te zorgen dat de geaccentueerde karakters zoals ç, é en ù correct herkend worden. DE KENMERKEN VAN HET DOCUMENT AANGEVEN Nu de taal is ingesteld, gaan we over naar de andere kenmerken van het document.
2 - 35 GEBRUIKERSHANDLEIDING We vangen aan met commando "Type Lettertekens" onder het menu "Instelling". Het “type” lettertekens onderscheidt de “normale” documenten van de matrixgedrukte documenten. “Draft” dot matrix symbolen - ook wel “9 pin” matrixdruk genoemd - zijn opgemaakt uit aparte vlekken, en er zijn sterk gespecialiseerde herkenningstechnieken nodig om dergelijke teksten te lezen.
2 - 36 Bij vaste lettertypes hebben alle symbolen van één lettertype dezelfde breedte. Een "l" neemt evenveel horizontale plaats op binnen een lijn als een "w", zoals in deze zin het geval is. Neem bijvoorbeeld de documenten die afkomstig zijn van een schrijfmachine: de wagen van de schrijfmachine schuift telkens op met een vaste afstand. Bij een proportioneel lettertype hangt de breedte van elk symbool van zijn specifieke vorm af.
2 - 37 GEBRUIKERSHANDLEIDING die met de correcte resolutie en helderheid werden ingescand... U dient echter de precieze herkenningsmodus te verkiezen wanneer de beeldkwaliteit laag is en dan hebben we over faxen, plaatjes die u schoot met een digitaal fototoestel, andere beelden met een lage resolutie enz. De precieze herkenningsmodus zorgt voor optimale herkenningsresultaten maar heeft meer tijd nodig om de documenten te verwerken. Standaard is de precieze herkenningsmodus ingeschakeld.
2 - 38 Indien de leermodus ingeschakeld werd met de knop "Leren" op de hoofdknoppenbalk komt Readiris op het einde van de herkenning terecht in de interactieve fase. (Het interactief leren is standaard uitgeschakeld.
2 - 39 GEBRUIKERSHANDLEIDING De herkende tekst wordt progressief doorlopen en het systeem stopt op de twijfelachtige karakters of - als we het over elkaar rakende karakters (“ligaturen”) hebben - op de twijfelachtige karakterreeksen. De lettertekens worden altijd in hun context getoond, met de nodige klemtoon op de twijfelachtige karakters. Niet herkende karakters worden voorgesteld met een tilde (het symbool "~").
2 - 40 Leren U gaat akkoord met de voorgestelde oplossing of u verbetert die. Het programma bewaart dit twijfelachtige karakter in het woordenboek als “zeker”, definitief. De verdere herkenning ervan zal geen tussenkomst meer vergen, de vorm wordt als voor ééns en altijd als aangeleerd beschouwd. In het bovenstaand voorbeeld stopt het systeem op een twijfelachtige vorm, en we klikken op "Leren" om een vorm aan te leren die niet kan verward worden met andere karakters.
2 - 41 GEBRUIKERSHANDLEIDING De "e" hierboven is serieus beschadigd - in feite gelijkt hij op een "c" -, en u klikt hier op "Niet Leren" om dit symbool niet met de "c" te verwarren. Wissen De twijfelachtige vorm wordt uit de uitvoer verwijderd. Gebruik deze knop om “ruis” die op de documenten voorkomt - inkt- of koffievlekken die herkend raken als punten of komma’s en dergelijke - uit de uitvoer te verwijderen, of om een willekeurig ongewenst symbool te wissen.
2 - 42 Einde Het leerproces wordt gestopt maar het OCR-proces gaat verder in de automatische modus. Alle oplossingen van het systeem worden aanvaard zonder validatie door de gebruiker. Klik op deze knop wanneer u ziet dat de herkenning erg goed is en geen gedetailleerde verificatie behoeft. Afbreken Verwar "Einde" niet met "Afbreken": bij "Afbreken" wordt er geen uitvoer gegenereerd en moet u de herkenning overdoen, met de knop "Einde" wordt de tekst wel aangemaakt, alleen neemt u die niet in detail door.
2 - 43 GEBRUIKERSHANDLEIDING Woordenboeken zijn beperkt tot 500 vormen; wij raden u aan aparte woordenboeken aan te maken voor specifieke applicaties - bijvoorbeeld per documenttype. Woordenboeken hebben standaard de extensie *.dus. De training heeft geen effect meer wanneer het woordenboek vol is: de resultaten van het leerproces worden dan niet langer in het geheugen opgeslagen of naar het woordenboek weggeschreven.
2 - 44 De optie "Nieuw Woordenboek" geeft aan dat de resultaten van de training zullen opgeslagen worden in een nieuw woordenboek. (Wanneer u een bestaand woordenboek selecteert wordt de inhoud gewist.) De uitbreidingsmodus geeft aan dat de trainingresultaten zullen bewaard worden in een bestaand woordenboek: de herkenning maakt al gebruik van de extra intelligentie die in het woordenboek aanwezig is, en u voegt nieuwe vormen aan het woordenboek toe.
2 - 45 GEBRUIKERSHANDLEIDING Wanneer u in het interactief leren terecht komt worden het woordenboek en zijn modus aangegeven in de titel van het leervenster, en u klikt op "Annuleren" om opnieuw te beginnen wanneer deze foutief blijken. T EKST DIRECT NAAR EEN TOEP ASSING STUREN OEPASSING Het interactief leren beëindigt de karakterherkenning. Daar Microsoft Word fungeert als standaard doeltoepassing voor de uitvoer, wordt uw tekstverwerker chapter2.
2 - 46 na de herkenning (indien nodig) automatisch opgestart en wordt de herkende tekst ingevoegd. Het kan voorkomen dat u de vooruitgang van de formattering van het document op het scherm kunt volgen. (Of dat daadwerkelijk het geval is hangt van de grootte van het document en de complexiteit van de formattering.) Het gescande beeld verschijnt opnieuw op het scherm mét de bevenstering. Het beeld is klaar voor verdere verwerking, het blijft afgebeeld tot u een nieuwe bladzijde inscant.
2 - 47 GEBRUIKERSHANDLEIDING De mogelijkheid om documenten “door te zenden zenden” biedt u een rechtstreekse OCR link tussen uw scanner en uw Windows applicaties: u voert documenten onmiddellijk uit naar uw tekstverwerker, rekenblad of webbrowser, naar Adobe Reader enz.! chapter2.
2 - 48 Na de herkenning wordt de doeltoepassing opgestart en worden de resultaten automatisch ingevoegd. chapter2.
2 - 49 GEBRUIKERSHANDLEIDING Vergeet echter niet dat de optie "Zenden naar" u ook teksten in het Windows klembord laat stoppen, er is dus geen strikte noodzaak om ze uit te voeren... of in een bestand op te slaan! H ET RESUL TAA T IN EEN TEKSTBEST AND OPSLAAN RESULT AAT TEKSTBESTAND U kunt het herkenningsresultaat inderdaad bewaren in een “extern” bestand. Ook hier ondersteunt Readiris een wijd gamma aan bestandsformaten dat alle populaire tekstverwerkers, rekenbladen, webtoepassingen enz. omvat.
2 - 50 De Optie "Opslaan en Openen" is in grote lijnen gelijkwaardig met de optie "Zenden naar": u opent het herkende document eens u het opgeslagen hebt. chapter2.
2 - 51 GEBRUIKERSHANDLEIDING De manier die wordt aangewend om de doeltoepassing te doen lopen is echter fundamenteel verschillend. Hier bepaalt het Windows bestandstype welke toepassing zal opgestart worden. Het is net alsof u het uitvoerbestand in de Windows Verkenner twee keer aangeklikt hebt... (De optie "Zenden naar" richt zich rechtstreeks naar specifieke doeltoepassingen.) chapter2.
2 - 52 De optie "Per E-mail Versturen" creëert een nieuw e-mailbericht en voegt het herkend document toe als aangehecht bestand. Kent u een snellere manier om een papieren document vlug te verspreiden...? chapter2.
2 - 53 GEBRUIKERSHANDLEIDING U NIVERSELE BEST ANDEN AANMAKEN ... BESTANDEN We gaan wat dieper in op één formaat: Adobe Acrobat PDF. PDF Met Readiris kunt u PDF documenten aanmaken die op tekst en beeld gebaseerd zijn. chapter2.
2 - 54 Waar zit het verschil tussen deze formaten? Wanneer u het formaat "PDF Tekst" kiest, maakt Readiris een PDF bestand aan dat het tekstresultaat bevat. chapter2.
2 - 55 GEBRUIKERSHANDLEIDING (Er kunnen wel figuren in het bestand voorkomen maar enkel als die ook op de bladzijde voorkomen - foto’s, illustraties enz.) Met andere woorden: het beeld van de volle bladzijde is niet opgenomen in het PDF bestand en het PDF bestand bevat slechts één laag! Het formaat "PDF Beeld" maakt ook PDF bestanden aan van één laag, maar die bevatten natuurlijk het gescande beeld, niet het OCR resultaat! chapter2.
2 - 56 De formaten "PDF Tekst-Beeld" en "PDF Beeld-Tekst" leveren andere resultaten op: Readiris creëert een doorzoekbaar PDF bestand dat de herkende chapter2.
2 - 57 GEBRUIKERSHANDLEIDING tekst en het beeld van de bladzijde bevat. Bij bestanden van het type “tekstbeeld” is de tekst boven het beeld van de bladzijde opgenomen in het PDF bestand dat nu twee lagen bevat. Bij PDF bestanden van het type “beeld-tekst” bevindt de tekst zich onder het beeld van de bladzijde.
2 - 58 Alle op tekst gebaseerde PDF bestanden nemen de URLs van websites en emailadressen op als zichtbare links: klik op zo’n link en u bezoekt de vermelde webstek of u stuurt een nieuw e-mailbericht naar die contactpersoon! (Ook de andere “rijke” tekstformaten van Readiris - Word, WordML, HTML enz. herscheppen de hyperlinks!) chapter2.
2 - 59 GEBRUIKERSHANDLEIDING Klik op de knop "Formaat" om enkele opties te ontdekken die het Acrobat PDF formaat betreffen: "Bladwijzers Creëren" en "Lettertypes Inbedden". (Van zodra u een PDF formaat kiest, is de autoformattering van toepassing - en u kunt die niet uitschakelen.) De optie "Bladwijzers Creëren" zorgt ervoor dat er een bladwijzer wordt aangemaakt per bladzijde voor elk element van het document - en de figuren zijn evengoed elementen als de tekstblokken en de tabellen.
2 - 60 De optie "Lettertypes Inbedden" sluit de lettertypes in de PDF bestanden in. Lettertypes inbedden belet de vervanging van lettertypes wanneer de lezer het herkende document op het scherm bekijkt en afdrukt. Het zorgt ervoor dat de lezer - welke computer hij ook moge gebruiken - de tekst te zien krijgen met de correcte, oorspronkelijke lettertypes.
2 - 61 GEBRUIKERSHANDLEIDING Het bevel "Documenteigenschappen" onder het menu "Bestand" zorgt hiervoor. Merk overigens op dat u eigenschappen van een document ook achteraf kunt aanduiden, namelijk wanneer u de herkenningsresultaten opslaat...! Het is natuurlijk wel zo dat documenteigenschappen niet zijn beperkt tot PDF uitvoer: documenten in Word (*.doc), RTF (“Rich Text Format”), WordML (*.xml), chapter2.
2 - 62 SpreadsheetML (*.xml) en HTML ondersteunen eveneens documenteigenschappen - zij het op een minder volledige manier dan het Adobe Acrobat PDF formaat dat doet. (En dit is net zo voorspelbaar: “arme” tekstformaten zoals Tekst (ANSI) en MS-DOS Tekst (ASCII) ondersteunen geen eigenschappen van documenten! ... OF ZE LEZEN! We kijken even de andere richting uit.
2 - 63 GEBRUIKERSHANDLEIDING door Readiris gesloopt! (Laten we specifiek zijn: “meesterwachtwoorden” die de toelatingen van PDF bestanden regelen storen Readiris niet, “gebruikerswachtwoorden” die nodig zijn om een PDF bestand te openen doen dat wel.) Ten tweede zet Readiris geen PDF documenten om die figuren met JPEG 2000 compressie bevatten. Ga te werk zoals gewoonlijk: laad PDF bestanden in het geheugen zoals u vooraf gescande beelden - faxen, snapshots die u met uw digitaal fototoestel nam enz.
2 - 64 Bovendien kunt u aangeven welke bladzijden u wenst om te zetten. Als het uw bedoeling is om, zeg maar, één specifiek hoofdstuk te converteren uit een lange PDF publicatie, heeft het weinig zin om het hele boek in Readiris te laden... Geef de om te zetten bladzijden aan en u zult heel wat tijd besparen! (En ook dat geldt voor meerbladige TIFF beelden en DCX faxen.
2 - 65 GEBRUIKERSHANDLEIDING van de eigenschappen van de papieren documenten, de scanresolutie, helderheid enz. Als u dat wenst kunt u het eens proberen met het bestand SAMPLE.PDF in de beeldmap van Readiris... M EERDERE PAGINA ’ S HERKENNEN Na de herkenning wordt het gescand document opnieuw afgebeeld met zijn bevenstering; het document is beschikbaar voor verdere verwerking.
2 - 66 Kies "nee" om bladzijden toe te voegen aan het huidig document, kies "ja" om een nieuw document aan te maken. Dit laatste antwoord heeft hetzelfde effect als wanneer u het bevel "Nieuw Document" onder het menu "Bestand" gebruikt. Maar er is een veel efficiëntere manier om meerdere bladzijden over te nemen dan die één voor één te herkennen. U kunt namelijk gewoon meteen meerbladige documenten verwerken.
2 - 67 GEBRUIKERSHANDLEIDING Klik nu op de knop "Scannen" om het scannen aan te vangen. Klik op "Afbreken" in het dialoogvenster voor intervalscannen om het automatisch scannen stop te zetten. Readiris is overigens erg flexibel: u kunt het scaninterval afbreken om onmiddelijk te scannen en het interval bevriezen om een telefoontje te beantwoorden! Klik op "Pauseren" in het dialoogvenster voor intervalscannen om de scanpauze te bevriezen; klik op "Verdergaan" wanneer u opnieuw klaar chapter2.
2 - 68 bent om verder te gaan. Of klik op "Nu Scannen" in het dialoogvenster om een bladzijde meteen te scannen: de pauze tussen twee bladzijden wordt afgebroken! U kunt ook meerdere vooraf gescande beeldbestanden openen. Om meerdere beeldbestanden in het geheugen te laden, selecteert u het eerste beeldbestand en houdt u de Ctrl toets ingedrukt terwijl u extra beeldbestanden selecteert.
2 - 69 GEBRUIKERSHANDLEIDING U kan zelfs meerdere vooraf gescande beelden van de Windows Verkenner naar het Readiris venster slepen! En ook hier geldt: alle beeldbestanden die u naar Readiris sleept vullen het huidig document aan tot u het commando "Nieuw Document" aanklikt. Readiris sorteert de beelden automatisch - beeld 001.tif gaat vooraf aan beeld 002.tif dat vooraf gaat aan beeld 003.tif enz.
2 - 70 bestand voor alle beelden. En wanneer u documenten scant , geeft het documentpaneel aan welk scannermodel u hiervoor gebruikt. Sleep de cursor in de titelbalk van het documentpaneel om de breedte van een kolom te wijzigen. (U kunt de volgorde van de kolommen in het documentpaneel echter niet wijzigen.) En dan is er nog dit: houd uw muiscursor boven een kolom wanneer die niet breed genoeg is om alle data af te beelden: een tooltip geeft de data helemaal weer.
2 - 71 GEBRUIKERSHANDLEIDING De huidige bladzijde wordt beklemtoond in het documentpaneel en in de paginaknoppenbalk; ze wordt tevens vermeld in de titelbalk van Readiris. Om een bladzijde te wissen, houdt u de muiscursor boven die bladzijde in het documentpaneel en drukt u op de Del toets. Of u houdt uw muiscursor boven de miniatuur van de bladzijde in de paginaknoppenbalk en u drukt op Del.
2 - 72 Niet dat u alle bladzijden moet afdrukken: met het documentpaneel (en met de overeenkomstige bevelen in het menu "Bewerken" en de contextuele commando’s op de paginaknoppenbalk) kunt u bepaalde bladzijden (tijdelijk) negeren. Klik gewoon op het paginanummer in het documentpaneel om een bladzijde uit te sluiten van het druk- (en OCR-)proces. Klik nogmaals om ze weer in te sluiten. Omwille van de flexibiliteit biedt het menu "Bewerken" nog enkele handige bevelen die op alle bladzijden tegelijk slaan.
2 - 73 GEBRUIKERSHANDLEIDING (De uitsluiting van bladzijden is ook van toepassing op de herkenning: wanneer u de herkenning start, worden de (tijdelijk) uitgesloten bladzijden niet herkend!) Open het beeldbestand MULTIPAGE.TIF en voer de herkenning uit. De bladzijden worden één na één afgebeeld, de titelbalk van Readiris geeft het paginanummer aan. chapter2.
2 - 74 Als het interactief leren ingeschakeld is, doorloopt u de herkenning en de leerfase voor elke bladzijde. De woordenboekmodus "nieuw" wordt gebruikt voor de eerste bladzijde, de toevoegingsmodus voor de volgende bladzijden. Door op de knop "Einde" te klikken worden alle oplossingen van het systeem aanvaard zonder validatie door de gebruiker. Met andere woorden, het interactief leren wordt dan afgebroken voor alle bladzijden, het OCR-proces gaat verder in de automatische modus.
2 - 75 GEBRUIKERSHANDLEIDING Maar we beginnen met de navigatie. Om naar een bladzijde te gaan, klikt u erop in het documentpaneel of in de paginaknoppenbalk. (Of u houdt de muiscursor boven de miniatuur van de bladzijde, u roept het "Context" menu op door met de rechter muisknop te klikken en u gebruikt het commando "Bladzijde Selecteren".) Om naar de vorige bladzijde te verspringen kan u op de toets PageUp duwen, om naar de volgende bladzijde te gaan, op de toets PageDn.
2 - 76 Om een bladzijde naar boven te schuiven, een hoger paginanummer te geven, gebruikt u het commando "Bladzijde Omhoog Verplaatsen", om een bladzijde naar beneden te verschuiven, gebruikt u het commando "Bladzijde Omlaag Verplaatsen". Om een bladzijde te verhuizen, namelijk ze een heel andere plek te geven in het document, sleept u haar pictogram naar een andere locatie. chapter2.
2 - 77 GEBRUIKERSHANDLEIDING M ET EEN NIEUW DOCUMENT BEGINNEN Met het bevel "Nieuw Document" onder het menu "Bestand" sluit u het huidig document af. Dit commando wist alles uit het geheugen. Het in het geheugen geladen document (dat één of meerdere bladzijden bevat) wordt gewist. U bent nu klaar om een nieuw document aan te maken. chapter2.
2 - 78 Maar u kunt ook met een nieuw document beginnen vanuit het huidige document. Zolang de herkenning niet werd uitgevoerd, veronderstelt het systeem dat u nog bladzijden aan het document wilt toevoegen. U kunt bijvoorbeeld alle bladzijden in de documentinvoer inscannen, de documentdoorvoer bijvullen en opnieuw beginnen. Of u scant enkele documenten en voegt daar enkele beeldbestanden, zeg maar faxen, aan toe.
2 - 79 GEBRUIKERSHANDLEIDING De huidige systeeminstelling - taal, herkenningsmodus, lettertekentype enz. is van toepassing. Het OCR-resultaat wordt naar het klembord gestuurd als lopende, niet geformatteerde tekst. chapter2.
2 - 80 DE UITVOER OPMAKEN Een tekst opslaan of uitvoeren houdt meer in dan een uitvoermethode kiezen of een bestandsnaam opgeven voor de tekstuitvoer. U moet ook een tekstformaat selecteren en de lay-out van de herkende tekst gaan bepalen. Kortom, u moet beslissen waar u met de tekst heen wilt eer u de herkenning uitvoert. Sommige opties van de "Formaat" knop laten u toe om het uitzicht van de uitgevoerde tekst te beïnvloeden.
2 - 81 GEBRUIKERSHANDLEIDING (De "Formaat" knop bevat tevens formatteeropties die we nog niet besproken hebben - we zullen dit straks doen.) UW SCANNER INSTELLEN Laten we uw scanner gaan instellen. We veronderstellen nu wel dat uw scanner en de nodige stuurbestanden goed werden geïnstalleerd. Als uw Readiris licentie gebundeld is met een scanner, kan deze stap overbodig blijken omdat uw scanner dan allicht al onder Readiris geconfigureerd is. Klik op de "Scanner" knop in de hoofdknoppenbalk.
2 - 82 Wanneer u de optie "" (beeld) als “scanner” selecteert, fungeren vooraf gescande beelden ten allen tijde als beeldbron – u hoeft zelfs de schijf niet te selecteren met de knop "Bron" op de hoofdknoppenbalk. De knop "Configureren" is enkel beschikbaar wanneer uw scanner het toelaat. Hij geeft toegang tot sommige geävanceerde scanparameters; bij Twain scanners kunt u deze knop gebruiken om de Twain bron te selecteren. (U kunt dat ook met het commando "Bron Selecteren" onder het menu "Bestand".
2 - 83 GEBRUIKERSHANDLEIDING De optie "Omkeren" tenslotte laat de scanner volledig “negatieve” beelden laten aanmaken in de zwart-wit scanmodus - activeer deze optie om bladzijden te verwerken met witte tekst op een zwarte achtergrond. Het automatisch scannen met een interval hebben we al besproken. Dit is een erg efficiënte manier om meerbladige documenten te verwerven wanneer uw vlakbedscanner niet is uitgerust met een documentdoorvoer.
2 - 84 Readiris creëert een zwart-witte kopie van elk kleur- en grijswaardenbeeld. De software maakt daarbij gebruik van intelligente routines, zodat zelfs de moeilijke gevallen worden opgelost. Hieronder ziet u hoe ons “lastig” beeld wordt omgezet... Om de zwart-witte versie van een gescand beeld af te beelden, schakelt u de optie "Document in Kleur Afbeelden" onder het menu "Bekijken" uit. chapter2.
2 - 85 GEBRUIKERSHANDLEIDING Maar eigenlijk krijgt u geen zwart-wit beelden op het scherm te zien - zelfs niet wanneer u inderdaad zwart-witbeelden scant! Dat komt omdat Readiris de beelden optimaliseert voor een uitstekende leesbaarheid. I.R.I.S.’ gespecialiseerde hoge-resolutie displaytechniek zet zwart-wit beelden om in grijswaardenbeelden. Grijswaarden- en kleurbeelden daarentegen worden zachter gemaakt. chapter2.
2 - 86 Dit alles zorgt ervoor dat u niet hoeft in te zoomen, zelfs op een draagbare PC met een LCD scherm of op een desktop-PC met een bescheiden scherm. Zoom in op ware grootte (of hoger) om het “ruwe” beeld te bekijken zoals het werd gescand. A NDERE APP ARA TEN , ANDERE RESOLUTIE APPARA ARATEN Wat uw kleurmodus ook moge wezen, kies een resolutie van 300 dpi voor normale toepassingen en de hogere resolutie van 400 dpi voor kleine druk (kleiner dan 10 punt) en wanneer het document erg gedegradeerd is.
2 - 87 GEBRUIKERSHANDLEIDING Daar optimale OCR een resolutie vereist tussen 300 dpi en 400 dpi, waarschuwt Readiris u wanneer u beelden poogt te herkennen met een resolutie die lager ligt dan 200 dpi of hoger dan 800 dpi. Noteer dat de beeldresolutie van dergelijke beelden rood is gemarkeerd in het documentpaneel. Readiris kan scans met teveel details automatisch corrigeren! Activeer hiervoor de optie "Resolutie Optimaliseren voor Herkenning" in de scannerinstelling.
2 - 88 Wanneer de beelden werden aangemaakt met een digitale camera in plaats van een scanner, moet u een speciale optie inschakelen. Ook deze optie is van toepassing op rechtstreekse scans en beelden die u opent. Door dit te doen verbetert u de kwaliteit van het beeld eer de herkenning plaatsvindt.
2 - 89 GEBRUIKERSHANDLEIDING Selecteer eerst en vooral de hoogst mogelijke resolutie. Schiet bijvoorbeeld plaatjes van 2.600 x 2.000 pixels met uw fototoestel van 5 MP wanneer u ook beelden van 2.100 x 1.550 en van 1.600 x 1.200 pixels kunt schieten. Activeer tevens de “macromodus” van uw camera zodat u closeups neemt. Documenten fotograferen betekent immers altijd dat u closeups neemt. (Deze modus werd eigenlijk ontworpen om bloemen, insecten enz. te fotograferen.
2 - 90 Schakel het flitslicht uit wanneer u glanzend papier fotografeert, zoniet kan het beeld veel te licht uitvallen. Door de bank genomen kunt de helderheid en het contrast van een digitale camera aan de omgeving aanpassen - er zijn vaak aparte instellingen voor daglicht, kunstlicht, neonlicht enz. (Sommige camera’s kunt u zelfs calibreren door een wit document te fotograferen!) Als u het even wilt proberen, kunt u het beeldbestand DIGITAL.
2 - 91 GEBRUIKERSHANDLEIDING S TANDAARD INSTELLING BEW AREN BEWAREN Stel de scanparameters goed in en klik op het commando "Standaard Instelling Opslaan" onder het menu "Bestand" om de actuele instellingen te bewaren als chapter2.
2 - 92 standaard instelling voor verder gebruik. (En als ook die instelling verkeerd is, kunt u nog altijd terugkeren naar de fabrieksinstelling met het corresponderende bevel...) Configuratiebestanden bevatten meer dan enkel de scanopties: ze bepalen ook of u het interactief leren gaat gebruiken, welke taal de documenten bevatten, welke documenteigenschappen u toepast, welke uitvoermethode en lay-outopties u gebruikt - bijvoorbeeld lopende tekst naar WordPad sturen enz.
2 - 93 GEBRUIKERSHANDLEIDING "Informatie" onder het "Bestand" menu aanklikken om een praktisch overzicht te krijgen. Dit bevel geeft tevens de informatie die u op het documentpaneel vindt weer voor alle bladzijden. D OCUMENTEN SCANNEN Nu de scanner is ingesteld, zijn we klaar om te gaan scannen. Wat het scannen betreft, moeten we wel op enkele punten wijzen. Besteed enige aandacht aan de regelkromming.
2 - 94 zullen rechtgezet worden. Beperkte regelkromming wordt daarbij genegeerd; deze optie is standaard uitgeschakeld. Indien u vergat deze optie in te schakelen, gebruikt u de knop "Bladzijde Rechtzetten" op de beeldknoppenbalk (of het overeenkomstig commando onder het menu "Actie") om de regelschuinte te corrigeren. Een blad rechtzetten duurt enkele seconden.
2 - 95 GEBRUIKERSHANDLEIDING knop "Opties" (of onder het menu "Instelling") en Readiris zal wanneer dat nodig is de richting van de bladzijde corrigeren. U kunt dit alles eens proberen met het beeldbestand DESKEW.JPG in de Readiris beeldmap. Schakel de opties "Bladzijden Rechtzetten" en "Oriëntatie Bladzijden Detecteren" in eer u het beeld laadt en Readiris zal de toren van Pisa “herstellen” zoals we die graag zien. chapter2.
2 - 96 Noteer ook dat het documentpaneel aangeeft welke regelschuinte werd gecorrigeerd en welke rotatie werd uitgevoerd! chapter2.
2 - 97 GEBRUIKERSHANDLEIDING DE GESCANDE BEELDEN AANP ASSEN AANPASSEN Zoals al aangestipt werd, worden krachtige, intelligente routines gebruikt om kleur- en grijswaardenbeelden automatisch om te zetten in zwart-wit beelden. Maar de gebruiker kan, mocht dit nodig blijken, het beeld verder optimaliseren voor het OCR-proces. Dit gebeurt met het bevel "Beeld Aanpassen" onder het menu "Actie".
2 - 98 De optie "Kleurbeeld Verzachten" maakt de kleur- en grijsbeelden homogener door ze “af te vlakken”, door beperkte verschillen in intensiteit te weg te nemen. Het resultaat van deze bewerking is dat er een groter contrast wordt gecreëerd tussen de voorgrond - de tekst - en de achtergrond - een steunkleur, foto enz. Deze optie optimaliseert het beeld voor de herkenning.
2 - 99 GEBRUIKERSHANDLEIDING is soms de enige manier om tekst te onderscheiden van de gekleurde achtergrond! Hieronder ziet u een voorbeeld dat zonder verzachting gewoon onleesbaar is. Beelden verzachten kan ook wanneer u voorafgescande beeldbestanden in het geheugen laadt. En wat bedoelen we met de helderheid helderheid? De helderheid bepaalt de algemene klaarte van een beeld: wanneer u het beeld helderder maakt of verduistert slaat dat op alle pixels.
2 - 100 dat zelfs de voorgrond niet zichtbaar is in het gebinariseerd beeld! We verduisteren het beeld in die mate dat de tekst leesbaar wordt. Het contrast bepaalt het lokaal contrast tussen de donkere en lichte delen van het beeld. (De tekst is gewoonlijk donkerder dan de achtergrond - tenzij u natuurlijk geïnverteerde tekst herkent.) Hier moet u de karaktervormen netjes uit hun (gekleurde) achtergrond doen springen.
2 - 101 GEBRUIKERSHANDLEIDING hebt u een voorbeeld waarbij het zwart-wit beeld dramatisch werd verlicht - zij het dat we geen goede OCR-resultaten verwachten van dit beeld! Deze opties betreffen kleur- en grijsbeelden. De laatste optie, "Ruis Wegnemen", slaat exclusief op de zwart-wit beelden. “Ruis” wegnemen betekent dat de toevallige, “parasitaire” pixels uit het zwart-wit beeld worden verwijderd. chapter2.
2 - 102 Zorg ervoor dat u geen te grote vlekken uit het beeld verwijdert, want het zou wel eens kunnen voorkomen dat u de punten op de "i" wegneemt of delen van matrix letters wist! Dit is de beste manier om een beeld te optimaliseren: plaats het venster waarin u het beeld aanpast in een hoek van het scherm zodat u goed kunt beoordelen welk effect de aanpassingen die u uitvoert hebben op het beeld. Pas de parameters aan, klik telkens op "Uitvoeren" tot u een scherp en “proper” beeld op het scherm hebt.
2 - 103 GEBRUIKERSHANDLEIDING Merk op dat de OCR assistent begint te lopen telkens u Readiris opstart; u kunt dit vermijden door de optie "Wizard Activeren bij Opstarten" in het eerste scherm van de wizard uit te schakelen. (U kunt ook de gelijkwaardige optie onder het menu "Instelling" gebruiken.
2 - 104 tijdens de herkenning. De tabulatie en de uitlijning (links, gecentreerd, rechts en uitgelijnd) van elke tekstblok worden gerecreëerd. Ook de opsommingstekens (“bullets”) en de nummering worden herschapen. Alle e-mailadressen en URLs van webbladzijden worden gedetecteerd en als hyperlinks in de uitvoer geplaatst. De plaats van de kolommen, tekstblokken en figuren is gebaseerd op het origineel document.
2 - 105 GEBRUIKERSHANDLEIDING Klik op de "Formaat" knop op de hoofdknoppenbalk en kies ervoor het herkenningsresultaat naar Microsoft Word te zenden of selecteer het uitvoerformaat Word (*.doc), WordML (*.xml) of RTF (“Rich Text Format”). Activeer eveneens de lay-outoptie "Brondocument Hercreëren". (De optie "Paragrafen Herstellen" wordt standaard ingeschakeld om binnen de paragrafen chapter2.
2 - 106 “wordwrap” toe te passen.) (De tooltip van de "Formaat" knop geeft de gekozen uitvoermethode en het gekozen uitvoerformaat aan.) Of de opmaakreconstructie beschikbaar is, hangt af van de gekozen uitvoermodus. Sommige “arme” tekstformaten die “platte” tekst (“plain text”) genereren zoals Tekst (ANSI), MS-DOS Tekst (ASCII) enz. ondersteunen geen geavanceerde formatteercodes en kunnen dan ook geen “autoformattering” bieden.
2 - 107 GEBRUIKERSHANDLEIDING Samengevat, Readiris herkent niet alleen uw teksten, maar kan ze ook formatteren. OCR is tegenwoordig meer dan tekstherkenning, OCR is eigenlijk documentherkenning geworden! chapter2.
2 - 108 KOLOMMEN AUB, GEEN KADERS! De formatteeroptie "Kolommen Gebruiken in de Plaats van Kaders" bepaalt hoe de “autoformattering” plaatsvindt: de tekstblokken, tabellen en figuren kunnen in kaders of in editeerbare kolommen worden opgeslagen. Kaders zijn aparte “containers” zodat je meerdere tekstblokken, figuren en tabellen op een bladzijde kan plaatsen. Bij kolommen ligt dat anders: de tekst vloeit natuurlijk van de ene kolom over in de volgende kolom.
2 - 109 GEBRUIKERSHANDLEIDING De optie "Kolomeindes Invoegen" verfijnt het gebruik van heuse kolommen verder: deze optie bepaalt of u een kolomgrens toevoegt aan het einde van elke kolom. chapter2.
2 - 110 Wanneer er kolomgrenzen toegevoegd worden, blijft elke tekst u die u wijzigt, toevoegt of verwijdert binnen de kolom; tekst zal nooit vanzelf over een kolomgrens heen vloeien. Alle tekst die na een kolomgrens komt verschuift naar het begin van een volgende kolom! Schakel deze optie in wanneer u de kolomgrenzen wilt behouden waar die in het brondocument werden gedetecteerd - welke wijzigingen u later ook aanbrengt na de herkenning.
2 - 111 GEBRUIKERSHANDLEIDING Selecteer de toepasbare en uitgesloten bladformaten: de toepasbare papierformaten kunnen worden gebruikt om de herkende documenten te formatteren, de uitgesloten formaten worden nooit gebruikt. Orden de toepasbare formaten: Readiris doorloopt de verschillende papierformaten in de aangegeven volgorde en past het eerste papierformaat toe dat voldoende groot is om het gescande document te bevatten. De knop "Standaard" past de standaard waarden opnieuw toe.
2 - 112 T EKSTFORMA TTERING , EKSTFORMATTERING DEEL 2 De andere lay-outopties zijn "Lopende Tekst Creëren" en "Woord- en Paragraafformattering Behouden". Zoals het pictogram aan de rechterkant illustreert, betekent lopende tekst creëren dat u een niet geformatteerde, “continue” tekst aanmaakt. De tekst wordt hernomen, maar van zijn lay-out wordt abstractie gemaakt. Gebruik deze optie wanneer u gewoon een document wilt overnemen als broodtekst maar geen belang hecht aan zijn opmaak.
2 - 113 GEBRUIKERSHANDLEIDING T EKST MEERDERE KEREN UITVOEREN Overigens kunt u de herkenningsresultaten meerdere keren exporteren zonder de herkenning opnieuw uit te voeren! Verander het tekstformaat en de formatteeropties met de knop "Formaat" en klik opnieuw op de knop "HerkennenOpslaan". Deze keer wordt er geen herkenning uitgevoerd - tenzij u nieuwe vensters tekende of bestaande vensters wijzigde.
2 - 114 Maar u kunt met Readiris ook figuren en opslaan zonder aan tekstherkenning te doen! En aangezien Readiris zwart-wit beelden, grijswaarden en kleuren ondersteunt, kunt u probleemloos zwart-wit grafisch materiaal en foto’s scannen. Hoe? Teken een grafische zone rond de illustratie, de tekening enz. die u wilt opslaan. Dat gebeurt op dezelfde wijze als wanneer u tekst- en tabelvensters tekent, alleen selecteert u nu de tool "Grafisch Venster".
2 - 115 GEBRUIKERSHANDLEIDING Om een figuur naar het klembord te sturen eerder dan die op te slaan in een beeldbestand, klikt u met de rechter muisknop boven een grafisch venster en selecteert u het bevel "Kopiëren als Figuur": de grafische zone onder de muiscursor is klaar om geplakt te worden! chapter2.
2 - 116 G EKLEURDE KOLOMMEN , KADERS ENZ . HERSCHEPPEN Readiris biedt nog een andere manier om uw uitvoerdocumenten wat kleur mee te geven: de optie "Kleuren van Achtergrond Behouden" behoudt de kleurvlakken (of “steunkleuren”) die op een bladzijde voorkomen doorheen de herkenning. (Deze optie verplicht u er meteen ook toe de kleuren van de tekst te bewaren.) chapter2.
2 - 117 GEBRUIKERSHANDLEIDING U krijgt één uniforme achtergrondkleur - als die tenminste in het gescande document voorkomt - per paragraaf. Deze optie is van toepassing op Word (*.doc), RTF (“Rich Text Format”), WordML (*.xml) en HTML documenten. De details van bijv. een achtergrondfoto die de volle bladzijde bedekt worden deze keer niet bewaard; alleen de steunkleur van een tekstkader wordt wel behouden. (Ga uw gang met het voorbeeldbestand COLORS.JPG als u het eens zelf wil proberen...) chapter2.
2 - 118 DE KLEUREN VAN DE TEKST BEHOUDEN En dan is er nóg een manier om kleur toe te voegen aan uw uitvoerdocumenten: u kunt de kleuren van de tekst behouden! De formatteeroptie "Kleuren van Tekst Behouden" zorgt ervoor dat de oorspronkelijke kleuren van de tekst door de herkenning raken: een rode titel zal rood blijven in de uitvoer, na de herkenning enz. chapter2.
2 - 119 GEBRUIKERSHANDLEIDING chapter2.
2 - 120 F AXEN HERKENNEN EN UITGESTELDE HERKENNING Gescande documenten als beeldbestanden bewaren opent een uitdagende mogelijkheid: u kunt de volledige pagina bewaren en er later uitgestelde OCR op uitvoeren. Dat is eigenlijk wat we eerder deden met de vooraf gescande beelden van onze oefeningen. Scan een document. Selecteer het commando "Volledige Bladzijde als Beeld Opslaan" onder het menu "Bestand" om een enkele bladzijde op te slaan.
2 - 121 GEBRUIKERSHANDLEIDING Selecteer het commando "Alle Bladzijden als Beeld Opslaan" om een meerbladig document op te slaan. Er zijn nu slechts twee bestandsformaten beschikbaar: PDF en het meerbladig TIFF formaat.
2 - 122 (“normale kwaliteit”), 200 x 200 dpi (“fijne kwaliteit”) en 200 x 400 dpi (“superfijne kwaliteit”) - en optimaliseert deze beelden vóór de herkenning automatisch om een zo goed mogelijk herkenningsresultaat te behalen. Niettemin is het een goed idee om uw correspondenten te vragen faxen te sturen met de “fijne” kwaliteit - deze faxen hebben de hogere resolutie van 200 dpi en zullen een beter OCR resultaat opleveren.
2 - 123 GEBRUIKERSHANDLEIDING Gebruik de knop "Sorteren" om deze tabel te selecteren. Voer de herkenning uit met om het even welk lay-outniveau. Het maakt immers niets uit of u lopende tekst creëert, de woord- en paragraafformattering behoudt of het brondocument herschept: de tabel wordt altijd hernomen! Open uw tekstverwerker om het resultaat even te bekijken: de cellen en randen werden één voor één door Readiris herschapen! (U had trouwens de overige tekstblokken in de uitvoer kunnen insluiten.
2 - 124 Nu de “niet omkaderde” tabel. Die heeft geen randen rond de cellen, maar niettemin heeft de pagina-analyse haar gedetecteerd. En er is nog een interessant aspect: de inhoud van deze tabel is strikt numeriek! chapter2.
2 - 125 GEBRUIKERSHANDLEIDING Voor een optimale OCR precisie, beperkt u de herkenning best tot de numerieke symbolen met de "Taal" knop. (De numerieke modus bevat niet enkel de getallen “0” tot “9”, maar ook de symbolen “+”, “*”, “/”, “%”, “,” (komma), “.” (punt), “(”, “)”, “-”, “=”, “$”, “£”, “¥” en het “•” symbool.) chapter2.
2 - 126 Aangezien u dit alleen kunt doen wanneer de tabel geen alfabetische symbolen bevat - zoniet worden de tekstdelen niet goed herkend - kunnen we de numerieke modus activeren wanneer we enkel deze tabel herkennen, maar niet wanneer we de rest van het document inlezen. (Gebruik nogmaals de knop "Sorteren" om enkel deze tabel te selecteren.) Deze keer zullen we het herkenningsresultaat rechtstreeks naar het rekenblad Microsoft Excel sturen, we kiezen dus Excel als doeltoepassing met de "Formaat" knop.
2 - 127 GEBRUIKERSHANDLEIDING Het kan voorkomen dat u niet omkaderde tabellen ontmoet die de paginaanalyse niet als tabelvensters markeert omdat er teveel ruimte zit tussen de kolommen. Readiris tracht namelijk de verwarring met tekstkolommen te vermijden. Om tabelvensters manueel te creëren, klikt u op de tool "Tabelvenster" en gaat u zoals gewoonlijk te werk. De tooltip van de knop "Tabelvensters" geeft het aantal tabelvensters aan.
2 - 128 Enkele opties zijn uitsluitend op dit tabelformaat van toepassing. De optie "Alle Tekst buiten de Tabellen Negeren" bewaart de tabellen en negeert de andere herkenningsresultaten. De data binnen de tabel(len) worden hernomen; alle gegevens buiten de tabel(len) - tekstblokken, figuren, streepjescodes enz. - wordt door deze uitvoermodus genegeerd.
2 - 129 GEBRUIKERSHANDLEIDING Met deze optie kunt u zich ogenblikkelijk, zonder handmatige operaties bevrijden van de tekst rond de tabellen. Maar zelfs dan hebben we nog altijd twee tabellen op één bladzijde. Kunnen we die apart opslaan? Dat kan! Schakel de optie "Eén Werkblad Creëren per Tabel" in om elke tabel in een apart werkblad op te slaan.
2 - 130 opgeslagen - tenminste indien de optie "Cijfers in Getallen Omzetten" ingeschakeld is. De tekst binnen en buiten de tabellen blijft inderdaad gewoon... tekst! De optie "Cijfers in Getallen Omzetten" slaat het herkende cijfermateriaal op als getallen. U kunt dan inderdaad rekenkundige bewerkingen uitvoeren op die cellen. De tekstcellen (in om het even welke tabel) zijn immers niets dan... tekst! (Excel voert enkel wiskundige operaties - sommen en gemiddelden berekenen enz.
2 - 131 GEBRUIKERSHANDLEIDING H ANDGESCHREVEN TEKST HERKENNEN Tot nog toe hebben we documenten gescand, we hebben tabellen, faxen en plaatjes die we schoten met een digitaal fototoestel herkend, we hebben figuren opgeslagen en PDF bestanden omgezet. Readiris voegt nog een leuke leescapaciteit toe: de mogelijkheid om handgeschreven teksten te herkennen.
2 - 132 Wanneer u leesresultaten behaalt die niet optimaal zijn, kunt u uw schrijfstijl aanpassen en I.R.I.S.’ schrijfformulier gebruiken. Raadpleeg het on-line hulpsysteem van Readiris om de schrijfregels te ontdekken. Schrijf de hoofdletters duidelijk en met regelmatige trekken zodat uw handschrift gedrukte letters imiteert. (Merk vooral op hoe je A, G en Q hoort te schrijven!) Enkele eenvoudige tips leren u waarom er substituties optreden en hoe u die kunt vermijden. Het blanco schrijfformulier van I.
2 - 133 GEBRUIKERSHANDLEIDING We weten nu dus hoe we tijdens een vergadering notities kunnen neerpennen die door de “machine” gelezen kunnen worden. Maar hoe kunnen we die notities achteraf inlezen met Readiris? Teken een handschriftvenster rond de handgeschreven tekst en voer de herkenning uit. (Ga eens uw gang met het voorbeeldbestand HANDPRINTING.TIF.) chapter2.
2 - 134 De kenmerken van het document - de taal, het type letterteken en de karakterafstand - gelden niet voor handgeschreven tekst. U bent beperkt tot een elementaire Engelse - of moeten we zeggen “Latijnse”? - karakterset van blokletters. Interactief leren is evenmin van toepassing: het systeem trainen heeft geen zin in een context waarin iedereen zijn eigen handschrift heeft. (Zoals we al aanstipten is de ICR technologie gebaseerd op meer dan één miljoen schrijfstijlen...) chapter2.
2 - 135 GEBRUIKERSHANDLEIDING B ALKEN EN SP ATIES INLEZEN SPA En Readiris leest zelfs streepjescodes...! Streepjescodes die voorkomen in gescande beelden kunnen worden gelezen en in de uitvoerdocumenten worden opgenomen als herkende data. chapter2.
2 - 136 Streepjescodes zijn vastgesteld uit parallelle balken en spaties tussen die balken. Vooraf gedefinieerde combinaties van balken en spaties stellen specifieke karakters voor. Er zijn meerdere streepjescodestandaards, die heten in technische taal “symbologieën”. Readiris ondersteunt alle populaire symbologieën. Enkel streepjescode die gedrukt werden met een laserprinter of een inkjet printer hebben voldoende drukkwaliteit.
2 - 137 GEBRUIKERSHANDLEIDING Het bevel "Streepjescodes" onder het menu "Instelling" bepaalt welke types streepjescodes - het technische woord hiervoor is overigens “symbologie” - worden herkend, of de controlekarakters van bepaalde streepjescodes worden geverifieerd en of ze al dan niet worden verwijderd uit de leesresultaten. Gebruik de knop "Standaard" om de standaard instelling te herstellen. chapter2.
2 - 138 O N - LINE HULP RAADPLEGEN Hier eindigt onze rondleiding van Readiris. Het kan voorkomen dat bepaalde informatie van het laatste ogenblik niet in deze handleiding is opgenomen. We raden u dan ook aan om de on-line hulp te raadplegen als u meer wilt weten over Readiris. chapter2.
2 - 139 GEBRUIKERSHANDLEIDING Ga hiervoor naar het "Hulp" menu. Het commando "Hulpthema’s" en zijn versnellingstoets F1 laten u navigeren door de vele hulpbladzijden. De andere bevelen uit het menu "Hulp" vertellen u hoe u op onze productondersteuning kunt beroep doen, hoe u I.R.I.S. kunt contacteren, geven u rechtstreeks toegang tot de homepage van I.R.I.S. enz. chapter2.
2 - 140 chapter2.