Operation Manual
Readiris
TM
Corporate 12 – Gebruikershandleiding
57
HOOFDSTUK 10
D
OCUMENTEN HERKENNEN
INLEIDING
Om documenten te herkennen, maakt Readiris gebruik van
taalkundige informatie tijdens de herkenningsfase. Bijgevolg is
Readiris in staat tekst, tabellen, figuren, streepjescodes en
handgedrukte tekst te herkennen in allerlei soorten documenten.
Readiris verwerkt zelfs complexe teksten met kolommen,
documenten van lage drukkwaliteit, faxen, dot matrix afdrukken, en
slecht gescande en gekopiëerde documenten met te lichte of te
donkere lettertekens.
Readiris herkent 128 talen: alle Amerikaanse en Europese talen
worden herkend, inclusief de Centraal-Europese, Baltische en
Cyrillische talen alsook Grieks en Turks. Optioneel kan Readiris
Arabische, Farsi en Hebreeuwse documenten herkennen en vier
Aziatische talen - Japans, Vereenvoudigd en Traditioneel Chinees
en Koreaans. Readiris verwerkt ook gemengde alfabetten: de
software detecteert "Westerse woorden" die voorkomen in Griekse,
Cyrillische, Arabische, Hebreeuwse en Aziatische documenten -
vele niet-vertaalbare eigennamen en merknamen, enz. worden
immers vaak geschreven in het Latijnse alfabet.
Readiris is gebaseerd op de meest geavanceerde
herkenningstechnologieën. Omnifont herkenning wordt aangevuld
door zelflerende technieken. Het systeem is in staat nieuwe
karakters en woorden te leren via contextuele en taalkundige
analyse. Dat betekent dat de precisie van het herkenningssysteem
steeds verbetert.