In één van onze eerdere blogs, hebben we het onderwerp “Wat is het verschil tussen digitale en elektronische factuurverwerking?” behandeld. Hierbij zijn drie soorten facturen ter sprake gekomen: de papieren, de digitale (PDF) en de elektronische factuur (XML). Om facturen digitaal te kunnen verwerken, wordt op zowel papieren als digitale facturen OCR (tekst-/factuurherkenning) toegepast. Een veelgehoorde term, maar wat is OCR eigenlijk?
OCR (Optical Character Recognition), ook wel tekstherkenning genoemd, is een techniek om cijfer- en letterreeksen van een document af te lezen. Het herkennen van cijfers- en letterreeksen van een document is op zichzelf nog niet erg waardevol. De herkende reeksen worden pas waardevol op het moment dat ze op de juiste manier geïnterpreteerd worden. Hiermee worden herkende reeksen vertaald naar relevante waardes, die vervolgens weer gebruikt worden voor de verwerking van een document in een organisatie. Een voorbeeld interpretatie is de herkenning van een crediteur van een factuur aan de hand van het bankrekeningnummer. In deze blog beperken we ons verder alleen tot het toepassen van OCR op facturen, ook wel factuurherkenning genoemd.
Factuurherkenning kan op twee manieren worden toegepast; Template- of FreeForm. De meeste oplossingen voor het digitaliseren van je inkoopfacturen, bieden één van deze twee mogelijkheden aan. Beide varianten hebben voor- en nadelen, maar om te beginnen; Wat betekenen beide termen eigenlijk en wat zijn de verschillen tussen beide varianten?
Template
De eerste vorm die in deze blog behandeld wordt, is template factuurherkenning. Een template is een sjabloon waarin de opmaak en indeling van binnenkomende facturen (per leverancier) wordt vastgelegd. Door het opstellen van een template, wordt vooraf vastgelegd waar de verschillende gegevens van een factuur afgelezen kunnen worden.
Het werken met template factuurherkenning kent echter drie nadelen:
- Een template is nog geen garantie op goede herkenning. Een template geeft alleen aan waar een waarde gevonden kan worden. Het is echter nog geen garantie dat de waarde ook goed herkend wordt.
- Per leverancier is een andere template vereist. Het aanmaken van templates tijdens de implementatie van een systeem is tijdrovend. Het leren maken van templates overigens ook.
- Templates zijn onderhoudsgevoelig. Je bent eigenlijk nooit helemaal klaar met templates maken, omdat het crediteurenbestand wel eens wijzigt en de opmaak van facturen door de jaren heen ook kan veranderen.
Templates kunnen zeer waardevol zijn indien je niet zoveel leveranciers hebt, die wel veel facturen toesturen. Op deze manier heb je een hoge mate van herkenning met een beperkte inspanning voor het inrichten van de templates. Zoals je hierboven hebt kunnen lezen, kennen templates echter ook nadelen. Dit brengt ons meteen op een andere variant, freeform factuurherkenning, waarbij enkele van deze nadelen worden ondervangen.
Freeform
Freeform factuurherkenning is een vorm van herkenning waarbij je geen templates hoeft aan te maken voordat je facturen gaat scannen. Dit betekent dat je direct kunt starten met het scannen van facturen en dat de gegevens op een factuur direct herkend worden.
Voor het gebruik van freeform herkenning, is de kwaliteit en de volledigheid van je stamgegevens in de financiële administratie wel van groot belang. Indien de stamgegevens, zoals BTW- en bankrekeningnummer, up-to-date zijn, worden crediteuren direct op de juiste manier herkend. Indien de juiste crediteur herkend is, krijg je bovendien direct het juiste boekingsvoorstel te zien op basis van de stamgegevens in jullie financiële administratie.
Optimalisatie van freeform herkenning is in veel gevallen mogelijk in de vorm van training. Met behulp van training wordt een specifieke locatie op een factuur vastgelegd voor het herkennen van een individuele waarde van een factuur. Door training kan ook een verbetering worden gerealiseerd in het aantal herkende waardes van een factuur. Freeform- en template herkenning zijn echter beiden ook voor een deel afhankelijk van derden, zoals: de kwaliteit van de onderliggende OCR-techniek, het contrast tussen tekst en achtergrond op de factuur en ten slotte de scankwaliteit (minimaal 300 DPI).
Conclusie
Waar voorheen facturen handmatig ingevoerd werden in de financiële administratie, kan er nu tijd en geld bespaard worden door dit proces te automatiseren. Met behulp van factuurherkenning worden relevante gegevens automatisch van de facturen afgelezen. De herkenning van de verschillende waardes helpt enerzijds bij het sneller en efficiënter verwerken van facturen in de financiële administratie, maar anderzijds kunnen facturen ook, op basis van de verschillende herkende kenmerken, eenvoudig teruggevonden worden in een digitaal archief.
De juiste keuze bij de inrichting van factuurherkenning, kan hierbij van grote invloed zijn. Blue10 werkt op basis van freeform factuurherkenning. Je hoeft vooraf geen templates aan te maken per leverancier en je kunt direct starten met het digitaliseren van je inkoopfacturen. Wel zo prettig, vind je ook niet?