Informatie aanvragen

Heeft u een vraag? Laat het ons weten en we nemen binnen één werkdag met u contact op!

Geautomatiseerde dataverwerking

Om tot een geautomatiseerde dataverwerking van uw gescande documenten te komen, worden de afbeeldingen van uw documenten eerst door middel van OCR geschikt gemaakt. Aan de hand van deze data kunnen uw documenten (geautomatiseerd) verwerkt worden.

Herkenning

Er zijn verschillende manieren om tot een betrouwbare data herkenning te komen. De technieken die wij hiervoor gebruiken zijn OCR (Optical Character Recognition), ICR (Intelligent Character Recognition), Barcode herkenning en combinaties van deze methoden.

Afhankelijk van de gewenste project specificaties en eisen zullen we de meest optimale methodes met u doornemen en kunnen onze adviseurs u hierin verder adviseren.

ICR

Intelligent Character Recognition (ICR) wordt gebruikt om op een intelligente manier tekst te kunnen herkennen en /of het document (geautomatiseerd) aan uw werkprocessen toe te voegen.

De tekst wordt eerst herkend door middel van OCR, om vervolgens, afhankelijk van de project / document specificaties, ‘intelligentie’ toe te voegen.

ICR bij gestructureerde documenten

ICR kan eenvoudig toegepast worden op gestructureerde documenten.

Bijvoorbeeld facturen. Ook al zijn facturen verschillend van elkaar, er zijn ook behoorlijk wat overeenkomsten, omdat die verplicht zijn op een factuur. Wanneer dit het geval is, betreft het een gestructureerd document en kan ICR een uitkomst bieden.

Bijvoorbeeld: Op een factuur staat o.a. het adres van de leverancier, door logica toe te voegen kan eenvoudig bepaald worden welke waarden waar te vinden zijn. Dit doet de software door formateringen te herkennen. Bijvoorbeeld een postcode (9999 AA) of een e-mailadres door een ‘@’ te zoeken en de tekst voor en na dit karakter mee te nemen. Of line items, omdat ze een kolom formatering hebben.

In dit geval kan de software verder aangescherpt worden door gebruik te maken van uw debiteuren lijst van uw financiële administratie, om een hogere mate van kwaliteit te behalen.

De software kan ook leren. Wanneer bijvoorbeeld een factuur gescand wordt en eenzelfde factuur al eerder behandeld is, kan de software aan de hand van de vorige factuur van deze leverancier herkennen waar hij bepaalde waardes binnen de factuur terug kan vinden (denk daarbij aan factuurnummer, totaal bedrag, enzovoort). Door deze waardes in een context te plaatsen, kan er nauwkeuriger herkend worden.

Dit soort logica is uiteraard bij elke vorm van gestructureerde documenten toe te passen. Of het nu gaat om uren lijsten, order lijsten, facturen of iedere andere vorm van gestructureerde documenten.

ICR bij ongestructureerde documenten

Ongestructureerde documenten zijn documenten waarbij u niet zeker weet welke waarden erin voorkomen of aan welke procesregels deze documenten voldoen. In deze gevallen biedt ICR eveneens een oplossing door ook de context te scannen.

Geautomatiseerde classificatie

Dit is erg handig wanneer uw documenten automatisch geclassificeerd moeten worden, maar uw documenten zijn niet gesorteerd per type document. Dan kan door middel van context herkenning bepaald worden om wat voor type document het gaat.

Bijvoorbeeld, wanneer de scan in de titel en/of koppen veelal de woorden “Manual”, “Handleiding” of “Gebruikershandleiding” teruggevonden wordt, kan de software met enige zekerheid vaststellen dat het hier om een gebruikershandleiding gaat. Door de waarden voor of na de gevonden tekst te doorzoeken (eventueel bijgestaan door een referentietabel) kan eveneens vastgesteld worden voor welk (type) product het een handleiding is. Het kan zelfs nog verder geoptimaliseerd worden door ook een datum en/of versie nummer erbij te zoeken, zodat dubbele classificaties uniek gemaakt kunnen worden.

Geautomatiseerde indexatie

Wanneer gebruik gemaakt kan worden van referentietabellen kan het document verder geïndexeerd en/of verrijkt worden met tags.

Bijvoorbeeld, wanneer u lijsten met patiënt relatienummers, personeelsnummers, productnamen, of iets dergelijks, aan kan leveren, kan de software zoeken op deze waarden (al dan niet op basis van de classificatie). Wanneer dan een patiënt relatienummer, personeelsnummer, productnaam, of iets dergelijks, gevonden wordt, kan deze toegevoegd worden aan de meta data van het bestand.

Hierdoor worden uw documenten direct geschikt gemaakt voor uw werk processen en kunnen de documenten automatisch toegevoegd worden aan het desbetreffende patiënt dossier, personeelsdossier of product documentatie.

Barcode herkenning

Barcode herkenning is al behoorlijk oud en heeft zich inmiddels al aardig bewezen. Het voordeel van Barcode herkenning is dat deze betrouwbaarder is dan tekstherkenning (OCR). Het nadeel is dat de barcode niet ‘leesbaar’ is. Wanneer er dus een barcode beschadigd is en niet herkend kan worden, stopt het proces. Om dit te ondervangen voegen wij altijd de barcode waarde toe aan de barcode, zodat deze eventueel nog handmatig ingevoerd kan worden.

Wanneer bijvoorbeeld op uw formulieren gebruik gemaakt wordt van een relatienummer of referentienummer en dit een essentieel onderdeel is van uw formulier of document, kunt u deze beter als barcode af laten drukken zodat deze snel en betrouwbaar herkend kan worden.

Aan de hand van Barcodes kunnen we o.a.:

  • Classificatie toekennen
  • Indexering toepassen
  • Bestandnamen / Folder namen genereren
  • Bestand scheiding toepassen
  • Metadata aan het document toevoegen
  • Workflows aansturen

Kwaliteit en betrouwbaarheid

Voor het aansturen of voeden van uw processen is een zekere betrouwbaarheid noodzakelijk. Voor het proces start is het daarom belangrijk om kwaliteitseisen goed met elkaar af te stemmen en waar nodig bij te sturen. Dit doen wij door steekproefsgewijs controles uit te voeren op de herkende data. Wanneer uit onze steekproeven blijkt dat de afgesproken betrouwbaarheid niet gehaald kan worden stellen we onze controles zodanig bij dat deze wel gehaald worden.

Stappenplan voor geautomatiseerde dataverwerking

1Inventarisatie

Voordat we het digitaliseringsproces starten, inventariseren wij de brondocumenten. Ook bespreken we de wensen en eisen tot in detail. Hierin betrekken wij onze specialisten, die elk vanuit zijn of haar eigen discipline input geven.

2Projectplan

GMS maakt voor ieder project een speciaal projectplan. Het is, zeker als het gaat om dossiers en documenten, van essentieel belang om het project, met daarbij de eisen en wensen, goed af te kaderen. Data, afspraken en deadlines worden hierin verwerkt.

3Herkenning

GMS digitaliseert conform de eisen. Wanneer dit afgesproken is, voert GMS het project uit conform de eisen van substitutie. Extra controles op inhoud, kwaliteit en indexering worden gepleegd om te voldoen aan de substitutie-eisen.

4Nabewerking

De gedigitaliseerde bestanden en data worden conform wensen en eisen bewerkt en gerapporteerd aan de opdrachtgever, zodat deze naadloos aansluiten op uw werkprocessen.
Op zoek naar een geautomatiseerde dataverwerking? Door middel van onze geavanceerde software maakt GMS het mogelijk

Inventarisatie

GMS is specialist op het gebied van digitalisering en met onze geavanceerde herkenningssoftware maken wij het mogelijk om uw documenten (volledig) geautomatiseerd te verwerken. Of het nu gaat om classificering, indexering of het extraheren van bepaalde data uit documenten. GMS maakt het mogelijk.

Samen met u kijken we naar de documentstromen en bepalen we samen welke gegevens nodig zijn voor uw processen en welke kwaliteitsnormen daarbij passen. Op deze manier zijn we in staat de meest kosten efficiënte oplossing aan te bieden.

Diversiteit

Uw documenten bestaan vaak uit veel verschillende type documenten met diverse informatie. Vaak gaat het om een combinatie van gestructureerde- en ongestructureerde documenten. GMS is in staat om al uw documenten volledig automatisch te ordenen (classificeren) en eventueel te indexeren (vindbaar maken).

Na deze classificatie kunnen we per documenttype vervolgstappen aan het proces toevoegen. Waaronder bijvoorbeeld geavanceerde databewerkingen of extracties. Hierdoor kunnen uw processen direct gevoed worden. Onze adviseurs staan voor u klaar om u hierin te adviseren.

Dataherkenning

Er zijn verschillende manieren om tot een betrouwbare data herkenning te komen. De technieken die wij hiervoor gebruiken zijn OCR (Optical Character Recognition), ICR (Intelligent Character Recognition), Barcode herkenning en combinaties van deze methoden.

Afhankelijk van de gewenste project specificaties en eisen zullen we de meest optimale methodes met u doornemen en kunnen onze adviseurs u hierin verder adviseren.

Kwaliteit en betrouwbaarheid

Voor het aansturen of voeden van uw processen is een zekere betrouwbaarheid noodzakelijk. Voor het proces start is het daarom belangrijk om kwaliteitseisen goed met elkaar af te stemmen en waar nodig bij te sturen. Dit doen wij door steekproefsgewijs controles uit te voeren op de herkende data. Wanneer uit onze steekproeven blijkt dat de afgesproken betrouwbaarheid niet gehaald kan worden stellen we onze controles zodanig bij dat deze wel gehaald worden.