Accueil Automatiser la capture de documents

Automatiser la capture de documents

Couplée avec des solutions de routage, la capture des données alimente les silos d'informations et les applications métiers à travers un workflow optimisé. Pour véhiculer l'information jusqu'au bon décisionnaire, l'automatisation des tâches est nécessaire.

Sous sa forme la plus basique, la numérisation d'un document crée une photographie au contenu difficilement exploitable, un fichier image à ranger dans la grande boîte de l'information non structurée. A cette capture photographique, les professionnels opposent ce qu'ils nomment capture avancée ou intelligente, celle qui lit, analyse et retranscrit le contenu du document au moyen d'un module de reconnaissance puis l'aiguille vers le SI de l'entreprise. Il est ensuite mis à disposition ou initie un processus, par exemple dans un système d'ERP ou de CRM. Que le document soit en papier ou déjà sous sa forme numérique, sa capture fournit aux entreprises le moyen d'exploiter à la source les données, en mettant en place un workflow adapté à leurs besoins. «Avant de parler GED, il est nécessaire pour tout document physique de passer par l'étape dématérialisation qui commence par la capture avec un scanner ou un multifonction», explique Pierre-Antoine Monfort, Chef de Produit Business chez Epson. «Il ne s'agit pas ici d'une simple capture d'images mais bien d'une première étape de traitement. Ainsi, lors de la capture, des outils reconnaissent les données présentes sur la feuille et peuvent, de manière automatique ou non, supprimer une couleur de fond, générer un PDF sur mesure, reconnaître si les documents doivent être numérisés en couleur ou en monochrome. Le document est également indexé de manière à pouvoir y effectuer des recherches par mots clefs, ou le classer».

Une chaîne de capture

De la numérisation au transfert des données vers un référentiel ou un processus métier, la capture s'articule autour de plusieurs étapes. Aline Saponara, Sales Manager France – Document Imaging Solutions – Kodak Alaris, rappelle les principales. «Il y a d'abord l'analyse du fonds documentaire, une étape qui permet de déterminer la méthode de capture des documents, des données et de choisir le modèle de scanner adéquat. Suit la préparation des documents qui évite non seulement les incidents de numérisation mais qui participe de l'automatisation du process de capture des données. Il faut ensuite procéder à la catégorisation des documents qui facilite l'extraction des données en fonction du type de documents. La catégorisation peut être réalisée au moment de la préparation des documents par insertion de codes à barres, par exemple, ou grâce à la solution de capture de documents. Vient alors l'extraction des données et leur validation, grâce aux différents moteurs de reconnaissance intégrés (OCR, ICR, Code à barres, OMR) ou à des requêtes à une base de données qui permettent par la lecture d'une donnée d'en rapatrier plusieurs autres. Reste, enfin, à transférer les images et les données associées dans le ou les bons référentiels cibles, au bon format (Jpeg, PDF/A, etc.)».

Après l'exportation des métadonnées et des documents vers les applications métier, François Lacas, Responsable Marketing et Communication pour Itesoft, identifie pour sa part deux autres étapes. Il faut, selon lui, stocker et indexer les documents dématérialisés sous la forme images PDF/A ou sous leur format d'origine, les documents pouvant ensuite être directement exploités dans un système de GED ou à partir d'applications externes. Il préconise aussi la mise en place d'un atelier de modélisation et de conception d'applications «orientées processus», avec une approche «Model Driven» associée à la réutilisation de composants, de façon à pouvoir modifier très rapidement les processus en production sans passer par les services informatiques.

Importation, reconnaissance, extraction, vérification puis exportation des données validées, la chaîne de la capture a tout intérêt à être automatisée. «Les bénéfices des processus de capture de documents automatisés sont nombreux», souligne Colin Miller, Regional Marketing Executive chez Abbyy. «On relève une augmentation de l´efficacité grâce à la suppression des processus consommateurs de temps et sujets aux erreurs, tels que le prétraitement manuel des documents et les entrées au clavier. La compétitivité est également améliorée à travers une meilleure réactivité, et, avec des données de très bonne qualité en sortie, le temps de validation est raccourci. De plus, les données envoyées dans les systèmes back end sont significativement plus fiables».

«En complément des fonctionnalités intelligentes d'optimisation et de compression des documents numérisés, il est possible d'implémenter des solutions logicielles augmentant le nombre de fonctions automatisées», ajoute Philippe Genty, Chef de Produit Marketing imprimantes et multifonctions chez HP. Ces solutions logicielles de capture et de routage permettent notamment de bénéficier de plus de formats de destination de fichiers, plus d'intelligence (reconnaissance de code barre, d'OMR, d'ICR, etc.), des traitements évolués automatisés (typage, identification, indexation, séparation de documents, compression, etc.), un envoi direct vers des applications métier depuis le panneau du MFP (connecteurs) et l'intégration de multifonctions ou scanners multi-constructeurs.

Auditer le flux documentaire

Chercher à automatiser un processus de capture, c'est avant tout tenir compte de la nature des documents traités, notamment en faisant la distinction entre les documents structurés, semi-structurés et non structurés. «Les documents structurés sont le plus souvent des documents que l'entreprise a produits», rappelle Nicolas Malen, Chef de Produit GED chez Canon. «La place de chaque information est connue et fixe dans le document. Il peut, par exemple, s'agir d'un bon de livraison émis par l'entreprise, qui revient après signature par le client. Les documents semi-structurés ont une structure plus variable mais pourtant présente. Les documents non structurés sont, eux, non normalisés. L'automatisation de la capture des documents structurés est très simple grâce aux technologies de LAD et de RAD. L'automatisation de la capture des documents non structurés nécessite des logiciels plus complexes et, assez souvent, des développements complémentaires. Il convient d'étudier précisément le ROI de ces solutions face à de l'encodage manuel, le volume de documents à traiter étant un facteur clé. La capture des documents non structurés se fait par le biais d'indexation en texte intégral, à la manière des moteurs de recherche Internet. L'inconvénient de cette méthode est que le document n'est plus alors précisément classé suivant le référentiel de l'entreprise. Elle n'est donc adaptée qu'à des applications particulières pour lesquelles elle est nécessaire, par exemple la documentation technique».

Un audit du flux documentaire facilite l'identification des documents éligibles à la capture. L'analyse de l'existant et la projection du ROI, dont l'estimation se situe entre 12 et 18 mois, permettent de définir les meilleures approches. «Un projet ne doit pas être uniquement considéré comme un projet informatique : l'audit du flux documentaire et des processus de gestion métier en amont du projet est un des facteurs clés de succès. Cette analyse de l'existant complétée d'une identification des gains possibles permettra de définir au mieux la solution cible ainsi qu'un éventuel plan de transformation, et donc de sécuriser la réussite du projet», souligne François Lacas.

Il y a bien sûr le choix de la solution matérielle, scanner ou multifonction, qui repose sur la volumétrie et la nature ou spécificités des documents. Un processus de numérisation massif est plutôt centralisé sur des scanners de production. Au contraire, une numérisation répartie à la source, via des scanners bureautiques ou des multifonctions, couvre des besoins standards. A ces solutions sont associées les applications de capture, elles aussi standards ou spécifiques, et dont les fonctions d'automatisation des processus sont plus ou moins élaborées.

Sur la piste de l'automatisation avancée

«Tous les documents entrants peuvent être numérisés, mais si l'objectif est d'automatiser au maximum la chaîne de numérisation, il est nécessaire de considérer ceux qu'il est impératif de faire circuler pour consultation, approbation, annotation, etc., ou d'archiver et donc d'analyser le fonds documentaire éligible à la capture de documents. Cette sélection permettra d'évaluer le temps et les ressources utiles à la préparation des documents et donc de minimiser les incidents liés à la numérisation», explique Aline Saponara. «Le choix du scanner en fonction de la volumétrie et du temps imparti est d'autant plus important lorsque les documents sont très hétérogènes en format ou en grammage. Les options de nettoyage, d'amélioration de la qualité d'image et toutes les options qui fluidifient la production (ex : détection de double, détection de la couleur, etc.) faciliteront également l'automatisation de la capture de données et diminueront le temps de validation. L'extraction des données pertinentes répondant aux process de l'entreprise et l'accès aux données disponibles dans l'entreprise favorisent les contrôles de cohérence, l'alimentation des applications et donc le principe d'automatisation».

Pour Jean-Charles Goetz, Regional Sales Director pour l'Europe du Sud chez Nuance, l'automatisation avancée, auparavant disponible uniquement dans les services de numérisation spécialisés, est désormais conçue pour tous grâce aux fonctions suivantes : le traitement par lot et hors ligne, qui prend en charge les envois volumineux de documents sans avoir à attendre la fin de leur transmission devant le scanner ; l'usage des codes-barres pour automatiser les processus par lots ou les flux de travail récurrents, une méthode qui accélère les flux de travail répétitifs, élimine le fractionnement et l'indexation manuels et réduit les erreurs de saisie ; des règles de validation et de processus logique grâce au Database Lookup Extender, un module qui permet de s'interfacer avec des bases de données mais également d'utiliser des fonctions logiques (RegEx et C#) basées sur l'extraction de données présentes sur les documents à numériser ; le traitement et la reconnaissance de formulaires via un OCR sur zones, dont l'intérêt est de simplifier l'extraction de données et de permettre l'injection des index directement dans les bases de données à partir du multifonction. Enfin, l'intégration de l'ensemble des sources de documents optimise le traitement global.

L'e-préparation des documents

«La question de l'automatisation est particulièrement minutieuse», souligne Eric Jamet, Directeur Marketing et Stratégie Partenaires chez Tessi documents services. «La préparation – toilettage des documents est une étape incontournable avant la numérisation, mais elle est basée sur des processus manuels fastidieux. L'e-préparation permet de réduire cette tâche au maximum, de supprimer la nécessité de séparateurs physiques ou recueillir et «e-préparer» les documents numérisés à la source depuis les sites clients. Dans le cas de fortes volumétries ou de traitements industriels, la capacité d'une solution à piloter l'ensemble des traitements est essentielle. Il faut une solution conçue pour cela autour d'un moteur de workflow dit de production, automatisant ainsi l'enchaînement des étapes de la chaîne d'acquisition. Des outils de reporting assurent le pilotage des traitements au regard des objectifs de production. Enfin, ne perdons pas de vue que 40% des documents entrants dans l'entreprise sont des documents issus même de l'entreprise : formulaires, coupons, mandats SEPA, bons de souscription, déclarations, etc. L'automatisation des étapes de classification, d'indexation automatique via RAD/LAD et des exports peut donc être fortement renforcée par l'adaptation des formats, l'organisation de l'information dans le document et l'intégration de composants de type datamatrix ou code-barres, favorables à la capture automatisée et à la traçabilité des flux».

A toutes ces procédures s'ajoute une notion de mobilité. Capturer avec son smartphone ou sa tablette n'a plus rien d'une exception dès lors que la boîte à outils en place offre les mêmes caractéristiques que celle des solutions disponibles au bureau. Exemple d'échanges électroniques sécurisés de documents couplés à la mobilité, la solution BOS Mobility de Tessi documents services qui s'appuie sur le logiciel A2iA Mobility et permet aux porteurs de chèques d'opérer la remise en banque directement depuis leur smartphone.

IRIScan Book Executive 3 est un scanner portable, équipé de Wifi, qui permet de numériser livres, magazines, en utilisation nomade ou au bureau. Il suffit de faire glisser le scanner sur le document et l'image numérisée sera automatiquement enregistrée sur la carte MicroSD et prête à être transférée au smartphone, tablette ou PC (iOS, Android, PC ou Mac). Une application gratuite permet de récupérer les docs sur smartphone.

Le package inclut Readiris Pro 14, le produit phare d'IRIS pour l'OCR. Les docs sont exportables dans le cloud en un clic (Dropbox, iCloud, Skydrive, Googledrive, etc).

Bien choisir son outil de numérisation

Sofie Dheedene, Chef de Produit EMEA pour PFU Imaging Solutions Europe Limited (groupe Fujitsu), dresse pour Solutions IT et Logiciels la checklist des principaux points à prendre en considération avant d'opter pour un scanner d'entreprise.

  • Reconnaissance optique de caractères (OCR)

L'un des aspects fonctionnels les plus importants de toute solution de numérisation est la fonction d'OCR qui numérise l'information figurant sur un document papier et tente de la convertir en texte et chiffres lisibles. Cela est très différent de la fonction offerte par les scanners bas de gamme qui prennent littéralement une photo du document et l'enregistrent comme une image.

  • Numérisation sous format PDF

Le format PDF est actuellement le format par excellence pour de nombreuses entreprises et les scanners doivent être en mesure de numériser directement dans ce format, de préférence avec la fonction OCR.

  • Numérisation vers une application

La possibilité d'envoyer directement le document numérisé dans une application de traitement de texte ou de feuilles de calcul de votre choix devrait être une fonction essentielle de toute solution de numérisation.

  • Numérisation vers un dossier

L'utilisateur doit avoir un contrôle total sur l'emplacement où le document numérisé est envoyé, qu'il soit affiché sur l'écran, envoyé à une application telle que MS Word ou enregistré dans un dossier ou sur le Cloud (Evernote, Google doc, etc.).

  • Connectivité

Au sein d'une PME, les scanners peuvent être connectés de multiples manières et le choix du type de connexion varie d'une entreprise à l'autre en fonction de la solution la plus appropriée à chacune d'entre elles. Les options de connectivité via Ethernet (connexion directe au réseau) et USB font partie des options les plus courantes.

  • Facilité d'utilisation

Il va sans dire que toute solution de numérisation déployée dans une PME doit être facile à utiliser : une configuration complexe et une maintenance laborieuse ne sont pas envisageables pour les petites entreprises.

  • Technologies avancées

Un bon scanner dispose d'un certain nombre d'outils de numérisation permettant de générer des copies de qualité. Cela comprend notamment la suppression des pages vierges, la rotation automatique des pages et la détection des alimentations doubles (plusieurs feuilles passent simultanément dans le scanner). Tout ceci doit être totalement transparent pour l'utilisateur.

  • Profils

Idéalement, la solution de numérisation doit être capable de gérer plusieurs profils d'utilisateurs ou d'applications. Par exemple, la numérisation sous format MS Excel pour le service comptabilité vers un dossier particulier, et, pour la correspondance générale, la numérisation sous format PDF vers un autre dossier.

  • Chargeur automatique de documents

Le chargement automatique de documents permet de numériser un certain nombre de pages en une seule fois. Le logiciel de numérisation donne ensuite la possibilité de créer un document par page, ou de regrouper les pages numérisées en un seul document numérisé.

  • Recto verso

Le scanner doit être en mesure de gérer des documents entrants imprimés sur les deux côtés, de préférence en identifiant et supprimant les pages blanches à mesure que le document est traité et enregistré.

  • Couleur et résolution

Les documents doivent pouvoir être numérisés en couleur ou en monochrome, et la qualité de numérisation, mesurée en points par pouce (PPP), doit pouvoir être configurée.

La SMIP (Groupe MACIF) améliore la satisfaction de ses clients

La mutuelle SMIP du groupe Macif veut améliorer l'efficacité de son centre d'appels et donner à ses téléconseillers un accès direct et immédiat aux dossiers de ses adhérents. Elle s'oriente vers les technologies de dématérialisation de documents et d'automatisation des processus et retient la solution d'Itesoft combinant les modules FreeMind pour la capture et le tri automatique des flux clients, et Share pour la gestion électronique des documents. «Notre choix s'est naturellement porté sur Itesoft», explique Bernard Prisset, Responsable de la plateforme de traitement automatique de documents pour la SMIP. «Cet éditeur nous conseille et nous accompagne depuis plusieurs années. Ses équipes ont par exemple réalisé l'audit de notre existant au lancement du projet en 2002, cela nous a permis de définir le bon cadrage initial». La mise en production de la solution débute en juin 2003. Dans un premier temps, sont automatisés les processus d'indexation, de mise en GED de l'ensemble des flux entrants et de lecture des avis des sommes à payer. En 2004, d'autres documents tels que les décomptes santé ou bulletins d'adhésion sont également traités. Enfin, entre 2009 et 2010, la mutuelle automatise le tri des flux entrants. Les gains de productivité obtenus ont permis d'intégrer les flux de mutuelles partenaires pour dépasser, en 2010, le million de courriers traités par an.

Le projet a eu un impact sur l'efficacité et la productivité du back office : le temps de traitement des dossiers clients a été divisé par 2 alors que le volume de documents traités a été multiplié par 2,5. La qualité de services rendus aux adhérents est également améliorée : les téléconseillers ont désormais un accès direct à H+2 aux dossiers adhérents électroniques et peuvent ainsi répondre à toutes les requêtes clients. «Nos téléconseillers observent désormais une baisse de leur temps de communication de près de 30%, mais aussi la disparition des rappels clients», souligne Véronique Frappier, Responsable Administrative des contrats pour la SMIP.

La dématérialisation a aussi permis d'optimiser le pilotage de la gestion des réclamations clients : «la plateforme Itesoft crée automatiquement des indicateurs. Nous pouvons, par exemple, connaître le pourcentage de réclamants qui ont plus de 2 ans d'ancienneté ou la proportion de première ou deuxième réclamation. Nous avons ainsi mis en œuvre des plans d'actions ciblés et réduit le nombre de réclamations». Pour gérer un nombre croissant d'adhérents qui utilisent plusieurs canaux de communication, la SMIP envisage à présent d'intégrer l'ensemble des flux papier et électroniques dans la plateforme FreeMind pour homogénéiser le traitement et le pilotage.