Comment automatiser le traitement de documents manuscrits hétérogènes tout en garantissant un niveau de fiabilité compatible avec les exigences réglementaires du secteur de l'assurance ?
Le cabinet faisait face à un ensemble de défis techniques et organisationnels imbriqués.
La variabilité des documents sources
Ce premier obstacle constituait un défi majeur. Contrairement à des formulaires numériques structurés, les bons d'adhésion manuscrits présentent une diversité considérable : écritures plus ou moins lisibles, styles calligraphiques variés, ratures, annotations marginales, champs laissés vides ou remplis de manière non standard. Certains clients écrivent en lettres capitales, d'autres en cursive ; certains utilisent des abréviations, d'autres des formulations complètes. Cette hétérogénéité rend l'automatisation particulièrement complexe.
La qualité variable des numérisations
Les documents arrivent parfois sous forme de scans haute résolution réalisés avec un scanner professionnel, parfois sous forme de photos prises à la hâte avec un smartphone dans des conditions d'éclairage médiocres — images floues, perspectives déformées, ombres portées, arrière-plans parasites. Le système devait être capable de traiter l'ensemble de ce spectre de qualité.
La multiplicité des formats de sortie
Chaque compagnie d'assurance impose ses propres exigences : formats de documents spécifiques, champs obligatoires différents, règles de validation particulières, nomenclatures propres. Le cabinet travaille avec plusieurs assureurs partenaires, ce qui implique de maîtriser autant de gabarits et de logiques métier. Une simple erreur de format peut entraîner le rejet du dossier.
Les enjeux de conformité et de responsabilité
Dans le secteur de l'assurance, les erreurs de saisie peuvent avoir des conséquences importantes : un bénéficiaire mal orthographié, une date de naissance erronée, une garantie mal cochée peuvent invalider un contrat ou créer des litiges lors d'un sinistre. Le système automatisé devait donc non seulement être performant, mais aussi intégrer des mécanismes de contrôle et de validation robustes.
L'intégration dans les pratiques existantes
Les équipes avaient leurs habitudes, leurs outils, leurs workflows établis. Toute solution devait s'insérer harmonieusement dans cet écosystème, sans imposer une rupture brutale ni nécessiter une formation lourde.
Comment automatiser le traitement de documents manuscrits hétérogènes tout en garantissant un niveau de fiabilité compatible avec les exigences réglementaires du secteur de l'assurance ?
Le cabinet faisait face à un ensemble de défis techniques et organisationnels imbriqués.
La variabilité des documents sources
Ce premier obstacle constituait un défi majeur. Contrairement à des formulaires numériques structurés, les bons d'adhésion manuscrits présentent une diversité considérable : écritures plus ou moins lisibles, styles calligraphiques variés, ratures, annotations marginales, champs laissés vides ou remplis de manière non standard. Certains clients écrivent en lettres capitales, d'autres en cursive ; certains utilisent des abréviations, d'autres des formulations complètes. Cette hétérogénéité rend l'automatisation particulièrement complexe.
La qualité variable des numérisations
Les documents arrivent parfois sous forme de scans haute résolution réalisés avec un scanner professionnel, parfois sous forme de photos prises à la hâte avec un smartphone dans des conditions d'éclairage médiocres — images floues, perspectives déformées, ombres portées, arrière-plans parasites. Le système devait être capable de traiter l'ensemble de ce spectre de qualité.
La multiplicité des formats de sortie
Chaque compagnie d'assurance impose ses propres exigences : formats de documents spécifiques, champs obligatoires différents, règles de validation particulières, nomenclatures propres. Le cabinet travaille avec plusieurs assureurs partenaires, ce qui implique de maîtriser autant de gabarits et de logiques métier. Une simple erreur de format peut entraîner le rejet du dossier.
Les enjeux de conformité et de responsabilité
Dans le secteur de l'assurance, les erreurs de saisie peuvent avoir des conséquences importantes : un bénéficiaire mal orthographié, une date de naissance erronée, une garantie mal cochée peuvent invalider un contrat ou créer des litiges lors d'un sinistre. Le système automatisé devait donc non seulement être performant, mais aussi intégrer des mécanismes de contrôle et de validation robustes.
L'intégration dans les pratiques existantes
Les équipes avaient leurs habitudes, leurs outils, leurs workflows établis. Toute solution devait s'insérer harmonieusement dans cet écosystème, sans imposer une rupture brutale ni nécessiter une formation lourde.
Nous avons conçu et déployé un agent IA complet, capable de traiter la chaîne de bout en bout : de la réception d'un bon d'adhésion manuscrit jusqu'à la génération de documents conformes prêts à être transmis aux compagnies.
Architecture technique de la solution
Le système s'articule autour de plusieurs modules interconnectés, chacun spécialisé dans une étape du traitement.
Module de prétraitement d'image : Avant toute tentative de lecture, les documents entrants passent par une phase de normalisation. Ce module redresse les images inclinées ou déformées (correction de perspective), améliore le contraste pour faire ressortir l'écriture, supprime le bruit de fond, et découpe le document en zones d'intérêt correspondant aux différents champs du formulaire. Cette étape est cruciale pour maximiser les performances des modules suivants.
Module OCR spécialisé manuscrit : La reconnaissance optique de caractères sur du texte manuscrit est notoirement plus complexe que sur du texte imprimé. Nous avons déployé des modèles de deep learning spécifiquement entraînés pour l'écriture manuscrite française, capables de gérer les variations calligraphiques, les ligatures, et les styles d'écriture courants. Le système génère non pas une seule transcription, mais plusieurs hypothèses avec des scores de confiance associés.
Module d'interprétation contextuelle : C'est ici qu'intervient l'intelligence artificielle générative. Un grand modèle de langage (LLM) analyse les transcriptions brutes en tenant compte du contexte métier. Il sait qu'un champ "profession" attend un intitulé de métier, qu'un champ "date" attend un format spécifique, qu'un numéro de sécurité sociale suit une structure précise. Cette compréhension contextuelle permet de corriger les erreurs de transcription, de lever les ambiguïtés, de compléter les abréviations. Le modèle est également capable de signaler les incohérences (par exemple, une date de naissance incompatible avec une profession déclarée) ou les informations manquantes.
Module de validation et contrôle qualité : Chaque extraction est soumise à une batterie de contrôles automatiques : validation des formats (dates, numéros de téléphone, codes postaux), vérification des cohérences internes, confrontation avec des référentiels externes (base des communes, nomenclatures métier). Les champs présentant un score de confiance insuffisant ou ayant échoué à une validation sont flaggés pour révision humaine.
Module de génération documentaire : Une fois les données validées, le système génère automatiquement les documents d'adhésion dans les formats requis par chaque compagnie. Chaque assureur partenaire dispose de son propre template paramétré, avec ses règles de mapping (quel champ source alimente quel champ cible), ses transformations de données (formats de date, conventions de nommage), et ses règles de validation spécifiques.
Approche de mise en œuvre
La méthodologie a été résolument itérative et pragmatique, conformément à notre conviction que le conseil se mesure à sa capacité à produire et itérer concrètement.
Phase 1 — Diagnostic et cadrage (2 semaines) : Nous avons commencé par une immersion dans les pratiques réelles du cabinet. Observation des collaborateurs en situation, analyse d'un échantillon représentatif de bons d'adhésion (plusieurs centaines de documents), cartographie des flux documentaires existants, inventaire des gabarits de chaque compagnie partenaire. Cette phase a permis de qualifier précisément la variabilité des documents sources et de définir les critères de succès du projet.
Phase 2 — Proof of Concept ciblé (3 semaines) : Plutôt que de viser immédiatement une solution exhaustive, nous avons développé un premier prototype sur un périmètre restreint : un seul type de formulaire, une seule compagnie cible. Ce POC a permis de valider la faisabilité technique, d'identifier les cas limites, et de mesurer les performances réelles sur des données de production. Le taux de reconnaissance correct sur ce périmètre initial a atteint 87% sans intervention humaine, et 99,5% après révision des cas flaggés.
Phase 3 — Industrialisation progressive (6 semaines) : Fort des apprentissages du POC, nous avons étendu progressivement le périmètre : ajout de nouveaux types de formulaires, intégration des templates des autres compagnies partenaires, enrichissement des règles de validation. Chaque extension a fait l'objet de tests sur des données réelles avant mise en production.
Phase 4 — Intégration et formation (2 semaines) : La solution a été intégrée dans l'environnement de travail quotidien des équipes. Une interface simple permet aux collaborateurs de déposer les documents, de visualiser les extractions, de corriger les cas nécessitant une intervention, et de déclencher la génération des documents finaux. Une formation pratique a accompagné le déploiement.
Gestion de la relation homme-machine
Un principe fondamental a guidé toute la conception : l'IA assiste, l'humain décide. Le système est conçu pour maximiser l'automatisation sur les cas simples et bien reconnus, tout en sollicitant systématiquement la validation humaine sur les cas ambigus ou à risque.
Concrètement, chaque extraction est présentée avec un code couleur : vert pour les champs à haute confiance validés automatiquement, orange pour les champs nécessitant une vérification rapide, rouge pour les champs problématiques exigeant une attention particulière. Le collaborateur peut ainsi concentrer son attention là où elle est réellement nécessaire, plutôt que de tout revérifier uniformément.
Ce design n'est pas qu'une question d'ergonomie — c'est un choix éthique et métier. Dans un domaine où les erreurs peuvent avoir des conséquences importantes pour les assurés, maintenir l'humain dans la boucle de décision nous semblait impératif.