aisury

View Original

Utiliser l’IA pour automatiser les opérations des prédictions continues intelligentes (PCI)


La réconciliation et la prédiction des transactions financières représentent deux apports importants de l’IA en gestion de trésorerie.

Le temps, c’est de l’argent. Et lorsque les niveaux de risque ne sont pas gérés, les conséquences peuvent être désastreuses. Pour réagir rapidement et mieux anticiper les événements qui pourraient avoir un réel impact sur votre entreprise, il est fondamental de fournir des prédictions précises. Les algorithmes d’IA facilitent la planification en repérant les tendances et les risques à partir de données existantes.

La création de modèles d’apprentissage machine et profond en vue d’améliorer les transactions financières de trésorerie est une tâche à la fois complexe et coûteuse pour la plupart des services de gestion de trésorerie et des PME. Par ailleurs, le manque de personnel compétent dans ce domaine est un enjeu de taille, voire un obstacle majeur pour bon nombre d’entreprises.

C’est pourquoi l’équipe d’AISury s’est donné comme objectif de démocratiser l’IA par l’entremise de solutions logicielles intelligentes, spécialisées et abordables. Heureusement, il est possible d’élaborer, de réutiliser et d’adapter des modèles d’IA de façon à améliorer leurs performances pour un seul client à la fois, ce qui permet d’intégrer des éléments d’IA dans vos transactions financières de trésorerie, sans l’aide d’experts en mégadonnées. Les modèles d’IA AISury peuvent être réutilisés et mis à la disposition de nos clients. Ils sont stockés dans des conteneurs en ligne et exploités par l’entremise d’API.

Le recours à l’IA dans le domaine des finances d’entreprise est certes récent, mais il risque de devenir incontournable ‒ les calculs financiers multidimensionnels impliquent un nombre grandissant de données et sont de plus en plus difficiles à modéliser pour l’humain.

Trésoriers, directeurs financiers et comptables peuvent se familiariser avec l’IA en choisissant des scénarios productifs, assortis d’un rendement d’investissement élevé afin de réduire les coûts et d’augmenter les revenus. Un domaine dans lequel l’IA peut aider les experts financiers est celui des analyses prédictives, que l’IA peut rendre bien plus efficaces et utiles pour formuler des prédictions précises de résultats financiers. L’évaluation de données actuelles et historiques ainsi que la prédiction d’événements nécessitent un large éventail de méthodes d’apprentissage statistique et automatique. Avec un modèle prévisionnel, il est possible de repérer les risques et les occasions d’affaires en se fiant aux tendances qui ressortent des données historiques et transactionnelles.

Afin d’optimiser le potentiel prévisionnel de l’IA pour ce qui est des flux de trésorerie, nous avons mis au point une technique de prédiction continue intelligente (PCI). La PCI repose sur les prédictions de flux de trésorerie entrants et sortants. Ainsi, l’IA est un outil précieux qui permet d’utiliser les données de différents systèmes pour générer ces prédictions. Alors que de nombreuses entreprises misent encore sur des techniques archaïques pour établir leurs prédictions à l’aide d’un tableur, nous comptons démontrer pourquoi il faut passer à des algorithmes d’apprentissage automatique et à d’autres outils d’IA.

Pour ce faire, l’équipe d’AISury travaille actuellement à implanter un module de PCI dans un TMS, notre solution intelligente pour la gestion de trésorerie.

Dans cet article, nous allons expliquer comment nous avons élaboré l’architecture de base de l’IA pour la PCI d’un TMS. Grâce à nos efforts d’innovation, nous espérons que le module de PCI aidera les entreprises canadiennes à mieux s’adapter à l’ère numérique.


Exploiter le plein potentiel de l’IA


Notre principal objectif pour 2019 est de fournir le meilleur robot-trésorier dans une solution SaaS abordable et multilingue, qui répond aux besoins des grandes et moyennes entreprises canadiennes. L’année dernière, AISury a démarré un projet de recherche et développement axé sur l’IA dans les processus d’entreprise. La première étape consistait à développer une infrastructure d’IA générique pouvant être réutilisée et appliquée à des problèmes précis. La deuxième étape portait sur la validation du concept afin de réduire de manière considérable les tâches répétitives et à faible valeur ajoutée dans la gestion de tous les processus d’entreprise. L’objectif ultime était de créer un environnement dans lequel humains et robots-logiciels peuvent travailler côte à côte et interagir virtuellement grâce à la nouvelle génération de réseaux mobiles 5G d’ici 2020.

La PCI est un mode automatisé de prédictions continues intelligentes qui s’appuie sur de multiples robots-tâches intelligents, éliminant ainsi la répétition quotidienne de transactions financières manuelles fastidieuses qui comportent leur lot d’erreurs. La PCI donne l’occasion de concevoir un processus de prédiction efficace et optimisé pour prédire rapidement, continuellement et intelligemment l’avenir de votre entreprise et fournir à vos cadres tout un éventail de résultats potentiels à partir d’options variées. 

Libérant les trésoriers, les directeurs financiers et les comptables pour qu’ils se consacrent à des tâches plus importantes, notre solution de PCI intègre une multitude de tâches automatiques mises en œuvre grâce à des algorithmes d’IA, notamment celles-ci :

  • Catégorisation automatique des éléments de relevés bancaires,

  • Réconciliation automatique des relevés avec les transactions estimées dans votre prédiction,

  • Génération automatique des transactions pour établir une prédiction sur au moins trois ans basée sur des valeurs prévisionnelles de haute qualité,

  • Génération automatique du mois suivant à la fin de chaque mois afin de maintenir une prédiction continue sur trois ans,

  • Détection automatique d’anomalies (transactions financières anormales) afin de générer des alertes de fraude potentielle,

  • Recommandation automatique d’informations personnalisées pour améliorer vos prédictions et optimiser vos investissements (échéances, taux, modalités, conditions, etc.),

  • Et bien plus encore!

Afin de minimiser les tâches manuelles, d’automatiser davantage l’un TMS et d’améliorer l’expérience client, plusieurs scénarios intégrant des techniques d’IA ont été testés. À cet effet, nous avons entamé la validation de concept en septembre 2018 avec deux objectifs principaux :

  • Élaborer les éléments de base d’une plateforme d’IA pour les projets de futurs clients,

  • Élaborer des algorithmes d’IA appliqués à la gestion de trésorerie.

Pour assurer une bonne transition entre la gestion de trésorerie traditionnelle et la gestion basée sur l’IA, il est nécessaire de procéder de manière sûre et calculée. L’utilisation de nouveaux outils intelligents pour faciliter la gestion de la trésorerie se généralise, mais il est essentiel de définir une stratégie en procédant à une validation de concept, question d’élaborer un processus d’intégration adapté à chaque nouveau client.

Optimiser la validation de concept

Toute entreprise optant pour la migration de ses processus vers un logiciel de gestion de trésorerie intelligent doit avoir un plan d’intégration. La validation de concept permet de mettre sur pied un système préliminaire concret à des fins expérimentales qui donne une idée précise des capacités du programme de gestion de trésorerie. La validation de concept permet d’élaborer un algorithme d’IA capable de prédire les flux de trésorerie à partir de l’historique de données dans chaque catégorie. La validation de concept offre un aperçu des résultats, mais vise aussi à :

  • Limiter le temps consacré à l’analyse historique des données,

  • Limiter le temps consacré à la catégorisation des transactions financières,

  • Limiter le temps consacré à la réconciliation des transactions financières,

  • Accroître la qualité des réconciliations entre les prédictions et les transactions financières réelles,

  • Limiter le temps consacré aux calculs et à prévoir les flux de trésorerie,

  • Accroître la qualité des prédictions afin de mieux planifier,

  • Réduire la fraude en programmant des alertes intelligentes.

Calculer le rendement d’investissement (RI) de votre IA

La plupart des implantations d’IA touchent les transactions financières des centres d’appels et la gestion administrative, qui comportent d’innombrables tâches manuelles et répétitives. Les calculs de RI peuvent vous aider à déterminer rapidement les meilleurs cas de figure pour vos affaires : gain de temps associé à l’IA, moins d’erreurs humaines et satisfaction des clients qui interagissent avec vos employés. Attendez-vous à un taux de RI satisfaisant en deux ans pour l’IA. Pour améliorer l’expérience client et celle du personnel, nous devons analyser l’impact de l’IA et axer nos efforts sur l’optimisation de la main d’œuvre. Il faut s’assurer que l’IA permet d’optimiser votre personnel, et non de le remplacer, en comprenant les processus humains essentiels aux activités de votre entreprise.


Concevoir un algorithme d’IA


Pour concevoir notre solution de PCI, nous avons testé de nombreux algorithmes d’IA afin de réaliser les scénarios de trésorerie suivants :

  1. Catégorisation automatique des transactions financières,

  2. Réconciliation automatique des transactions financières,

  3. Prédiction automatique des flux de trésorerie.

AISury s’est doté d’une équipe d’experts en mégadonnées disposant de vastes connaissances et d’une expérience solide en IA. Certains de nos experts participent régulièrement à des compétitions Kaggle impliquant la résolution de problèmes complexes dans le domaine de l’IA.

L’approche AiSury

Afin d’obtenir les meilleurs résultats possibles avec nos trois scénarios de trésorerie, nos experts ont testé divers types de transformations de données et d’algorithmes d’apprentissage machine en IA. Pour concevoir des algorithmes performants, les tâches sont divisées en deux grandes phases : l’ingénierie des fonctionnalités et la modélisation. L’ingénierie des fonctionnalités est un élément crucial pour le bon fonctionnement du modèle. C’est ce qui permet à l’algorithme de modélisation de bien assimiler les données. Par exemple, pour les données textuelles, des approches d’exploration de texte sont utilisées; pour les données numériques, des ratios sont calculés; et pour les chaînes de caractères, des calculs de similarité sont effectués entre celles-ci.


Calculer des similarités entre des chaînes de texte

Pour effectuer des réconciliations entre les transactions financières réelles et prévues, les éléments utiles se trouvent souvent dans des données textuelles provenant de chaque source. Par conséquent, pour une paire de transactions financières réelle et prévue (de multiples paires sont observées), toutes les variables de texte dans les données réelles ainsi que toutes les variables de texte dans les données prévisionnelles sont concaténées sur deux chaînes séparées. Un algorithme va ensuite évaluer la similarité entre les deux chaînes de texte résultantes en cherchant les 3-, 4-, et 5-grammes (les « 3-grammes » de « abcdi » sont « abc », « bcd » et « cdi ») qui se trouvent dans les deux chaînes, tout en tenant compte de la longueur des chaînes de texte.

Sélectionner les meilleurs algorithmes pour nos trois scénarios de trésorerie

Pour les algorithmes d’apprentissage automatique, les membres de notre équipe ont testé divers algorithmes comme les forêts d’arbres décisionnels, l’optimisation du gradient (gradient boosting) et les réseaux de neurones artificiels. Ils ont constaté que l’algorithme d’optimisation du gradient, en particulier LightGBM, fonctionnait très bien pour les deux premiers scénarios lorsque combiné avec les transformations de données pertinentes. Pour le troisième scénario, nous utilisons les réseaux neurologiques récurrents pour générer les flux de trésorerie.

Qu’entend-on par algorithme d’optimisation du gradient?

Wikipédia définit l’optimisation du gradient comme une technique d’apprentissage automatique pour les problèmes de régression et de catégorisation, qui produit un modèle de prédiction sous la forme d’un ensemble de modèles de prédiction déficients, généralement des arbres décisionnels. L’optimisation du gradient suscite l’intérêt vu la rapidité et la précision de ses prédictions, en particulier avec des ensembles de données vastes et complexes. De nouveaux algorithmes d’apprentissage automatique sont conçus tous les mois. Parmi les plus récents, LightGBM se distingue comme un arbre décisionnel hautement efficace axé sur l’optimisation du gradient.

LightGBM : le meilleur algorithme pour la catégorisation et la réconciliation des transactions financières

Avant d’aborder LightGBM, il est important d’expliquer comment fonctionne un algorithme d’arbre décisionnel. Pour cela, il faut comprendre le concept des nœuds et des feuilles. Pour développer un algorithme d’arbre décisionnel, nous commençons par un ensemble de données intégral (le nœud racine), que l’on divise ensuite en deux ensembles (les nœuds internes), selon un critère qui différencie les deux ensembles de la manière la plus claire possible, en utilisant soit une variable cible, soit une catégorie. Chaque nouveau nœud créé est divisé selon ce même schéma. Dès que la création de nouvelles divisions n’entraîne plus de gain de performance, nous arrêtons le développement de l’arbre. Les derniers nœuds deviennent ainsi les nœuds terminaux (ou feuilles terminales), qui représentent des ensembles d’observation (dans le cas présent, des transactions financières) possédant des caractéristiques analogues, tout en se distinguant des transactions financières des autres groupes. Sans entrer dans les détails pointus, LightGBM ne procède pas exactement de la même manière que la plupart des algorithmes d’optimisation du gradient pour construire des arbres. Beaucoup d’algorithmes d’optimisation du gradient développent des arbres décisionnels de bas en haut, en intégrant automatiquement de nouvelles divisions pour tous les nœuds de même niveau, mais LightGBM s’emploie à trouver la meilleure division pour constituer chaque nœud. Le schéma ci-dessous illustre cette différence : Voici comment la plupart des algorithmes d’optimisation du gradient construisent des arbres décisionnels :

Et voici comment LightGBM construit des arbres décisionnels :

Cette différence repose sur le procédé utilisé pour construire les arbres. La manière dont l’algorithme traite les valeurs numériques continues présente toute une série d’avantages :

  • Apprentissage plus rapide,

  • Précision accrue,

  • Utilisation réduite de la mémoire,

  • Capacité de traiter de gros volumes de données.

Qu’est-ce qu’un réseau neuronal récurrent (RNR)?

Wikipédia définit le RNR comme un type de réseau neuronal au sein duquel les connexions entre les nœuds forment un graphe orienté selon une séquence temporelle. Cela permet d’exposer un comportement dynamique temporel. À la différence des réseaux de neurones à propagation avant, les RNR peuvent utiliser leur état interne (mémoire) pour traiter des séries de données.

Les RNR : le bon choix pour la prédiction automatique des flux de trésorerie

Pour résoudre les problèmes qui nous intéressent – à savoir la prédiction des transactions financières – la méthode traditionnelle commande d’analyser des séries chronologiques. Cependant, dans le contexte qui nous concerne, une telle approche aurait nécessité le paramétrage et l’ajustement des séries par catégorie de prédiction, compte et entreprise ‒ une façon de faire qui multiplie les séries chronologiques à traiter individuellement. Les réseaux neurologiques récurrents (RNR) sont très performants pour le traitement du langage. Par exemple, la prédiction du mot (ou des mots) qui viendra (ou viendront) compléter une phrase dépend largement de tous les mots qui se trouvent avant (incluant leur ordre) et pas seulement du dernier mot. Les RNR sont capables de prendre en compte les mots précédents, ainsi que leur ordre. Ce procédé peut être mis en parallèle avec notre besoin de prédire des montants pour une catégorie donnée à partir des transactions financières passées. Voici les principaux avantages de ce type de modèle :

  • Générer des prédictions quotidiennes,

  • Intégrer des prédictions pour toutes les sous-catégories dans un modèle,

  • Prendre en compte des corrélations extrêmement complexes,

  • Rallonger la période de prédiction visée,

  • Possibilité de faire des prédictions pour des sous-catégories que le modèle n’a jamais traitées avant l’apprentissage,

  • Réutiliser un modèle efficace et suffisamment entraîné pour d’autres taches similaires.


MLS pour l’implantation de solutions d’IA


Pour implanter nos algorithmes d’IA et leur module de PCI, nous avons utilisé Azure Machine Learning Service comme l’indique Microsoft dans sa description, Azure MLS est un service infonuagique destiné à la formation, au déploiement, à l’automatisation et à la gestion des modèles d’apprentissage automatique, le tout à la vaste échelle du nuage.

Image 1 : Procédés et services Microsoft MLS En général, le développement d’IA se compose de la manière suivante :

  1. Importer les données d’apprentissage,

  2. Préparer les données avec des scripts Python,

  3. Entraîner le modèle avec des fonctions ou des librairies spécifiques,

  4. Sauvegarder le modèle entraîné sur Microsoft Azure Machine Learning Service (MLS),

  5. Créer une image qui représente la machine sur laquelle le modèle sera exécuté,

  6. Déployer l’image en tant que service web.

Une fois le modèle entraîné et déployé en tant que service web, il peut être utilisé en toute sécurité à partir d’un programme dès qu’une situation requiert l’implication de l’algorithme d’IA.

Image 2 : un TMS – Architecture du modèle d’IA sur Azure Dans le cas d’un TMS, la prédiction des flux de trésorerie est implantée à l’aide des services suivants :

  • MS SQL Azure – stockage de données

  • MS Azure Data Factory – Outil ETL pour transférer les données entre les bases de données opérationnelles et celles réservées à la formation d’IA

Le flux de haut niveau d’un TMS par rapport au processus Azure MLS :

  • un TMS conserve les données de chaque « locataire » dans les bases de données opérationnelles.

  • Les données sont transférées régulièrement (sur demande ou selon un calendrier établi) via Azure Data Factory vers une base de données spécifique à la formation du modèle d’IA.

  • À la fin de chaque transfert, la formation de l’IA est enclenchée.

  • Une fois la formation terminée, les prédictions peuvent être directement inscrites dans la BD de l’IA.


Résultats obtenus : catégorisation automatique


Les algorithmes ont été entraînés et testés sur trois ensembles de données différents représentant des entreprises réelles aux caractéristiques différentes. Les caractéristiques distinctives de ces trois ensembles de données sont indiquées ci-dessous :

  • Entreprise 1 : Faible volume de transactions financières (1 600) sur environ 14 mois, divisées en plusieurs catégories (73). Pour la plupart des catégories, les transactions financières ont lieu de manière irrégulière,

  • Entreprise 2 : Volume important de transactions financières (120 000) sur quelques mois, divisées en 179 catégories. Les catégories sont réparties de diverses manières : plusieurs catégories à répétitions régulières, avec un modèle de répétition clairement identifiable sur les graphiques; et plusieurs catégories non régulières ou des catégories avec peu de transactions financières, sans modèle de répétition observable,

  • Entreprise 3 : Volume important de transactions financières (80 000) sur quelques mois, divisées en 28 catégories, la plupart étant très récurrentes.

Les résultats des modèles entraînés varient fortement en fonction des ensembles de données. Il est intéressant de noter que les meilleurs résultats ont été obtenus avec les ensembles de données 2 et 3, qui comprennent les volumes de transactions financières les plus élevés. D’autre part, les résultats dépendent fortement de la rigueur et de la constance appliquée à la catégorisation manuelle préalable. C’est ce qu’utilisera l’algorithme pendant l’apprentissage et pour la validation. Par ailleurs, lorsqu’on dispose d’un volume de transactions financières élevé pour une entreprise, les meilleurs résultats seront obtenus en utilisant un ensemble de données récent pour la formation ‒ la manière de catégoriser manuellement les transactions financières évolue donc constamment. Voici les meilleurs résultats pour les trois entreprises, obtenus en filtrant les données d’apprentissage dans la mesure du possible (entreprises 2 et 3) :

*Évaluation des résultats par validation croisée

Les résultats obtenus : la catégorisation automatique

Nous nous sommes servis de l’entreprise 2 pour former un algorithme de réconciliation automatique intelligent. Les données de cette entreprise convenaient parfaitement à cet exercice en raison du volume important de transactions financières quotidiennes et des efforts considérables déployés chaque jour pour cette importante tâche de gestion de trésorerie. Grâce à un système de réconciliation automatique basé sur quelques règles de fonctionnement de l’entreprise, nous avons pu effectuer en une journée la réconciliation de 84 % des paires de transactions financières prévues et réelles, qui n’avaient pas été utilisées pour entraîner l’algorithme. L’ajout d’un algorithme de réconciliation automatique intelligent a permis d’augmenter le pourcentage de réconciliation automatique des paires de transactions financières prévues et réelles à 96 %.

Résultats obtenus : prédiction des flux de trésorerie

Des algorithmes de réseaux neurologiques récurrents ont été entraînés avec les données des trois entreprises. Pour commencer, des modèles de prédiction à court terme ont été utilisés pour valider les résultats. Même lorsqu’on souhaite obtenir des prédictions à long terme, il est judicieux de s’assurer que les résultats à court terme sont valides avant de prolonger la période de prédiction. Cela évitera d’accentuer un problème à court terme sur le long terme. L’erreur quadratique moyenne (EQM) a été calculée sur 28 jours pour les algorithmes ajustés sur les données des trois entreprises. Nous avons également utilisé un algorithme entraîné avec toutes les données disponibles, indépendamment de l’entreprise. Qu’est-ce que l’erreur quadratique moyenne? Il s’agit d’une mesure qui permet de quantifier l’erreur moyenne produite par le modèle. Pour l’obtenir, on calcule le carré des différences entre les valeurs prévues et les valeurs réelles, qui sont ensuite additionnées avant de diviser le résultat par le nombre de prédictions. On calcule ensuite la racine carrée de ce nombre pour obtenir l’EQM. À noter que dans l’exemple donné, la mesure a été calculée à partir de données transformées, sur une échelle qui n’est pas en dollars réels. Retenez que plus l’EQM sera basse, mieux ce sera! 

Voici les résultats

On notera que pour deux des trois entreprises, l’algorithme global donne de meilleurs résultats que les spécialisés. Pour l’entreprise 1, les résultats sont pratiquement identiques. On constate ainsi que chaque entreprise tire profit des connaissances recueillies par l’algorithme auprès des autres entreprises. On obtient de meilleurs résultats grâce au travail d’équipe! Un cas intéressant est celui de la problématique des prédictions simultanées sur un nombre important de catégories, qui peut s’élever à des centaines pour certaines entreprises. Pour bien comprendre le potentiel des réseaux neuronaux récurrents, voyez ci-dessous les prédictions de l’algorithme comparées aux transactions financières réelles de l’entreprise 2 (les montants en dollars ne sont pas divulgués). Ligne noire : transactions financières réelles Ligne bleue : transactions financières prédites par l’algorithme.

Catégorie 1

Catégorie 2

Catégorie 3

Catégorie 4

Nous pouvons constater que malgré l’absence d’une tendance visuelle marquée pour la période concernée, l’algorithme de prédiction a pu prédire au bon moment les différentes variations des flux de trésorerie de façon assez précise. Les résultats à court terme ayant été validés, nous pouvons maintenant générer des prédictions à long terme. Si nous ne disposons pas d’un volume suffisant de données pour valider des prédictions pluriannuelles, seul l’avenir dira si nos prédictions sont justes.


Une solution flexible et abordable

Face à la complexité de l’ère numérique actuelle, les entreprises qui veulent assurer leur réussite doivent être en mesure de prédire rapidement et précisément leurs flux de trésorerie. Étant donné le volume de données et les taux de variation actuels, le recours aux tableurs n’est désormais plus adapté. Alors que l’IA offre une solution évidente à ce problème, sa mise en œuvre reste trop coûteuse et compliquée pour beaucoup d’entreprises. C’est pour cette raison qu’AISury a élaboré un modèle d’IA abordable, capable de s’adapter aux besoins spécifiques et changeants de votre entreprise. Au sein d’AISury, nous nous sommes employés à exploiter le potentiel de l’IA dans une prédiction continue intelligente que nous avons intégrée dans un TMS, notre solution intelligente pour la gestion de trésorerie, afin de vous faire bénéficier des avantages de cette technologie de pointe.