Fraude au crédit : le véritable coût d'un projet d'IA artisanale

article
15/11/21
par François Saulnier

Vous avez commencé à réfléchir au lancement d'un programme anti-fraude basé sur l'IA, car vous souhaitez réduire la fraude résiduelle. Vous savez que vous perdez de l'argent quotidiennement ! Votre pensée initiale est que cela devrait être assez facile avec les données dont vous disposez et quelques data scientists.

Cependant, vous commencez rapidement à réaliser que le nombre de parties prenantes clés nécessaires est beaucoup plus important et la collaboration beaucoup plus large que vous ne le pensiez initialement.

Vous réalisez rapidement que la portée et la collaboration nécessaires pour mener à bien ce projet sont immenses - nécessitant non seulement votre équipe de data science, mais aussi du temps et des ressources de votre équipe de risque, de votre équipe de conformité, de votre équipe de marketing et de votre équipe informatique. Dans ce post, je décrirai les équipes multidisciplinaires et le calendrier requis pour un tel projet. 

Business Case

Comme tout projet, il commence par une réunion de lancement incluant les principaux intervenants : Risque et conformité (principales parties prenantes), marketing, informatique et votre équipe de data science (selon votre organisation, elle est rattachée soit à l'équipe commerciale, soit à l'équipe informatique). La voie du succès pour ce type de projet passe par un alignement parfait des parties prenantes, et vous devez vous assurer qu'elles comprennent toutes les délais, les objectifs et les contraintes commerciales respectifs.

Ensuite, vous organiserez une série de réunions pour cadrer le projet. Tous les membres de votre entreprise étant occupés par diverses contraintes, cette phase du projet peut durer environ 3 mois. Une demi-douzaine de réunions de 2 heures impliquant 3 à 5 personnes, des échanges de courriels et, bien sûr, des recherches sur le sujet - tout cela pour évaluer les implications potentielles, estimer le ROI (retour sur investissement) et enfin le budget nécessaire au projet.

Après cette période initiale de 3 mois de cadrage, vous investissez 30 M-jours pour construire un business case préliminaire pour l'approbation du budget. Pendant ce processus, les fraudeurs volent votre argent et vous n'avez toujours pas la preuve des économies potentielles. Enfin, vous présentez votre budget afin de pouvoir lancer le projet - vous avez fait quelques hypothèses et divisé le projet en 3 phases : validation avec des données historiques, construction, et la phase d'exécution.  

Phase 1 : Validation avec des données historiques

Comme vous avez l'expérience des projets de TI, la validation avec les données historiques comprend quelques ateliers, réunions et comités avec votre équipe de data science, les équipes de TI, l'équipe de risque et de conformité, et l'équipe marketing.

Nous avançons, mais toutes ces équipes doivent encore comprendre la complexité et les contraintes de l'entreprise. Dans votre esprit, la principale partie impliquée dans le projet est votre équipe de science des données. Peut-elle le faire en 3 mois avec seulement un senior à temps partiel et un junior à temps plein

Avez-vous réfléchi aux outils dont ils ont besoin ? Ont-ils besoin du soutien d'ingénieurs de données pour la préparation des données ? À la fin de cette période de validation de trois mois, vous avez investi 200 millions de jours, fait face à quelques surprises inattendues et vous disposez enfin d'un modèle conçu pour l'analyse hors ligne.

Laissez-moi faire le calcul pour vous : vous avez dépensé 230 millions de jours à 450 € par jour. Ajoutez le coût des ressources supplémentaires nécessaires : serveurs, licences (5k€/mois) ... Vous jouez au poker et vous venez de dépenser environ 120 000 € juste pour rester dans la course.

Après 6 mois, vous avez enfin atteint une étape clé. Vous savez maintenant si vous allez vous lancer ou non ! La prochaine étape est la phase de construction, au cours de laquelle vous devez réellement industrialiser l'ensemble du processus.

Phase 2 : La construction

Vous avez deux possibilités : soit vous vous appuyez sur une plateforme de data science que vous devez accélérer vous-même, soit vous construisez votre propre technologie - mais vous devez encore réfléchir à la manière dont vous allez connecter votre flux de données et au cycle de vie du modèle d’IA.

Supposons que vous décidiez de vous appuyer sur une solution existante. Votre équipe consacrera quelques semaines à ce modèle particulier, d'abord pour la construction, la formation et l'automatisation, puis il faudra peut-être 6 mois pour l'intégration des données.

Tout cela devrait s'aligner sur la folle feuille de route de l'entreprise. À la fin de cette période, vous finissez par investir 500 jours-homme, y compris les comités de gestion... Avez-vous pensé à l'exécution/maintenance de vos modèles ? Vos équipes informatiques sont habituées aux accords de niveau de service et à la surveillance des logiciels, mais quelqu'un a-t-il déjà pensé à la surveillance du modèle ? Il s'agit d'un élément clé, étant donné que le modèle doit être surveillé afin d'être efficace.

Cela nécessite des connaissances et une expertise spécifiques pour comprendre l'impact de la dérive des fonctionnalités et décider du bon moment pour recycler le modèle. Après 9 mois, vous êtes prêt à mettre en service. C'est fou comme le temps passe vite, n'est-ce pas ?

Non seulement les fraudeurs ne se sont pas arrêtés pendant cette période, mais ils ont en fait amélioré, évolué et changé leurs stratégies - et vous avez maintenant poussé un modèle qui était peut-être exact il y a 6 mois. Laissez-moi refaire le calcul pour vous.

Votre investissement total est maintenant de 730 millions de jours et n'oubliez pas le coût des ressources supplémentaires (serveurs, licences, etc.), vous avez dépensé environ 360 000 € et perdu des centaines de milliers d'euros aux mains des fraudeurs pendant ce temps.

Phase 3 : Exécution

Maintenant que vous êtes dans la phase d'exécution de votre projet, vos coûts devraient être moins élevés, mais vous devez toujours assurer la maintenance de l'ensemble de l'application. En plus de vos coûts informatiques habituels, vous devez également prendre en compte le coût de la surveillance du modèle, du recyclage du modèle, des mises à jour du modèle et de l'évolution des données - car les fraudeurs s'adaptent aussi et malheureusement, ils s'adaptent encore plus vite que vous. Dans cette phase d'exécution, vous avez besoin de 25 millions de jours par mois, ajoutez-y les ressources supplémentaires nécessaires et vous arrivez à environ 180 000 € par an.

Takeaway

Construire et exploiter soi-même son propre modèle d'IA pour la fraude peut être une option intéressante, mais en même temps, c'est un énorme risque. Louis Colombus (Directeur chez Dassault system) a mentionné dans State of MLOps 2021, qu'un pourcentage stupéfiant de 87% des projets ML ne sont jamais mis en production. Il est également essentiel de savoir que le coût de la création de votre propre modèle ne comprend pas seulement l'investissement initial, mais aussi le coût de son exploitation, qui est beaucoup plus élevé que celui des applications standards. Sans mentionner le fait que, dans ce contexte spécifique de fraude, vous perdez de l'argent chaque jour tant que votre système n'est pas en place. Il s'agit d'un compromis entre la propriété, la stratégie à long terme, ainsi que le retour sur investissement et l'efficacité immédiate.

Chez Bleckwen, nous savons déjà comment relever ces défis. Nous vous proposons un parcours sans heurts, de l'idée à la réduction efficace de la fraude, jusqu'à la mise en production, le tout en moins de deux mois.  Vous voulez en savoir plus ?  Réservez une démo


Vous souhaitez en savoir plus ?

Image for the blog post
Quentin Coic

Mutualiser pour mieux régner

Dans ce chapitre 2, nous nous intéresserons aux modèles sur étagère ainsi qu’aux pré-requis des techniques de mutualisation de données avant d’aborder le protocole mis en place pour mesurer l’apport de ces techniques pour nos clients.

Lire l'article
Image for the blog post
Quentin Coic

Mutualiser pour mieux régner, chapitre 1

Un des enjeux les plus importants pour créer des modèles de détection performants et viables pour nos clients (des organismes de financement tels que le crédit, le leasing et le factoring) est d’obtenir une donnée, qualifiée comme frauduleuse ou non, suffisamment importante en volume et diverse en patterns de fraude ou non-fraude.

Lire l'article
Image for the blog post
Clarisse Do Cao

La fraude financière en France : évolutions, impacts et solutions

En France, les pertes liées à la fraude financière en 2022 sont estimées à +175 millions d’euros. Et les fraudeurs améliorent constamment l'efficacité et la rentabilité de leurs transactions grâce aux technologies (deepfake, Chat GPT, nouveaux modes de paiement, etc). Des solutions concrètes existent pour lutter efficacement contre la fraude.

Lire l'article

Commencez avec

Bleckwen


DEMANDEZ UNE DÉMO
  • Résultats prouvés et économies garanties contre la fraude

  • Sur-mesure pour votre entreprise

  • Intégration facile et mise en œuvre rapide