Idées de solution
Cet article présente une idée de solution. Si vous souhaitez que nous développions le contenu avec d’autres informations, telles que des cas d’usage potentiels, d’autres services, des considérations d’implémentation ou un guide des prix, adressez-nous vos commentaires GitHub.
Ce modèle de solution illustre une solution de bout en bout pour exécuter des analyses prédictives sur des données de prêt et produire des scores de perte sèche. Un rapport Power BI présente également l’analyse et la tendance des prêts de crédit et la prédiction de perte sèche.
Architecture
Téléchargez un fichier Visio pour cette architecture.
Dataflow
Développez et déployez un code R dans IDE RStudio, qui est installé sur une machine virtuelle ou une station de travail Scientifique des données. Il se connecte à une machine virtuelle Data Science, où est installé SQL Server.
Prédisez et notez le modèle. Les données de prédiction et de score peuvent être visualisées dans Power BI.
Les scientifiques des données se chargent de la préparation des données, de la formation des modèles et de l'évaluation à partir de leur R IDE préféré. Les administrateurs de base de données peuvent se charger du déploiement en utilisant des procédures stockées SQL avec du code R intégré.
Enfin, un rapport Power BI permet de visualiser les résultats prédits et notés qui sont déployés.
Components
Technologies clés utilisées pour implémenter cette architecture :
Dans une machine virtuelle Data Science, l'édition Developer de SQL Server 2019 est préinstallée. Pour en savoir plus sur les autres outils inclus dans la machine virtuelle Azure Data Science, consultez la section Quels sont les outils qui sont inclus dans Azure Data Science Virtual Machine ?.
Détails de la solution
Un prêt faisant l’objet d’une perte sèche est un prêt pour lequel un créancier (généralement un établissement de prêt) déclare qu’un montant de la dette est peu susceptible d’être collecté, généralement quand le débiteur est en sévère défaut de paiement sur le prêt. Étant donné qu’un taux élevé de pertes sèches a un impact négatif sur le bilan financier des établissements de prêt, ceux-ci supervisent souvent étroitement les risques de perte sèche afin d’empêcher que des prêts n’en fassent l’objet.
Les établissements de prêts ont tout intérêt à s’équiper pour le traitement des données de prédiction des pertes sèches sur prêt. Le passage d’un prêt en perte sèche est le dernier recours dont dispose la banque pour un prêt en souffrance grave. En bénéficiant de données prévisionnelles, un gestionnaire de prêts peut proposer des avantages personnalisés, tels qu’un taux d'intérêt plus bas ou une période de remboursement plus longue, pour aider ses clients à continuer à rembourser leurs prêts et éviter ainsi qu’ils ne passent en pertes sèches. Pour obtenir ce type de données de prévision, les coopératives de crédit ou les banques élaborent généralement des jeux de données plus ou moins artisanaux en se basant sur les antécédents de paiement de leurs clients, et se contentent d’une simple analyse de régression statistique. Cette méthode est fortement sujette à l’erreur de compilation des données et n’est pas statistiquement sûre.
Cas d’usage potentiels
Cette solution montre comment construire et déployer un modèle d'apprentissage automatique, avec SQL Server 2019 préinstallé dans une machine virtuelle Data Science avec des services R intégrés, pour prédire si un prêt bancaire devra être remboursé dans la période donnée. Cette solution est idéale pour le secteur financier.
Perspective du gestionnaire d’activités
Cette prédiction de perte sèche se base sur une simulation de données d’historique de prêt pour prédire la probabilité de perte sèche dans un futur proche (les trois prochains mois). Plus le score est élevé, plus le risque est élevé, plus il est probable que le prêt soit une perte sèche à l’avenir.
Grâce aux données analytiques, les gestionnaires de prêts pourront également consulter les tendances et l’analyse des pertes sèches par succursale. Les caractéristiques des prêts à risque élevé pertes sèches aideront les responsables des prêts à établir des business plans pour leurs offres de prêts selon des zones géographiques précises.
SQL Server R Services transmet le calcul aux données en permettant à R de s’exécuter sur le même ordinateur que la base de données. Cela inclut un service de base de données qui s’exécute en dehors du processus SQL Server et communique de façon sécurisée avec le runtime R.
Ce modèle de solution explique comment créer et nettoyer un ensemble de données simulées, utiliser différents algorithmes pour former les modèles R, sélectionner le modèle le plus performant et effectuer des prédictions de pertes sèches, puis enregistrer les résultats de prédiction dans SQL Server. Un rapport Power BI se connecte à la table de résultats de prédiction et affiche des rapports interactifs à l’utilisateur de l’analyse prédictive.
Perspective du scientifique des données
SQL Server R Services apporte le calcul aux données en exécutant R sur l’ordinateur qui héberge la base de données. Cela inclut un service de base de données qui s’exécute en dehors du processus SQL Server et communique de façon sécurisée avec le runtime R.
Cette solution vous guide tout au long des étapes de création et d’affinage des données, de formation des modèles R et d’exécution d’un scoring sur l’ordinateur SQL Server. Les résultats de prédiction finaux seront stockés dans SQL Server. Ces données sont ensuite visualisées dans Power BI, qui contient également un résumé de l’analyse des pertes sèches sur prêt et de la prédiction des pertes sèches pour les trois prochains mois. (Les données simulées sont affichées dans ce modèle pour illustrer la fonctionnalité)
Les scientifiques des données qui testent et développent des solutions peuvent exploiter leur environnement de développement intégré R sur leur ordinateur client, tout en transmettant les calculs vers l’ordinateur SQL Server. Les solutions terminées sont déployées sur SQL Server 2016 en incorporant des appels à destination de R dans des procédures stockées. Ces solutions peuvent ensuite être automatisées avec SQL Server Integration Services et SQL Server Agent.
Cliquez sur le bouton Déployer pour tester l’automatisation et la solution complète sera disponible dans votre abonnement Azure.
Considérations
Ces considérations implémentent les piliers d’Azure Well-Architected Framework qui est un ensemble de principes directeurs qui permettent d’améliorer la qualité d’une charge de travail. Pour plus d’informations, consultez Microsoft Azure Well-Architected Framework.
Optimisation des coûts
L’optimisation des coûts consiste à examiner les moyens de réduire les dépenses inutiles et d’améliorer l’efficacité opérationnelle. Pour plus d’informations, consultez Vue d’ensemble du pilier d’optimisation des coûts.
L'abonnement Azure utilisé pour le déploiement entraînera des frais de consommation sur les services utilisés dans cette solution, soit environ 1,15 $/jour pour la machine virtuelle par défaut.
Veillez à arrêter votre instance de machine virtuelle lorsque vous n’utilisez pas la solution. Si vous exécutez la machine virtuelle, vous payez des coûts plus élevés.
Veillez à supprimer la solution si vous ne l’utilisez pas.
Contributeurs
Cet article est géré par Microsoft. Il a été écrit à l’origine par les contributeurs suivants.
Auteur principal :
- Avijit Prasad | Consultant Cloud
Étapes suivantes
Documentation du produit :
- Machines virtuelles Linux dans Azure
- Exécuter SQL Server dans le cloud
- Présentation de Power BI
- Qu’est-ce que SQL Server sur les machines virtuelles Azure Windows ?
- Machines virtuelles Windows dans Azure
Modules Microsoft Learn :
- Créer une machine virtuelle Linux dans Azure
- Créer une machine virtuelle Windows dans Azure
- Créer des rapports et des tableaux de bord avec Power BI
- Déployer et configurer des serveurs, des instances et des bases de données pour Azure SQL
Ressources associées
- Conception d’une architecture Azure Kubernetes Service (AKS)
- Optimisation de campagne avec SQL Server et Machine Learning
- Applications de gestion financière utilisant Azure Database pour PostgreSQL
- Applications de gestion financière utilisant Azure Database pour MySQL
- Prédiction de perte sèche de prêt avec clusters Azure HDInsight Spark