La modélisation des risques avec Hadoop

La modélisation des risques est un autre cas d'utilisation importante qui est alimenté par Hadoop. Vous verrez que cela correspond étroitement le cas d'utilisation de la détection de la fraude en ce qu'elle est une discipline basée sur un modèle. Le plus de données que vous avez et plus vous pouvez “ relier les points, n ° 148; le plus souvent, vos résultats donneront de meilleurs modèles de prédiction des risques.

Le mot qui englobe tout risque peut prendre beaucoup de significations. Par exemple, la prévision de taux de désabonnement est le risque d'un client de passer à un competitor- le risque d'un portefeuille de prêts concerne le risque de risque default- dans les soins de santé couvre toute la gamme de contenir la pandémie à la sécurité alimentaire à la probabilité de réinfection et plus .

Le secteur des services financiers (FSS) est maintenant investit massivement dans la modélisation du risque basé sur Hadoop. Ce secteur vise à accroître l'automatisation et l'exactitude de son évaluation des risques et la modélisation de l'exposition.

Hadoop offre aux participants l'opportunité d'étendre les ensembles de données qui sont utilisés dans leurs modèles de risque à inclure des sources sous-utilisées (ou des sources qui ne sont jamais utilisés), tels que l'e-mail, la messagerie instantanée, les médias sociaux, et les interactions avec les représentants du service à la clientèle, entre d'autres sources de données.




Les modèles de risque dans FSS pop up partout. Ils sont utilisés pour la prévention de la perte de clients, le commerce modélisation de la manipulation, le risque d'entreprise et de l'analyse de l'exposition, et plus encore.

Quand une société émet une police d'assurance contre les catastrophes naturelles à la maison, un défi est de voir clairement combien d'argent est potentiellement à risque. Si l'assureur ne parvient pas à réserver de l'argent pour des gains possibles, les régulateurs interviendront (l'assureur ne veut pas que) - si l'assureur met trop d'argent dans ses réserves pour payer les futures revendications politiques, ils ne peuvent pas ensuite investir votre argent prime et faire un profit (l'assureur ne veut pas que ce soit).

Certaines entreprises sont “ aveugle ” le risque qu'ils font face parce qu'ils ont été incapables d'exécuter une quantité adéquate de simulations catastrophiques concernant variance de la vitesse du vent ou des taux de précipitations (entre autres variables) qui ont trait à leur exposition.

Tout simplement, ces entreprises ont de la difficulté stress tester leurs modèles de risque. La capacité à se replier en plus de données - par exemple, les conditions météorologiques ou la répartition socio-économique en constante évolution de leur clientèle - leur donne un aperçu beaucoup plus et la capacité en matière de construction de meilleurs modèles de risque.

Construction et risque stress-testing des modèles comme celui qui vient décrit est une tâche idéal pour Hadoop. Ces opérations sont souvent coûteux en calcul et, quand on construit un modèle de risque, probablement impossible de courir contre un entrepôt de données, pour ces raisons:

  • L'entrepôt est probablement pas optimisé pour les types de requêtes émises par le modèle de risque. (Hadoop est pas lié par les modèles de données utilisés dans les entrepôts de données.)

  • Un job batch grande, ad hoc comme un modèle de risque évolution serait ajouter la charge à l'entrepôt, influençant applications analytiques existants. (Hadoop peut assumer cette charge de travail, libérer l'entrepôt pour un reporting régulier de l'entreprise.)

  • Plus de modèles de risque avancés peuvent avoir besoin de prendre en compte les données non structurées, telles que du texte brut. (Hadoop peut gérer cette tâche efficacement.)


» » » » La modélisation des risques avec Hadoop