
Modelos de IA para análisis de riesgo en bancos españoles
El riesgo de crédito en España atraviesa una modernización acelerada. La combinación de datos ricos (open banking), señales macro locales y técnicas de aprendizaje automático permite estimar con más precisión la probabilidad de incumplimiento (PD), la pérdida dado incumplimiento (LGD) y la exposición (EAD). Sin embargo, la mejora estadística debe convivir con exigencias regulatorias (EBA, Banco de España), IFRS 9, explicabilidad y control de sesgos. Este artículo resume una ruta práctica para entidades españolas de banca y consumo.
Segmentación y definición del problema
Antes de entrenar, defina la segmentación: hipotecas, consumo, revolving, SME. Cada cartera tiene dinámicas de impago diferentes. En hipotecas pesa la relación cuota/ingresos, el LTV y la sensibilidad a tipos (Euríbor); en consumo, variables de empleo y rotación de saldo; en pymes, flujos de caja y concentración de clientes. Alinee horizontes: PD a 12 meses (IFRS 9 stage 1) y PD de por vida para escenarios stage 2.
Datos: fuentes españolas y enriquecimiento
- Transaccionales PSD2: series de ingresos/egresos, salarios, domiciliaciones, recurrencia y estacionalidad.
- Macro locales: INE (paro, IPC), Banco de España (tipos, crédito a hogares/empresas), series del Euríbor.
- Información interna: historial de morosidad, reestructuraciones, garantías, colaterales y valoraciones.
- Señales alternativas: estabilidad residencial, antigüedad de cuenta, y métricas de comportamiento en canales digitales.
Modelización PD/LGD/EAD con IA
Para PD, gradient boosting (XGBoost/LightGBM) y modelos lineales con splines ofrecen equilibrio entre potencia y explicabilidad. Para LGD, modelos two-stage (probabilidad de pérdida > 0 y severidad) o beta/GLM con transformación logit. En EAD, se modela la credit conversion factor en líneas de crédito; árboles y random forests funcionan bien.
Incluya factores macro y construya versiones point-in-time y through-the-cycle. Para IFRS 9, ligue PD/LGD/EAD a escenarios macro (base, adverso, optimista) con ponderaciones aprobadas por Riesgos. Realice stress testing usando shocks realistas en España (subidas de Euríbor, caída de empleo).
Explicabilidad y sesgos
En España, explicar por qué se deniega un crédito no es opcional. Calcule SHAP global y local para cada decisión; genere plantillas de explicación en lenguaje claro para clientes. Mida sesgos por edad, región o tipo de contrato (temporal/indefinido) y aplique mitigaciones: reweighing, umbrales por segmento o exclusión de variables proxy. Documente decisiones en un Modelo Book con finalidad, datos, rendimiento y límites de uso.
Gobierno de modelos: validación y monitorización
- Validación independiente: pruebas de estabilidad, population stability index, backtesting por cohortes y sensibilidad.
- Métricas: AUC/Gini, KS, brier score, y calibration curves. Para LGD, error absoluto medio y bandas de cobertura.
- Monitorización: deriva de datos, concept drift, cambios en mezcla de producto y alertas automáticas.
- Controles: umbrales de uso, aprobación por comité de modelos, revisiones anuales y trazabilidad (MLflow).
IFRS 9 y conexión contable
La estimación de pérdidas esperadas requiere PD/LGD/EAD condicionadas por escenario macro. Establezca pipelines reproducibles con cortes de datos mensuales y snapshots de modelos. Verifique la transición entre stages y el impacto en provisiones. Documente supuestos y sensibilidad ante cambios en Euríbor o paro; esto facilita auditorías y diálogo con supervisores.
Operativización en España
Integre el scoring en canales (web, móvil, oficinas) con respuestas en milisegundos y feature store común para evitar desalineaciones. Aplique controles de calidad de entrada (validación de IBAN, domicilios, empleador) y límites por segmento. Defina un challenger permanente para comparar desempeño y activar rollbacks si la calidad cae.
Hoja de ruta
- Inventario de modelos y evaluación de madurez (datos, métricas, documentación).
- Construcción de dataset único con variables macro españolas y feature store.
- Entrenamiento y selección (explicabilidad como criterio clave).
- Gobierno y aprobaciones, definición de límites de uso.
- Despliegue, monitorización y revisiones trimestrales.
Nota: Este artículo es informativo. No constituye asesoramiento financiero ni contable. Consulte normativa vigente y a su área de riesgo.