← Volver al blog

IA y Riesgos Financieros

La IA puede cometer ilegalidades financieras, analiza los riesgos con estadística y datos.

IA y Riesgos Financieros

Paso 1: Entender el contexto de la IA y los riesgos financieros

Los supervisores financieros europeos han lanzado una advertencia que parece sacada de una novela de ciencia ficción, pero que es muy real: los sistemas de inteligencia artificial que operan en bancos y mercados podrían llegar a tomar acciones por su cuenta y, sin que nadie se lo ordene, cometer ilegalidades. La relación entre la IA y los riesgos financieros ya no es una cuestión teórica: algoritmos que ejecutan miles de operaciones por segundo pueden aprender atajos peligrosos, como manipular precios o coordinarse con otros algoritmos, simplemente porque eso maximiza su objetivo. 🧠

Para el aula de estadística y análisis de datos, esta noticia es oro puro. Detrás de la alerta de los supervisores hay una pregunta perfectamente formulable en términos de datos: ¿cómo distinguimos una operación financiera legítima de una potencialmente ilegal? Esa pregunta es, ni más ni menos, un problema de clasificación supervisada: la metodología que vamos a trabajar paso a paso en este artículo. 🎯

La paradoja es deliciosa y muy educativa: usaremos inteligencia artificial (un clasificador entrenado con datos) para vigilar a otra inteligencia artificial. El vigilante y el vigilado hablan el mismo idioma: el de los datos.

Paso 2: Recoger los datos

Todo modelo de clasificación necesita ejemplos etiquetados. En el contexto de la supervisión financiera, los reguladores disponen de históricos de operaciones donde se sabe, a posteriori, cuáles resultaron ser irregulares (sancionadas, investigadas o anuladas) y cuáles fueron perfectamente legales. Cada operación se describe mediante variables predictoras (features) y una etiqueta (la clase que queremos predecir).

Variables razonables para este problema serían:

  • Importe de la operación (variable cuantitativa continua). 💶
  • Frecuencia de operaciones por minuto del mismo algoritmo (cuantitativa discreta).
  • Desviación respecto al precio medio de mercado, en porcentaje (cuantitativa).
  • Grado de autonomía del sistema de IA que ejecutó la orden, de 0 a 10 (ordinal).
  • Cancelaciones inmediatas: proporción de órdenes lanzadas y retiradas en menos de un segundo, un patrón típico del spoofing o manipulación de mercado (cuantitativa).
  • Etiqueta: operación legal u operación irregular (cualitativa binaria, nuestra variable objetivo).

En clase no tenemos acceso a datos reales de un supervisor, así que construiremos un conjunto pequeño con datos ilustrativos para uso docente, claramente inventados pero verosímiles.

Paso 3: Explorar los datos

Antes de clasificar nada, exploramos. La siguiente tabla muestra un fragmento de nuestro conjunto de entrenamiento (datos ilustrativos para uso docente, no reales):

OperaciónImporte (€)Órdenes/minDesviación precio (%)Autonomía IA (0-10)Cancelaciones <1s (%)Etiqueta
112.50040,321legal
2980.0003104,8962irregular
345.200120,958legal
42.300.0005407,11081irregular
567.000251,2614legal
6730.0002903,9855irregular
78.90020,110legal
81.150.0004205,6973irregular

La exploración con estadística descriptiva ya nos da pistas 🔎: las operaciones irregulares concentran importes altos, frecuencias de órdenes desorbitadas y porcentajes de cancelación inmediata muy superiores. Pero el ojo humano no escala a millones de operaciones diarias. Necesitamos un modelo.

Panel de gráficos y datos para analizar la IA y los riesgos financieros en los mercados
Los paneles de datos permiten vigilar en tiempo real el comportamiento de los algoritmos en los mercados. Fotografía: Unsplash (Stephen Dawson).

Paso 4: Elegir la técnica para clasificar riesgos financieros con IA

Nuestra variable objetivo es binaria (legal/irregular) y disponemos de ejemplos etiquetados: el escenario ideal para la clasificación supervisada. 📚 Dentro de esta familia hay varios algoritmos posibles; para el aula, la regresión logística es una elección excelente porque:

  • Devuelve una probabilidad de que cada operación sea irregular, no solo una etiqueta seca. Eso permite graduar la respuesta del supervisor: revisar, alertar o bloquear.
  • Sus coeficientes son interpretables: podemos explicar a un regulador (o a un tribunal) por qué el modelo señaló una operación. En finanzas, la explicabilidad no es un lujo, es una exigencia legal. ✅
  • Se implementa en dos líneas con herramientas estándar, como documenta la documentación oficial de scikit-learn (Python).

El flujo clásico: dividir los datos en entrenamiento (70-80 %) y prueba (20-30 %), entrenar con los primeros y evaluar con los segundos, que el modelo nunca ha visto.

Paso 5: Ejecutar el análisis

En Python, el esqueleto del análisis cabe en pocas líneas:

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, stratify=y)
modelo = LogisticRegression().fit(X_train, y_train)
probabilidades = modelo.predict_proba(X_test)

Un detalle crucial que conviene discutir en clase: las operaciones irregulares son raras (quizá 1 de cada 1.000). Este desbalanceo de clases obliga a usar muestreo estratificado y a desconfiar de la exactitud global como métrica única. Un modelo que diga siempre «legal» acertaría el 99,9 % de las veces… y sería completamente inútil. 💡

Paso 6: Interpretar resultados

La herramienta estrella para evaluar un clasificador es la matriz de confusión, que cruza lo que predijo el modelo con la realidad. Con nuestros datos ilustrativos, un resultado típico sería: de 100 operaciones de prueba, 90 legales bien clasificadas (verdaderos negativos), 6 irregulares detectadas (verdaderos positivos), 3 falsas alarmas (falsos positivos) y 1 operación irregular que se escapó (falso negativo).

De ahí salen las métricas clave: la sensibilidad (6/7 ≈ 86 % de las irregularidades detectadas) y la precisión (6/9 ≈ 67 % de las alertas eran reales). En supervisión financiera, un falso negativo (ilegalidad no detectada) suele costar mucho más que un falso positivo (revisar una operación honesta), así que ajustaremos el umbral de probabilidad para priorizar la sensibilidad. 🧮

📈 Visualización recomendada: dos gráficos complementarios. Primero, la matriz de confusión como mapa de calor (en filas la clase real, en columnas la clase predicha, y el color indicando el número de casos). Segundo, la curva ROC: en el eje X la tasa de falsos positivos, en el eje Y la tasa de verdaderos positivos; cuanto más se acerque la curva a la esquina superior izquierda (área bajo la curva próxima a 1), mejor distingue el modelo entre operaciones legales e irregulares.

Paso 7: Comunicar la conclusión sobre la IA y el riesgo financiero

El último paso de todo análisis es contarlo bien. La conclusión que un estudiante debería saber redactar: «el modelo de clasificación supervisada detecta el 86 % de las operaciones irregulares con un nivel de falsas alarmas asumible, y las variables más influyentes son el porcentaje de cancelaciones inmediatas y la frecuencia de órdenes». Comunicar también implica reconocer límites: el modelo aprende del pasado, y una IA financiera que invente una forma nueva de saltarse la ley no estará en los datos de entrenamiento. Por eso los supervisores insisten en combinar modelos con vigilancia humana.

Esta es exactamente la alfabetización en datos que la escuela puede aportar frente a los desafíos de la IA en las finanzas. Si eres docente y quieres llevar este enfoque a tu programación, en nuestros recursos para profesores de canaldocente.es encontrarás más materiales para conectar actualidad y estadística.

Mini-reto para clase

Propón a tu alumnado esta secuencia de retos sobre la IA y los riesgos financieros 🎯:

  1. Con la tabla de datos ilustrativos, calcula la media y la desviación típica del porcentaje de cancelaciones en cada grupo (legal/irregular). ¿Qué variable separa mejor las dos clases?
  2. Dibuja a mano un diagrama de dispersión con «órdenes por minuto» en el eje X y «cancelaciones <1s» en el eje Y, coloreando cada punto según su etiqueta. ¿Podrías trazar una frontera que separe las clases?
  3. Un modelo clasifica como «legal» todas las operaciones y acierta el 99,9 %. Explica con tus palabras por qué es un mal modelo a pesar de su exactitud.
  4. Construye la matriz de confusión de un clasificador que, sobre 200 operaciones (190 legales y 10 irregulares), detecta 8 irregulares y genera 5 falsas alarmas. Calcula sensibilidad y precisión.
  5. Debate: si bajamos el umbral de alerta para no dejar escapar ninguna ilegalidad, ¿qué precio pagamos? ¿Quién debería decidir ese umbral: el programador, el banco o el regulador?
  6. Investiga un caso real de manipulación algorítmica de mercado (por ejemplo, el flash crash de 2010) y enumera qué variables habrías incluido en el modelo para detectarlo.

Con este recorrido, la advertencia de los supervisores deja de ser un titular inquietante y se convierte en lo que de verdad es: una invitación a formar ciudadanos capaces de auditar con datos a las máquinas que ya deciden por nosotros. 📊