Ingresa o regístrate acá para seguir este blog.

Por: E. Restrepo. de Stradata. Colaboradores de Auditool

Entre los diversos problemas que a diario suelen enfrentar las entidades financieras, uno muy común es la detección de delitos de LAFT. Para esto, una práctica frecuente es el uso de escenarios para la detección de operaciones inusuales, los cuales son definidos a través de umbrales con los que se compara la información de los clientes; sin embargo, una parte importante de este tipo de procedimientos es la definición del umbral correcto para la generación de alertas.

Se considera que usualmente la tasa de alertas tipo falso positivo al interior de las entidades financieras ronda entre el 95-99 %, por lo que la disminución de este porcentaje significa la reducción de recursos invertidos en esta operación.

Vamos a desarrollar un ejemplo práctico para la definición del umbral. Supongamos que una persona transa, en varias oportunidades, pequeñas cantidades de dinero, para definir en este caso un umbral sería necesario crear una variable que sume las transacciones y sobre este valor, lo determine. Ahora, ¿Cuál debería ser ese umbral y con base en qué asunciones se deberían definir?

Método BTL (Prueba bajo la línea)

Un método de flexibilización de los umbrales para la generación de las alertas debería buscar que no se pierdan verdaderos positivos, pero que además sea un valor lo suficientemente alto para la disminución de los falsos positivos. Para explicar este método, continuemos con el ejemplo previamente mencionado: supongamos que se definió un umbral en el valor de las transacciones acumuladas de 10’000.000 de pesos para las alertas de los clientes, esto significa que si al sumar para cualquier cliente los montos de sus transacciones se obtiene un valor, por ejemplo de 20’000.000 de pesos, se generaría una alerta asociada. Lo que se quiere analizar ahora es si el umbral de 10’000.000 es cercano al riesgo que la empresa espera afrontar o si 20’000.000 es un mejor umbral.

Este método propone que para un caso como el mencionado, se debe proceder a analizar cuántas de las alertas generadas bajo los umbrales definidos son positivas; es decir, pueden representar realmente una actividad ilícita de una muestra aleatoria del grupo de alertas generadas, de forma que se pueda evaluar esta muestra como la población de alertas.

Es importante, antes de proceder con este método, haber formado segmentos del factor que se está evaluando, de lo contrario se va a encontrar una variabilidad significativa en las alertas halladas y la muestra puede que no refleje la población.

Para entender mejor esto, y siguiendo con nuestro ejemplo de las transacciones, es probable que en la distribución de los valores de las transacciones de todos los clientes, se tenga una distribución sesgada a la derecha; es decir, que se cuente con una gran cantidad de clientes que realizan transacciones de baja cuantía, y unos pocos que las realizan por altas sumas, por lo que es importante previo a este análisis contar con los resultados de la segmentación.

El paso final es graficar todas las alertas clasificadas como positivas y falsas positivas junto al umbral definido, como se muestra a continuación, donde se observa en el eje “y” el monto máximo transado en el mes y en el eje “x” la suma de todos los valores transados en el mismo período de tiempo.

En el ejemplo anterior se observa cómo el umbral, inicialmente escogido, es prudente para la información encontrada; sin embargo, este podría ser al menos llevado a 20’000.000 para evitar en el futuro nuevos falsos positivos.

Conoce otros métodos

Otros métodos, que se encuentran en la industria, para la detección de operaciones inusuales son los monitoreos basados en reglas; sin embargo, otras de las soluciones que hoy en día cobra más fuerza es la implementación de modelos basados en la información histórica recolectada.

Es importante que se tenga claro cuál es el problema al que se busca dar solución, a la hora de seleccionar un modelo. En este caso, nos centraremos en la pregunta sobre si una alerta realmente representa un riesgo o si, por el contrario, es un falso positivo. Para este tipo de análisis, en el que la predicción sólo cuenta con dos resultados posibles, es apropiado usar modelos del tipo supervisado binario, pero con este tipo de soluciones surge otro interrogante y es el de la selección de un modelo óptimo.

Para esta decisión, va a ser importante entender los factores de precisión e interpretabilidad de los resultados de los modelos, esto lo podemos explicar mejor con dos casos específicos. Suponga que usted desea determinar en qué fondo invertir una determinada suma de dinero, de tal forma, que en un año, sus rendimientos superen el 10 %. Como su objetivo es que al término definido usted pueda recuperar su dinero más un rendimiento, se considera que tiene un mayor peso la precisión que le brinde el modelo en los resultados, más que entender el porqué de ellos, así pues, en este caso usted debería usar un modelo en el que prime la predictibilidad del modelo.

Por otro lado, suponga que usted está estudiando un nuevo virus y requiere predecir la probabilidad de que una persona lo adquiera. Para este caso, se considera que es más importante entender qué características de la persona, usada en el modelo, de acuerdo con los resultados de éste, la hacen más susceptible a contraerlo; es decir, en este caso prima la interpretabilidad del modelo.

Ahora, al aplicar esta lógica en nuestro escenario, encontramos que las alertas hacen parte de unos procedimientos regulados y auditados; es decir, se requiere entender porqué una determinada alerta, de acuerdo con el modelo, debe ser investigada y cuáles considera son falsos positivos. Es así, como encontramos que entre los mejores modelos, en cuanto a entendimiento de los resultados, están los árboles de decisión y la regresión logística.

En Stradata contamos con diferentes técnicas para las definiciones de alertas, y ponemos a tu disposición diferentes soluciones basadas en la experiencia que pueden guiar a tu organización a una gestión de riesgos más eficiente.

Autor: E. Restrepo.

Compartir post