Amigos del Club de Ciencias Forenses, esta semana presentamos el artículo “Fraud detection via behavioral sequence embedding” de Liu, G.; Guo, J.; Zuo, Y.; Wu, J. y Guo, R. (2020), en el cual se analizan los patrones conductuales secuenciales que permiten detectar el fraude.

El fraude se puede considerar como un tipo de comportamiento anómalo con beneficios ilegales. Para ocultar estos propósitos ilegales, los estafadores pueden pretender actuar como usuarios normales. Por tanto, la detección de conductas fraudulentas sigue siendo una tarea desafiante.

Sin embargo, algunos comportamientos fraudulentos se manifiestan en períodos de tiempo consecutivos, ya que la mayoría de los estafadores no tendrían éxito a través de un único contacto con la víctima potencial. En otras palabras, cuando los comportamientos consecutivos se ordenan en una secuencia conductual, podrían observarse patrones de conducta potencialmente más anómalos indicativos de fraude, estafa…

A excepción de los atributos independientes para describir un comportamiento en las secuencias, la estructura de interacción formada en estas secuencias ¾es decir, con quién interactúan los usuarios, etc¾ también puede ayudar a sondear la normalidad de sus comportamientos. De hecho, el comportamiento fraudulento generalmente involucra a dos partes. A saber, las fuentes y los objetivos. Las que lanzan los comportamientos fraudulentos serían fuentes y las víctimas potenciales de estos actos fraudulentos los objetivos.

Las interacciones entre las fuentes que realizan el fraude y los objetivos afectados pueden formar una red dinámica bipartita. Así, los patrones de interacción pueden manifestarse naturalmente en la estructura de la red. En realidad, varios estafadores pueden formar un grupo para llevar a cabo fraudes simultáneamente, atacando consecutivamente a un grupo focal de usuarios en un corto período de tiempo.

En escenarios de fraude, un grupo de estafadores puede desempeñar diferentes roles y trabajar juntos. Por lo tanto, se considera que la estructura de interacción juega un papel importante en la distinción entre comportamientos fraudulentos y normales y que, de hecho, se origina en las secuencias de comportamiento.

Para abordar estos desafíos en la detección de fraudes, los autores propusieron modelar las secuencias de comportamiento en lugar de detectar el fraude a partir de momentos instantáneos, concretos o aislados de comportamiento. Así, los autores realizaron un análisis exploratorio en un conjunto de datos de telecomunicaciones real, con el fin de descubrir los patrones de comportamiento de los estafadores en comparación con los de los usuarios normales.

El modelo propuesto por los autores fue una nueva red neuronal recurrente. Esta se denominó modelo de memoria histórica de largo y corto plazo, basado en la atención histórica y mejorada por la red neuronal (NHA-LSTM en inglés). Su objetivo es conocer las representaciones secuenciales de conducta para la detección de fraudes.

De acuerdo con el análisis, se apreció que los estafadores pueden diferir de los usuarios normales en términos tanto deregularidad secuencial como de modo de interacción. Consecuentemente, los autores propusieron codificar comportamientos secuenciales combinando las secuencias conductuales atribuidas con la estructura de interaccióndinámica. Posteriormente, es posible emplear las representaciones conductuales aprendidas para la predicción y clasificación de secuencias, con el fin de detectar los comportamientos fraudulentos.

Específicamente, cada individuo tiene una secuencia conductual atribuida; por ello, era interesante introducir la secuencia en memoria a corto plazo. Teniendo en cuenta la influencia de los diferentes intervalos de tiempo en la distinción de patrones de comportamiento, podemos aumentar la unidad recurrente básica con los intervalos.

Además, el desarrollo de un módulo de atención autohistórica permitiría detectar ocurrencias repetidas en las interacciones para capturar patrones temporales de rutina particulares. Así, aquellos que divergen de los patrones de rutina tienen el potencial de ser identificados como fraudes, o defraudadores. Estas nociones producen, finalmente, el modelo NHA-LSTM.

De acuerdo con el objetivo de la detección de fraudes a partir de secuencias conductuales, el modelo propuesto por los autores se centra en dos tareas. Esto es, predecir el siguiente objetivo del fraude, realizado a través de la llamada en el contexto de telecomunicaciones propuesto, y clasificar las secuencias conductuales en base a determinadas etiquetas.

Así, los autores implementaron los experimentos basados ​​en ambos enfoques. Con respecto a los métodos de referencia, los autores compararon su método con varios métodos de aprendizaje de secuencias, incluida la memoria a corto plazo y sus variantes.

Los resultados mostraron lo siguiente. El modelo basado en la predicción de los objetivos de la llamada se aplicó en el conjunto de prueba para obtener la “pérdida promedio”. Esta es: los errores promedio en la predicción de los objetivos de llamada de cada individuo. Se considera que las personas que llaman con grandes errores de predicción se desvían de los patrones secuenciales regulares. Por tanto, es más probable que se identifiquen como usuarios fraudulentos.

Entre los otros métodos de referencia, la memoria a corto plazo en fases funciona mejor que otros, lo que garantiza que la información de periodicidad temporal sea realmente útil para modelar los patrones conductuales. Esto también sugiere que es necesario y efectivo integrar la dinámica del comportamiento y el modelado del contexto, lo que mejora el desempeño del modelo NHA-LSTM. Sin embargo, sin un diseño específico para dependencias a largo plazo, dicho modelo funciona peor que el tradicional de memoria a largo plazo.

Así, los usuarios normales se diferencian enormemente de los estafadores en términos de patrones de comportamiento, lo que motiva a diseñar el módulo de atención en el modelo. Para diferentes usuarios, las características cíclicas específicas de los comportamientos también son variadas. No obstante, no se detectó ninguna regularidad interpretable destacada por parte de los defraudadores, lo que ilustra que el comportamiento del defraudador tiene cierta aleatoriedad. En consecuencia, encontramos dificultades para construir características de similitud o periodicidad al considerar los comportamientos históricos.

Dados los módulos de atención autohistórica e interactivo, basado en la atención y la memoria a largo y corto plazo, el modelo logra un mejor rendimiento en la predicción de objetivos y la clasificación de estafadores. Esto contribuye a la detección de fraudes basada en las secuencias observadas.

Si quieres saber más sobre delitos de fraude y el ámbito de las Ciencias Forenses no te pierdas nuestro Máster de Análisis de Conducta en Gestión del Fraude o nuestro Experto Universitario en Investigación Criminológica, programa 100% online y certificado por la Universidad a Distancia de Madrid, con becas especiales para lectores del Club Forenses.

Write A Comment

Club de Ciencias Forenses