Topics about Data Sciences and BI
Foto de Usuario
SantiagoGamarra

Ranking Troomes
Mensajes: 25
Registrado: 16 Abr 2020, 10:45

Intelligent churn prediction for telecom using GP-AdaBoost learning and PSO undersampling

Mensaje por SantiagoGamarra » 15 Ago 2020, 00:12

Intelligent churn prediction for telecom using GP-AdaBoost learning and PSO undersampling

Descripción
En estos días, la industria de las telecomunicaciones se enfrenta a una petición para satisfacer a sus clientes. Esta competencia por ende requiere un sistema eficiente de predicción de abandono para identificar clientes consumidores que están dispuestos a dejar la empresa. Estos clientes de abandono son entonces retenido mediante el tratamiento de las razones relevantes identificadas por sistema de predicción de abandono.
El sistema de predicción no solo está restringido a predecir con precisión posibles fugas sino también para interpretar el comportamiento de abandono de clientes.

Experimentación
GP ha manejado con éxito varios problemas de agrupación reglas de asociación, regresión y descubrimiento. Pero las capacidades flexibles y distintivas de GP lo convierten en un técnica apropiada para la clasificación, y para la predicción de abandono. Asimismo, AdaBoost es otra técnica de clasificación basada en el impulso, que funciona iterativamente para ensamblar múltiples clasificadores débiles. En cada iteración, un clasificador evoluciona aprendiendo de las instancias que no están correctamente clasificadas en el iteración. Este trabajo emplea una clasificación de enfoque en conjunto (GP-AdaBoost) basado en la incorporación de impulsar la evolución de varios programas de médicos de cabecera.

Preprocesamiento del conjunto de datos
El conjunto de datos de telecomunicaciones tiene anomalías comunes o características vacías, se abordan utilizando filtros proporcionados mediante la herramienta WEKA.

Características demográficas
Las características demográficas de los clientes incluían género, estado civil, educación, estado, tipo de trabajo, ingresos y edad de los clientes. A excepción de los ingresos, toda la información de los clientes estaba disponible.

Patrones espacio-temporales y de elección ( STC )
Las características de comportamiento comprenden patrones de gasto espacio-temporales implícitos y fi-patrones de elección financiera. Patrones de gasto espacio-temporales, a saber , diversidad , lealtad ,y regularidad , se refieren a las medidas de cuán diversos o leales son los clientes en sus gastos patrones de comportamiento desde las perspectivas de tiempo y ubicación, mientras que los patrones de elección financiera incluyen indicar cómo los clientes distribuyen sus actividades financieras con respecto a comerciantes, categorías de gastos y direcciones de las transferencias de fondos.

Etiquetado
Existen numerosas definiciones de abandono de clientes en la literatura, y la mayoría de las definiciones representan un aspecto muy específico de la actividad de los clientes, como si usó su tarjeta de crédito durante un período de tiempo específico, ya sea que hicieron una llamada durante una ventana de observación, como una descripción de concepto difuso, o algunas otras métricas basado en la metodología de ventana deslizante.

Submuestreo basado en PSO
Los conjuntos de datos de telecomunicaciones generalmente tienen menos instancias de clase abandono y la mayor parte del conjunto de datos se compone de instancias. La distribución de clases de desequilibrio presente en los conjuntos de datos dan como resultado principalmente un bajo rendimiento de predicción de algoritmos de clasificación. La mayoría de los que no abandonan.
Para establecer la relación entre las decisiones de abandono de los clientes y sus patrones de comportamiento, se preparó características demográficas y de comportamiento a partir de los datos conjunto. Para la caracterización de las características del comportamiento, empleamos una ligera variante del la técnica de extracción de patrones y, además, presentó un nuevo conjunto de características, a saber, la entropía de elección , que explica las tendencias de gasto y transferencia de los clientes.

Predictor de abandono basado en GP-AdaBoost
La predicción de abandono de clientes es un problema de clasificación binaria. Los algoritmos de clasificación establecen criterios de decidir una clase particular para una instancia de prueba, sujeto a los valores de determinadas características. En la predicción de abandono, una clase binaria sifier se induce con un conjunto de instancias etiquetadas con clases y luego el clasificador aprendido se utiliza para diferenciar casos de prueba de abandonos y no abandonos. GP es un método de búsqueda capaz de lograr una solución óptima y por tanto, se puede utilizar para inducir a un clasificador a ser un predictor de abandono.

Resultados
El Ch-GPAB predice de manera eficiente los abandonos de telecomunicaciones y también es eficaz para investigar el comportamiento de abandono de los clientes. En Ch-GPAB, se han desarrollado números P de programas de GP por clase utilizando un enfoque de impulso. Cada programa de GP evolucionado se compone de un conjunto de funciones, que se desarrolla utilizando los terminales dados y características disponibles del conjunto de datos de telecomunicaciones. Las funciones que se eligen con frecuencia en los programas P GP pueden utilizarse para investigar el comportamiento de abandono de los clientes. La característica "marryno" identifica el estado civil de un cliente como soltero. Es más frecuente la función seleccionada de 76 funciones disponibles de Cell2Cell conjunto de datos, que muestra la importancia de esta característica en las inversiones para evaluar el comportamiento de abandono de los clientes. Del mismo modo, ambos "Camión" y "referir" son las segundas funciones más frecuentes, que muestran, respectivamente, que el cliente posee un camión y referencias hechas por un cliente. "Dropvce" está en la lista de tercera característica seleccionada con más frecuencia del conjunto de datos de telecomunicaciones y muestra el estado de la calidad de la voz. Teniendo en cuenta estas características, las áreas potenciales se pueden marcar, lo que en consecuencia puede ser explorado por los gerentes de marketing para tomar decisiones efectivas. Además, atractivos planes de tarifas y otros beneficios pueden ofrecerse a un nicho de mercado mediante la investigación de las características seleccionadas con frecuencia por Ch-GPAB.

Conclusiones
Se puede concluir que el algoritmo GP-AdaBoost en combinación con PSO es presentado como un enfoque de predicción de abandono (Ch-GPAB) para telecomunicaciones. El método basado en PSO submuestra a la clase mayoritaria instancias y desarrolla un conjunto de entrenamiento equilibrado que se extiende aprendizaje mejorado al predictor de abandono propuesto, lo que resulta en rendimiento de predicción mejorado. Enfoque Ch-GPAB desarrolla múltiples programas GP por clase usando el estilo AdaBoost técnica de impulso, que refuerza su capacidad de clasificación . Cada programa GP actúa como un clasificador de clase única y una suma ponderada más alta de los programas de GP decide la dirección de una instancia de prueba, extendiendo resultados más confiables.
También se concluye que la decisión de abandono se puede predecir en gran medida analizando patrones dinámicos de comportamiento que el cliente sigue tanto en el ámbito temporal como en el espacial y la entropía de las elecciones que hace mientras realiza actividades financieras. Este resultado solidifica resultados previos en la literatura sobre la relación entre patrones de movilidad espacio temporal y bienestar financiero individual, pero también sirve como primer paso hacia el modelado eficaz del comportamiento de batido utilizando recursos financieros a gran escala de la transición de los datos.Las características de diversidad y regularidad parecen tener un efecto amplio y sistemático en el rendimiento de predicción. Las razones reales detrás de los clientes, la decisión de abandono podría afectar su energía para explorar nuevos productos o su determinación para permanecer como cliente del banco. La tendencia decreciente de la diversidad hacia el momento de la deserción de los clientes que se muestran. Los resultados sugieren que las personas más jóvenes parecen tener una como recortado a las personas de edad avanzada en lo que se refiere a los patrones de comportamiento , una observación coherente en varios conjuntos de datos que se consideran.

Fuente
https://link.springer.com/article/10.10 ... 017-1154-3
https://epjds.epj.org/articles/epjdata/ ... e_165.html


Responder