Proyectos
Customer Churn Predictor
Desarrollé varios modelos de ML para predecir la cancelación de usuarios en una compañía telefónica. Los modelos boosting, en particular CatBoost, lograron un ROC entre 0.93 y 0.94 y una precisión de hasta 0.90 en el conjunto de prueba. La antigüedad del cliente se identificó como factor crítico, lo que subraya la importancia de la fidelización temprana para reducir cancelaciones.
Análisis de sentimiento automatizado
Desarrollé un sistema inteligente para filtrar y clasificar automáticamente reseñas. Entrené modelos de machine learning con lematización usando NLTK, Spacy y BERT para análisis de sentimiento. Como resultado sugerí la utilización de Logistic Regression con lematización NLTK o Spacy, debido a su alto F1 (>0.85) y bajos tiempos de predicción, equilibrando precisión y eficiencia en producción.
Predicción de solicitudes de taxi
El proyecto desarrolló un modelo predictivo para estimar la demanda de taxis en aeropuertos, basándose en datos históricos horarios de marzo a agosto de 2018. Entre los diferentes modelos analizados, destacó el LGBMRegressor, pues logró un MSE de 40.06, lo que permitió anticipar con precisión los picos de solicitudes y optimizar la asignación de conductores en horas críticas, mejorando la disponibilidad de taxis.
Predicción automática para coches usados
Este proyecto predice el valor de mercado de coches usados mediante machine learning, usando un dataset de 354,369 registros con historial, especificaciones y precios. Destacaron los modelos XGBoost y LightGBM, ambos con alto balance entre precisión (RECM 0.0790 y 0.0784) y velocidad de ejecución (~7 segundos). XGBoost fue seleccionado por su mejor desempeño para optimizar calidad y eficiencia.
Identificación de perfil de clientes
Desarrollé un algoritmo para identificar clientes para estrategias de marketing en una empresa de seguros. El análisis evidenció una población joven, equilibrada en género, con ingresos medios-bajos y hogares pequeños. El modelo alcanzó un score F1 de 0.97, clasificó correctamente el 88.87% de casos negativos y el 10.4% de los positivos, demostrando alta precisión y eficacia en segmentación de clientes.
Análisis de ventas de videojuegos
El proyecto analiza patrones clave en ventas de videojuegos para ICE mediante datos históricos, con el fin de pronosticar ventas para su próximo año y optimizar campañas de marketing. Se utilizó análisis estadístico para revelar una correlación moderada (0.41) entre ventas y críticas, destacando la predominancia de juegos de acción y clasificación Mature como factores de éxito.