Especialización en Big Data
Permanent URI for this collectionhttps://repositorio.pascualbravo.edu.co/handle/pascualbravo/2792
Browse
Browsing Especialización en Big Data by Title
Now showing 1 - 6 of 6
- Results Per Page
- Sort Options
Item Aplicación de un modelo de regresión logística para predecir inconsistencias en la descarga de información durante el proceso de vinculación de clientes al servicio de energía eléctrica(Institución Universitaria Pascual Bravo, 2024) Vélez Quintana, Mateo; Briñez de León, Juan CarlosPara una empresa de servicios públicos domiciliarios la vinculación de clientes al servicio de energía eléctrica es un proceso vital en el negocio de la energía eléctrica por lo tanto es necesario garantizar la seguridad y calidad en este proceso. La verificación de solicitudes de conexión al servicio de energía eléctrica toma largos tiempos, es propensa a errores y genera altos costos operativos, además de insatisfacción entre los usuarios. Este proyecto propone el uso de herramientas de Machine Learning para automatizar la identificación de inconsistencias en los cobros de materiales y actividades y creando un modelo que permita predecir inconsistencias, mejorando la eficiencia y eliminando la aleatoriedad en las verificaciones, lo que optimizará recursos, reducirá quejas y fortalecerá la experiencia del cliente. El objetivo general es desarrollar un sistema predictivo que reduzca los tiempos manuales en un 90%, detecte inconsistencias de manera anticipada y permita estrategias de mejora continua. El método incluye la extracción y análisis de datos del sistema transaccional entre enero y octubre de 2024, para crear un modelo que identifique las solicitudes con posibles problemas. El balanceo y análisis de datos atípicos fueron de gran relevancia en el estudio. Aunque modelos como AdaBoostClassifier y XGBClassifier ofrecieron alta precisión, fueron descartados por problemas de sobreajuste. Se elige el modelo basado en Regresión Logistica con un accuracy de 86% ya que se asegura que no esta memorizando.Item Framework para la administración de activos tecnológicos basado en Big Data(Institución Universitaria Pascual Bravo, 2025) Mena Zapata, David Esteban; Becerra Botero, Miguel AlbertoEn la era digital, el manejo eficiente de los activos tecnológicos es fundamental para garantizar la competitividad y sostenibilidad de las empresas. La aplicación de Big Data ha revolucionado la administración de estos activos, permitiendo una gestión basada en datos que optimiza el rendimiento y prolonga su ciclo de vida. En este trabajo presenta un Framework para la implementación de Big Data en la administración de activos tecnológicos en una empresa prestadora de servicios de instalaciones eléctricas. A través del análisis de grandes volúmenes de información, las empresas pueden tomar decisiones estratégicas soportadas en información, reduciendo costos operativos, mejorando la planificación de mantenimiento y anticipando posibles fallos antes de que ocurran. El Framework cuenta con visualizaciones del inventario de activos, ciclos de vida, gestión de asignaciones de recursos tecnológicos, gestión financiera, análisis de riesgos, depreciación y predicción de costos, impactando en la eficiencia operativa, la reducción de tiempos de inactividad y el incremento de la productividad en organizaciones del sector. El Framework propuesto con la integración de Big Data no solo mejora la administración de activos, sino que también aporta valor estratégico a la empresa, facilitando la toma de decisiones y fortaleciendo su posición en el mercado.Item Modelo predictivo para la elección de proveedores de transporte consolidado de carga (LTL) en Estados Unidos(Institución Universitaria Pascual Bravo, 2025) Sánchez Zambrano, Camilo; Becerra Botero, Miguel AlbertoEste trabajo presenta el desarrollo de un modelo predictivo basado en técnicas de machine learning para evaluar la eficiencia de los transportistas que prestan el servicio de transporte terrestre LTL (Less-Than-Truckload, o carga consolidada). Utilizando datos históricos generados por una empresa intermediaria del sector, se construyó una herramienta capaz de predecir la probabilidad de que una empresa transportista cumpla con la recogida y entrega de un envío dentro de los plazos ofrecidos. El modelo considera variables como el área de servicio de origen y destino, características físicas de la orden (volumen, peso), servicios adicionales requeridos y otros factores operativos. Durante el proceso, se compararon y evaluaron diversos algoritmos de aprendizaje automático, identificando el enfoque más efectivo para la predicción de incumplimientos. La herramienta desarrollada funciona como un sistema de soporte a la decisión para la selección y priorización de proveedores, minimizando retrasos logísticos y mejorando la satisfacción del cliente a través de decisiones informadas y fundamentadas en datos, validadas mediante simulaciones y análisis de desempeño real.Item Modelo predictivo para la gestión eficiente del consumo de materiales en mantenimientos de redes de distribución eléctrica(Institución Universitaria Pascual Bravo, 2025) Uribe Rios, Janny Michael; Becerra Botero, Miguel AlbertoEn el ámbito del mantenimiento de redes de distribución de energía eléctrica, el consumo de materiales es constante debido a las actividades de mantenimiento preventivo y correctivo. Actualmente, la planificación de compras se realiza mediante una metodología empírica: se toma como base el consumo del año anterior, se incrementa en un 15 %, y se consideran necesidades adicionales detectadas por el personal técnico. Este enfoque puede generar ineficiencias, sobrecostos y errores en la gestión del inventario. Frente a esta situación, el presente trabajo de grado propone el desarrollo de un modelo predictivo basado en regresión lineal, utilizando datos históricos de consumo de materiales correspondientes a los años 2021, 2022, 2023 y 2024. Este modelo está diseñado para proyectar el consumo del año inmediatamente siguiente al más reciente disponible, facilitando una estimación más precisa y técnica de las necesidades materiales. La implementación del modelo permitirá optimizar la planificación de compras, reducir el desperdicio de recursos, mejorar la gestión de inventarios y modernizar los procesos de toma de decisiones en la adquisición de insumos. De esta manera, se busca fortalecer la eficiencia operativa y asegurar la continuidad y calidad del servicio eléctrico.Item Predicción de demanda por línea de venta con aprendizaje automático(Institución Universitaria Pascual Bravo, 2025) Ospina Rendon, Diego Fernando; Becerra Botero, Miguel AlbertoEste trabajo se enfoca en el diseño de un sistema de soporte para la toma de decisiones, fundamentado en la predicción de la demanda de productos en una empresa del sector retail dedicada a la comercialización de autopartes. El análisis se orientó a cuatro líneas de venta estratégicas: Línea Diesel, Línea CamperosDicol, Línea Rodamientos y Línea Tamayo. Se desarrolló un proceso integral que incluyó análisis exploratorio de datos (EDA), visualización de series temporales y un análisis comparativo entre modelos estadísticos de series de tiempo (SARIMA) y de aprendizaje automático (Random Forest). Los modelos SARIMA evidenciaron limitaciones, especialmente en líneas con alta variabilidad como CamperosDicol y Tamayo, mostrando valores negativos en R² y errores de predicción elevados. En contraste, el modelo Random Forest, tras la optimización de hiperparámetros, logró un desempeño sobresaliente en todas las líneas de venta. En particular, alcanzó valores de R² superiores al 0.89 y reducciones significativas en MAE y RMSE, destacándose como la opción más precisa y robusta para la predicción de la demanda. En términos de exactitud, el mejor resultado se obtuvo en la Línea Rodamientos con Random Forest optimizado, alcanzando un R² de 0.9213 y un MAE de tan solo 50.38 unidades, lo cual representa un nivel de precisión altamente favorable para la planificación de inventario y toma de decisiones estratégicas.Item Valor agregado de las pruebas saber TyT : una aproximación metodológica desde regresiones lineales(Institución Universitaria Pascual Bravo, 2025) Balbín Rondón, Diego Esteban; Becerra Botero, Miguel AlbertoEl trabajo presenta una metodología para estimar el valor agregado (VA) en Colombia haciendo énfasis en la Institución Universitaria Pascual Bravo por medio de las pruebas Saber 11 (línea de base) y Saber TyT (logro de salida). Se implementa un proceso de ETL que unifica más de seis millones de registros, seguido de limpieza de datos, discretización de puntajes mediante “binning” y normalización. El modelo principal es una regresión lineal múltiple con covariables sociodemográficas y académicas, cuyos residuos se interpretan como el VA individual; adicionalmente, un árbol de decisión (CART) explora posibles interacciones no lineales. Los diagnósticos (R² ≈ 0,50, homocedasticidad y normalidad de residuos) respaldan la validez del enfoque lineal.