Análisis de calidad de datos de clientes a partir aprendizaje no supervisado en el sector de consumo.

dc.contributor.advisorGomez Miranda, Ingrid Natalia
dc.contributor.advisorBriñez de León, Juan Carlos
dc.contributor.advisorFonnegra Tarazona, Rubén Darío
dc.contributor.advisorRoldan Colorado, Sebastián Camilo
dc.contributor.authorGutiérrez Montes, Oscar Mario
dc.date.accessioned2026-03-02T16:37:16Z
dc.date.available2026-03-02T16:37:16Z
dc.date.issued2024
dc.description.abstractEste trabajo presenta un análisis de la calidad de los datos de clientes en una importante empresa del sector de consumo, utilizando un modelo de aprendizaje no supervisado basado en técnicas de clustering. El análisis se desarrolla en cuatro etapas principales, comenzando con la evaluación inicial de la calidad de los datos mediante la herramienta SAP Information Steward, que sirve como fuente de datos para la implementación del modelo. El estudio se centra en un problema crítico para las empresas: la mala calidad de los datos, la cual genera pérdidas económicas significativas, afecta la credibilidad organizacional y aumenta la insatisfacción de los clientes. Con el objetivo de abordar esta problemática, se propone una metodología para diagnosticar la calidad de los datos de clientes, permitiendo identificar deficiencias y establecer las bases para la implementación de un sistema de gestión de calidad de datos. La metodología presentada combina herramientas estadísticas y modelo de Machine Learning para evaluar y clasificar los datos en función de su calidad. Este enfoque no solo proporciona un diagnóstico claro, sino que también facilita la toma de decisiones estratégicas para optimizar la gestión de los datos y mejorar la efectividad de las operaciones empresariales. Abstract: This work presents an analysis of the quality of customer data in an important company in the consumer sector, using an unsupervised learning model based on clustering techniques. The analysis is carried out in four main stages, starting with the initial assessment of data quality using the SAP Information Steward tool, which serves as the data source for the model implementation. The study focuses on a critical problem for companies: poor data quality, which generates significant economic losses, affects organizational credibility and increases customer dissatisfaction. With the aim of addressing this problem, a methodology is proposed to diagnose the quality of customer data, allowing deficiencies to be identified and the foundations to be established for the implementation of a data quality management system. The methodology presented combines statistical tools and a Machine Learning model to evaluate and classify data based on its quality. This approach not only provides a clear diagnosis, but also facilitates strategic decision making to optimize data management and improve the effectiveness of business operations.
dc.format.extent44
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://repositorio.pascualbravo.edu.co/handle/pascualbravo/3146
dc.language.isospa
dc.publisher.facultyFacultad de ingeniería
dc.publisher.placeMedellín, Colombia
dc.publisher.programEspecialización en Big Data
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.proposalCalidad de Datosspa
dc.subject.proposalDimensiones de Calidadspa
dc.subject.proposalProtección de datosspa
dc.subject.proposalData Qualityeng
dc.subject.proposalQuality Dimensionseng
dc.subject.proposalClusteringeng
dc.subject.proposalSAP Information Stewardeng
dc.subject.proposalMachine Learningeng
dc.subject.proposalDatos maestros clientesspa
dc.thesis.levelEspecialización
dc.thesis.nameEspecialista en Big data
dc.titleAnálisis de calidad de datos de clientes a partir aprendizaje no supervisado en el sector de consumo.
dc.type.coarhttp://purl.org/coar/resource_type/c_46ec
dc.type.coarversionhttp://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.localTesis/Trabajo de grado - Monografía - Especialización
dc.type.versioninfo:eu-repo/semantics/publishedVersion
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2

Files

Original bundle

Now showing 1 - 2 of 2
No Thumbnail Available
Name:
Rep_IUPB_Esp_Big_Data_Datos_Clientes.pdf
Size:
1.13 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Autorización de derecho de publicación.pdf
Size:
53.42 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: