Análisis y diseño de técnicas de preprocesamiento de instancias escalables para problemas no balanceados en Big Data : aplicaciones en situaciones de emergencias humanitarias

Detalles Bibliográficos
Autor Principal: Basgall, María José
Otros autores o Colaboradores: Naiouf, Ricardo Marcelo (Director/a), Fernández Hilario, Alberto (Director/a)
Formato: Tesis
Lengua:español
Datos de publicación: 2022
Temas:
Acceso en línea:http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2520
Consultar en el Cátalogo
Descripción Física:1 archivo (4,3 MB) : il. col.

MARC

LEADER 00000nam a2200000 a 4500
003 AR-LpUFIB
005 20250311170521.0
008 230201s2022 ag a om 000 0 spa d
024 8 |a DIF-M8607  |b 8831  |z DIF007882 
040 |a AR-LpUFIB  |b spa  |c AR-LpUFIB 
100 1 |a Basgall, María José 
245 1 0 |a Análisis y diseño de técnicas de preprocesamiento de instancias escalables para problemas no balanceados en Big Data :  |b aplicaciones en situaciones de emergencias humanitarias 
260 |c 2022 
300 |a 1 archivo (4,3 MB) :  |b il. col. 
502 |a  Tesis (Programa de Doctorado en Tecnologías de la Información y la Comunicación) - Universidad Nacional de La Plata. Universidad de Granada, 2022. 
505 0 |a  I Introducción y base teórica -- 1 Introducción -- 1.1 Objetivos -- 1.2 Metodología -- 1.3 Organización de la tesis -- 2 Características de los datos -- 2.1 Complejidades intrínsecas de los datos -- 2.2 Análisis exploratorio de datos -- 2.3 Comentarios del capítulo -- 3 Aprendiendo de los datos -- 3.1 Aprendizaje Automático -- 3.2 Clasificación de los datos -- 3.2.1 Modelos de clasificación -- 3.3 Métricas de evaluación de la calidad predictiva -- 3.3.1 Métodos de validación -- 3.4 Comentarios del capítulo -- 4 Preprocesamiento de los datos -- 4.1 Desequilibrio de clases -- 4.1.1 Enfoques a nivel de algoritmos -- 4.1.2 Métodos sensibles a los costes -- 4.1.3 Enfoques a nivel de datos -- 4.2 Reducción de datos -- 4.2.1 Reducción de instancias (reducción horizontal) -- 4.2.2 Reducción de características (reducción vertical) -- 4.3 Zonas ambiguas de un problema -- 4.4 Comentarios del capitulo -- 5 Big Data -- 5.1 Introducción a Big Data -- 5.2 El modelo MapReduce -- 5.3 El ecosistema Hadoop -- 5.3.1 Almacenamiento: Hadoop HDFS -- 5.3.2 Gestión de recursos y monitorización de trabajos: Hadoop Yarn -- 5.3.3 Motores de procesamiento: Hadoop MapReduce y Apache Spark -- 5.4 Profundizando en Apache Spark -- 5.5 Comentarios del capítulo -- II Aportes -- 6 Big Data no balanceado -- 6.1 Clasificación no balanceada de Big Data -- 6.2 Synthetic Minority Oversampling TEchnique (SMOTE) escalable para la clasificación no balanceada en Big Data -- 6.3 Análisis del comportamiento de SMOTE-BD -- 6.4 Un análisis de soluciones locales y globales para abordar la clasificación -- no balanceada de Big Data -- 6.5 Comentarios del capítulo -- 7 Reducción escalable en escenarios Big Data -- 7.1 Condensación de datos en Big Data -- 7.2 FDR2-BD: Una herramienta rápida de recomendación de reducción -- de datos para problemas de clasificación de Big Data tabular -- 7.2.1 Descripción y flujo de trabajo -- 7.2.2 Resumen de la implementación técnica -- 7.3 Estudio experimental -- 7.3.1 Entorno de trabajo -- 7.3.2 Estudio de reducción del volumen de datos -- 7.3.3 La influencia de la selección de características en la reducción del volumen de datos -- 7.3.4 Detalles de la condensación de datos y evaluación del rendimiento -- 7.3.5 Evaluación de la escalabilidad -- 7.4 Comentarios del capítulo -- 8 Caracterización del solapamiento en conjuntos Big Data -- 8.1 Caracterización de un conjunto de datos. Particionamiento del espacio de características -- 8.2 GridOverlap-BD, hacia la caracterización escalable del solapamiento en un conjunto Big Data -- 8.2.1 Descripción y flujo de trabajo -- 8.2.2 Comentarios de la implementación técnica -- 8.3 Estudio experimental -- 8.3.1 Entorno experimental -- 8.3.2 Efectividad en la distinción de Áreas puras y ambiguas -- 8.3.3 Grado de solapamiento -- 8.3.4 Comparando el desempeño del método de base contra los enfoques para tratar el solapamiento -- 8.4 Comentarios del capítulo -- III Casos de uso -- 9 Emergencias humanitarias -- 9.1 Descripción de los conjuntos de datos de Emergencias Humanitarias (EH) -- 9.2 Análisis exploratorio de los datos -- 9.3 Empleo de técnicas de sobremuestreo y caracterización de los datos -- 9.4 Comentarios del capítulo -- IV Conclusiones -- 10 Conclusiones y trabajo a futuro -- Bibliografía -- Apéndices 
650 4 |a BIG DATA 
650 4 |a APRENDIZAJE AUTOMÁTICO 
653 |a desbalance de datos 
700 1 |a Naiouf, Ricardo Marcelo ,  |e Director/a 
700 1 |a Fernández Hilario, Alberto ,  |e Director/a 
856 4 0 |u  http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2520 
942 |c TE 
952 |0 0  |1 0  |4 0  |6 TES_2237  |7 0  |9 83801  |a DIF  |b DIF  |d 2025-03-11  |i DIF-05171  |l 0  |o TES 22/37  |p DIF-05171  |r 2025-03-11 17:05:21  |w 2025-03-11  |y TE 
952 |0 0  |1 0  |4 0  |7 3  |8 BD  |9 83802  |a DIF  |b DIF  |d 2025-03-11  |l 0  |r 2025-03-11 17:05:21  |u https://doi.org/10.35537/10915/135846  |w 2025-03-11  |y TE 
952 |0 0  |1 0  |4 0  |7 3  |8 BD  |9 83803  |a DIF  |b DIF  |d 2025-03-11  |l 0  |r 2025-03-11 17:05:21  |u http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2520  |w 2025-03-11  |y TE 
999 |c 57655  |d 57655