Este proyecto corresponde al Módulo 3 del Bootcamp de Ciencia de Datos.
El objetivo fue aplicar técnicas de limpieza, transformación y análisis de datos con NumPy y Pandas, utilizando un dataset de migración internacional.
🌐 Repositorio
🛠️ Tecnologías usadas
- Python (Pandas, NumPy)
- Jupyter Notebook / Google Colab
📋 Requerimientos implementados
- Limpieza y transformación de datos
    - Identificación de valores nulos y duplicados.
- Detección y filtrado de outliers mediante IQR.
- Estandarización de categorías en la columna Razon_Migracion.
 
- Análisis exploratorio (EDA)
    - Obtención de estadísticas descriptivas.
- Cálculo de media, mediana y conteos por categorías.
- Análisis de PIB e IDH de países de origen y destino.
 
- Agrupamiento y sumarización
    - Suma de migrantes por razón de migración.
- Media del IDH por país de origen.
- Ordenamiento por cantidad de migrantes.
 
- Filtros y selección de datos
    - Migraciones por conflicto.
- Países con IDH destino > 0.90.
- Creación de la columna Diferencia_IDH.
 
- Exportación de datos
    - Generación de archivo Migracion_Limpio.csvcon los datos finales.
 
- Generación de archivo 
🎯 Resultados principales
- No se detectaron valores nulos ni duplicados.
- Se identificó y eliminó un outlier en los datos de migración.
- Se realizó un mapeo de razones de migración para mayor claridad (Económica → Trabajo,Conflicto → Guerra).
- Se calcularon indicadores como media, mediana y PIB promedio.
- Se obtuvo la distribución de migrantes por razones (económica, conflicto, educativa).
✍️ Autor: Liroy Cataldo