Skip to content

programathor10/csv_cleaner

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CSV Cleaner – Pipeline de Limpieza de Datos en Python

CI

Automatizador de limpieza de datos en CSV construido en Python y Pandas.
Transforma datos crudos (columnas desordenadas, duplicados, tipos incorrectos) en un CSV listo para análisis mediante un pipeline configurable.


✨ Características

  • Configuración mediante CleanConfig (dataclass).
  • Selección opcional de columnas.
  • Eliminación de duplicados.
  • Normalización de nombres de columnas.
  • Limpieza de columnas vacías.
  • Conversión automática de tipos (números/fechas).
  • Funciones auxiliares en utils.py.
  • Tests básicos con pytest.

🛠 Tecnologías

  • Python 3.11+
  • Pandas
  • Pytest

📦 Instalación

git clone https://github.com/programathor10/csv-cleaner.git
cd csv-cleaner
pip install -r requirements.txt

About

Automatizador de limpieza de datos en CSV con pipeline configurable en Python y Pandas.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages