Limpieza y preparación de datos con herramientas GNU
Jose Miguel Martinez
After finishing his master of Telecommunications Engineering, I started my journey as a consultant on software development. Very interested in open source software, I have helped my clients to build or evolve their digital platforms using agile methodologies and embracing a devops friendly culture.
No video of the event yet, sorry!
Desafortunadamente en la vida real los datos no aparecen pristinos y listos para ser analizados como parecen sugerir los numerosos tutoriales sobre ciencia de datos que podemos encontrar en Internet.
Afortunadamente existen a nuestra disposición una serie de herramientas de código abierto (o libre según el caso) que fácilmente nos permitiran inspeccionar el estado inicial de esos datos, limpiarlos y formatearlos para poder proceder a su análisis con nuestro software favorito.
Estas utilidades suelen estar disponibles en cualquier sistema Linux, y nos van a permitir reducir considerablemente el tiempo dedicado a procesar estos datos y dedicar nuestros esfuerzos al análisis que realmente aporta valor.
Veremos como inspeccionar grandes ficheros sin desbordar nuestra memoria, lidiar con problemas de codificaciones, extracción y descarte de información, paralelización, etc.
- Date:
- 2020 April 24 - 17:30
- Duration:
- 45 min
- Room:
- Sala 3
- Conference:
- Opensouthcode 2020
- Language:
- Track:
- Data Science / BigData
- Difficulty:
- Medium
- Akademy-es
- Start Time:
- 2020 April 24 15:30
- Room:
- Sala 1
- Vue + Wordpress = CMS más dinámico
- Start Time:
- 2020 April 24 17:30
- Room:
- Aula 2
- Estrategias branching: trabajando con git y personas
- Start Time:
- 2020 April 24 17:30
- Room:
- Sala 2