Presented by:

Jose Miguel Martinez

from 0pt1mates

After finishing his master of Telecommunications Engineering, I started my journey as a consultant on software development. Very interested in open source software, I have helped my clients to build or evolve their digital platforms using agile methodologies and embracing a devops friendly culture.

No video of the event yet, sorry!

Desafortunadamente en la vida real los datos no aparecen pristinos y listos para ser analizados como parecen sugerir los numerosos tutoriales sobre ciencia de datos que podemos encontrar en Internet.

Afortunadamente existen a nuestra disposición una serie de herramientas de código abierto (o libre según el caso) que fácilmente nos permitiran inspeccionar el estado inicial de esos datos, limpiarlos y formatearlos para poder proceder a su análisis con nuestro software favorito.

Estas utilidades suelen estar disponibles en cualquier sistema Linux, y nos van a permitir reducir considerablemente el tiempo dedicado a procesar estos datos y dedicar nuestros esfuerzos al análisis que realmente aporta valor.

Veremos como inspeccionar grandes ficheros sin desbordar nuestra memoria, lidiar con problemas de codificaciones, extracción y descarte de información, paralelización, etc.

Date:
2020 April 24 - 17:30
Duration:
45 min
Room:
Sala 3
Conference:
Opensouthcode 2020
Language:
Track:
Data Science / BigData
Difficulty:
Medium

Happening at the same time:

  1. Akademy-es
  2. Start Time:
    2020 April 24 15:30

    Room:
    Sala 1

  3. Vue + Wordpress = CMS más dinámico
  4. Start Time:
    2020 April 24 17:30

    Room:
    Aula 2

  5. Estrategias branching: trabajando con git y personas
  6. Start Time:
    2020 April 24 17:30

    Room:
    Sala 2