Samuel Blixen 4375 Torre A 1408
+598 2614 4965
hola@kreilabs.com

Trabajo publicado en Towards Data Science: Impacto de la calidad de datos en el dataset

Revisamos los diferentes aspectos de la calidad de datos, y su impacto en las diferentes dimensiones de un juego de datos, así como las acciones que pueden tomar las organizaciones para hacer sustentable un modelo.

Al  empezar a trabajar en casos de uso reales, nos encontramos con que ese dataset que recibimos es el resultado de una organización que ha desarrollado un trabajo para poder elaborarlo.

La calidad de ese dataset está directamente relacionada con la organización que lo fabrica y en  cómo esta trabaje la calidad de datos. Y muchas veces la sustentabilidad de nuestro modelo también estará relacionada a la calidad de datos en la organización.

Más allá de la ingeniería de datos que podamos desarrollar, de la precisión del propio modelo y de la performance en su puesta en producción, si la organización a la que sirve no tiene en su agenda la calidad de datos como algo prioritario, es probable que el modelo no se sostenga a lo largo del tiempo.

Acceso al documento completo en Inglés