Data Science - Ciclo de vida del Análisis de datos


El Proceso de Análisis de Datos

Existen muchos modelos diferentes de análisis de datos, por lo que en esta ocasión, utilizaremos el Ciclo de Vida del Análisis de Datos de seis pasos mostrado en la figura a continuación, mientras resaltamos similitud con otro modelo. Piense en este modelo como iterativo, lo que significa que algunos pasos podrían repetirse varias veces antes de que los tomadores de decisiones estén lo suficientemente seguros como para avanzar al siguiente paso.

  1. Hacer una Pregunta (Definción del problema)
  2. Obtener Datos (Get data - Fase 1)
  3. Investigar Datos (Exploración de los datos)
  4. Preparar Datos (Data Preparation - Fase 2)
  5. Analizar Datos (Data Analysis - Fase 3)
  6. Presentar Resultados (Data Visualization - Fase 4)

En este listado las 4 Fases se corresponden con las definidas en Ciencia de datos. A continuación describimos el resto de los pasos en el ciclo de vida del análisis, incluyendo esta 4 fases.

Hacer la Pregunta: 

El proceso de análisis siempre comienza con una pregunta que debe ser respondida. Algunas preguntas son simples, como "¿de qué color de bicicleta es más popular entre nuestros compradores más jóvenes?" Otras son muy complejas, como "¿por qué ciertos tipos de células cancerosas muestran resistencia a los tratamientos de radiación?"

Obtener los datos:

Este paso implica el proceso de localizar y obtener datos que sean relevantes para la pregunta, y luego determinar si hay suficientes datos para completar el análisis.

Investigar los datos: 

Los datos vienen en muchas formas y de muchas fuentes diferentes. Este paso implica determinar si los datos están completos y contienen la información relevante para el análisis.

Preparar los datos: 

Este paso puede involucrar muchas tareas para transformar los datos en un formato adecuado para las herramientas que se utilizarán para analizar y presentar los datos. Este proceso a veces se denomina "limpieza" de los datos, porque puede haber registros en blanco o errores obvios en el conjunto de datos.

Analizar los datos: 

El análisis es el proceso de identificar patrones, correlaciones y relaciones contenidas dentro de un conjunto o conjuntos de datos para sacar inferencias y conclusiones. A menudo, el análisis se basa en técnicas estadísticas y herramientas de software como hojas de cálculo y aplicaciones de visualización.

Presentar los resultados: 

Este suele ser el último paso para los analistas de datos. Es el proceso de comunicar los resultados a los tomadores de decisiones. Esto se puede hacer en forma de informe, representaciones gráficas o una combinación de ambos. A veces, también se le pide al analista de datos que recomiende acciones basadas en los resultados.


Crédito de la Imagen (Cisco Netacad - Skills for all)

#datascience #dataanalysis #dataanalytics #datalifecycle

Comentarios