¿Qué son las series de datos?

Hola jóvenes

Antes de comenzar a crear gráficas, necesitamos saber qué son las series de datos, ya que se solicitará indicar de dónde se van a tomar los datos para representar las barras o columnas.
Cuando se han procesado los datos de una base de datos y se han obtenido tablas a partir del trabajo con los pilotos de datos, las tabulaciones presentan el cruce de valores, que pertenecen a dos o más campos, en filas y columnas.
La cuestión es: ¿Las series de datos están en las filas o en las columnas?

¿Qué es una serie de datos?

Es un conjunto de valores que pueden ser representados en una gráfica. Las series de datos las podemos encontrar en las filas o en las columnas de una tabulación de datos.

Cada fila o cada columna representa una serie de valores. Los valores de cada conjunto tienen un significado común, y pueden observarse en la gráfica para evaluar los resultados obtenidos, por ello cada valor se representa con un color diferente y se agrega una leyenda para indicar su significado. Cada serie repetirá los mismos colores ya que comparten el mismo significado.

Cada serie de datos puede ser referenciada gracias a los valores del campo que domina la columna o la fila (primera fila o primera columna).

Veamos el siguiente ejemplo de tabulación:


La tabulación presenta el cruce de resultados de los campos que participan en su creación,  en el ejemplo los campos "Sexo" y "edoCiv". Donde en individual:
  • el campo "sexo" tiene solo dos valores: "Hombres","Mujeres".
  • el campo "edoCiv" en individual presenta cuatro valores "Casado", "Divorciado", "Soltero", "Viudo". 
Sin embargo al crear la tabla, se logra subdividir los resultados (clasificarlos) y se obtienen 8 valores (2x4) que representan las coincidencias entre ambos campos, y es entonces cuando se habla de series de datos. Y al graficar se puede señalar que las series de datos están en las filas o que están en las columnas. Tomando como referencia esta tabulación de ejemplo, veamos que implica esa elección al construir una gráfica.

Serie de datos en filas

Si decimos que las series de datos van a ser tomadas de las filas, entonces se tienen dos series (debido a los dos valores del campo "sexo"):

  • la serie de valores "Hombres", es decir el conjunto de valores "4, 3, 8, 2".
  • la serie de valores "Mujeres", es decir el conjunto de valores "3, 0, 4, 1".

En estas dos series de datos, cada uno de los valores completa su significado solo en base a los valores del campo "edoCiv". Si construimos una gráfica de columnas entonces veremos que se presentan cuatro grandes bloques en el eje de las X, etiquetados como "Casado", "Divorciado", "Soltero", y  "Viudo"; y en este caso en cada bloque se van a presentar dos columnas de diferente color (cada una de cada serie), y para señalar su significado se agregara una leyenda que muestre los valores del campo "sexo" junto al color que lo representa.  De esta forma se obtiene la siguiente la gráfica:

Al presentar los datos de esta forma, se observa que en esta gráfica la interpretación o lectura lleva a comparar los resultados entre hombres y mujeres, ya que en cada bloque se presentan esas dos barras juntas y visualmente se tiende a hacer esta comparación y pensar por ejemplo que se tiene mayor cantidad de mujeres encuestadas que de hombres encuestados. Pero como ya se dijo en la entrada anterior, debido a que no se ha encuestado a la misma cantidad de hombres que de mujeres, entonces no podemos representar los datos de esta forma a menos que la tabla de la que se tomen los datos presente los porcentajes calculados en base al total de hombres y de mujeres encuestados respectivamente.

Serie de datos en columnas

Si elegimos a las columnas para de ellas tomar las series de datos, entonces se tienen cuatro series (debido a los dos valores del campo "edoCiv"):

  • la serie de valores "Casado", es decir el conjunto de valores "4, 3"
  • la serie de valores "Divorciado", es decir el conjunto de valores "3,0"
  • la serie de valores "Soltero", es decir el conjunto de valores "8,4"
  • la serie de valores "Viudo", es decir el conjunto de valores "2,1"

En estas cuatro series de datos, cada uno de los valores completa su significado solo en base a los valores del campo "sexo". Si construimos una gráfica de columnas entonces veremos que se presentan dos grandes bloques en el eje de las X, etiquetados como "Hombres" y "Mujeres"; y en cada uno de los bloques se van a presentar cuatro columnas de diferente color(cada una de cada serie), y para señalar el significado de cada color la gráfica debe tener una leyenda con los valores del campo "edoCiv". Entonces la gráfica se mostrará así:

En este caso podemos comparar los resultados de cada barra en cada bloque (serie); es decir, de las mujeres cuántos hay de cada estado civil, y de qué estado civil se encuesto mayor o menor cantidad de mujeres;  y en el caso de los hombres cuántos hay de cada estado civil, y de qué estado civil se encuesto a mayor o menos cantidad de hombres. Como puede ver la interpretación o lectura de la gráfica no permite comparando los resultados entre hombres y mujeres, sino más bien permite comparar los resultados entre los estados civiles en cada serie.



Lo importante en esta entrada es tomar las ideas generales que nos permitan reconocer de dónde se van a tomar las series de datos al crear una gráfica; y ver que todo depende de cómo tengamos tabulados los datos. Para ejemplificar la idea vea la siguiente tabla:

Ya que como puede ver, los datos presentados en la tabla son los mismos que los presentados en la tabla anteriormente presentada, sin embargo, claramente puede ver como se ha invertido la posición de cada valor, lo que antes estaba en filas ahora está en columnas, y lo que estaba en columnas ahora está en filas. En este caso, se invierten las ideas anteriores presentadas sobre donde están las series de datos, pero la información es la misma.  En ambas tabulaciones se puede obtener la siguiente gráfica:

Todo depende de que se señale correctamente dónde están las series de datos a representar. Con la primera tabulación, se debe indicar que las series de datos están en las columnas. Con la segunda tabulación se debe indicar que las series de datos están en las filas.

Tome en cuenta lo aquí expuesto de forma que al momento de construir sus gráficas y decidir dónde están las series de datos a representar en la gráfica.

Descargue el contenido AQUI.

Saludos

M.C. Bertha López Azamar




P.D. Alumno UNPA, si ya leíste la entrada, pon la letra de tu grupo y las iniciales de tus apellidos primero y luego de tu nombre en un comentario de esta entrada.