Consideraciones antes de crear una gráfica

Hola jóvenes

Antes de pretender construir una gráfica deben tener en cuenta algunos aspectos importantes en relación a los datos que se pretenden representar en la gráfica.

Lo realmente importante es aprender a reconocer: cuándo se debe crear una gráfica y cuándo no;  y una vez que se decide crear una gráfica entonces lo importante será reconocer cuál tipo de gráfico es más conveniente para representar la información.

En esta entrada vamos a preocuparnos por reconocer algunos aspectos importantes en las tabulaciones de los datos antes de pretender comenzar a crear gráficas.


Aspectos a considerar para construir una gráfica

Antes de pretender insertar una gráfica, lo primero es tener datos tabulados, es decir, haber construida una tabla que concentre los datos que se desean representar en la gráfica.

Ahora bien, cabe recalcar que para poder construir la gráfica los datos deben presentarse en la tabla de una forma adecuada, es decir se debe tener una distribución de los datos lo más clara posible; por ejemplo, si se trata de dos campos, entonces los valores de uno deben colocarse en las columnas y los del otro en las filas. Cuando se tiene más de dos campos las cosas se complican, ya que al tener dos campos acomodados en una sola área (filas o columnas) se crea profundidad en la distribución de los datos, es decir, la construcción de la tabla contempla varios campos que construyen cada vez un nivel adicional de clasificación de los datos.

Por ello se debe tener presente que algunas tablas son complicadas por si mismas y no siempre es pertinente crear gráficas de todas las tabulaciones que hayamos creado. Precisamente debido a que tienen demasiados niveles de clasificación de la información presentada, y esto hace que graficar los datos se vuelva prácticamente imposible, o que no se encuentre una gráfica que sea adecuada para presentar adecuadamente la información tabulada. En estos casos de debe preferir la tabla para incluirla en el reporte de investigación, ya que presenta la información de mejor de lo que pudiera representarse en una gráfica.

El primer aspecto a considerar: no todos los datos presentados en la tabla deben representarse en una sola gráfica. No debe representar en una gráfica los datos de los totales encuestados, junto con los datos clasificados por uno o más campos (por ejemplo lo que dijeron las mujeres y lo que dijeron los hombres); uno es un dato global y otros son datos parciales de ese dato global y sería erróneo revolver la información de esa manera en una gráfica.

Un segundo aspecto a tomar en cuenta, es que en el manejo de la información es importante poner atención a la clasificación de los datos que se vaya a realizar, y tener presente si las muestras son iguales (simétricas) o no, para así saber si se puede o no se puede hacer comparativas directamente con la cantidad encontrada en el conteo, y si en dado caso será necesario recurrir a obtener los porcentajes (basados en el total de encuestados de cada bloque) antes de pretender hacer cualquier comparación. Por ejemplo, si se toma como dato clasificador el campo "sexo" es importante determinar si las muestras son iguales o diferentes:

  • Solo cuando se haya encuestado a la misma cantidad de hombres que de mujeres podemos hacer una comparación basándonos directamente en los conteos obtenidos y mostrados en la tabla resultante. Ya que las dos muestras son iguales.
  • Si se tiene una cantidad diferente de hombres y mujeres encuestados, no puede pensar en comparar entre lo señalado por hombres y mujeres encuestados tomando en cuenta directamente el valor obtenido en el conteo. Para hacer comparación entre hombres y mujeres, primero tendría que obtener la tabla equivalente en la que se hayan calculado todos los porcentajes.


Tercer aspecto a considerar: tenga presente que no todos los tipos de gráficas son adecuadas para aplicar a cualquier tipo de distribución de información (tabla construida), algunos tipos de gráficas presentan al información mejor que otros tipos de gráficas. Siempre elija lo simple, en lugar de decorar la gráfica y elegir una de barras 3D prefiera una de barras simples; lo importante es la información presentada, la visualización de la información sin deformarla.


Veamos algunos ejemplos

A continuación analicemos diferentes distribuciones de la información, a de modo que consideremos los aspectos a tomar en cuenta antes de comenzar a construir una gráfica. Y podamos distinguir algunas tablas que no resultan tan adecuadas para usar sus datos para crear gráficas.


Tomemos en cuenta los siguientes datos tabulados, en donde se presenta la distribución del total de encuestados clasificándolos de acuerdo a los campos "sexo" y "edoCiv":


En este caso se trata de una tabulación simple que presenta solo los resultados de dos campos. Es la tabulación ideal para crear gráficas, ya que se tiene solo dos elementos a representar. La tabla permite mostrar "cuántos" hombres y mujeres se encuestaron y clasifica los resultados de acuerdo al estado civil de los mismos. En este ejemplo vamos a usar directamente la cantidad de encuestados (sin recurrir a porcentajes).

El primer punto a considerar es: qué parte de la tabla vamos a graficar

¿Todo se puede incluir en una sola gráfica? La respuesta es no. No podemos crear una sola gráfica que incluya la columna y el renglón de los totales, no es adecuado tomar dichos datos y pretender meterlos dentro de misma gráfica, debido a que estos totales (como se explicó en las entradas anteriores) representan la respuesta obtenida en cada campo, y no representan de ninguna maneja el cruce de los valores almacenados en ambos campos; observe como se presenta en la parte interna de la tabla el cruce de información de ambos campos. Por ello, de esta tabla si se cree conveniente se pueden crear tres gráficas:

  1. Una gráfica para el total en filas: muestra los resultados del campo "edoCiv".
  2. Una gráfica para el total en columnas: muestra los resultados del campo "sexo".
  3. Una gráfica que muestre los resultados del cruce de valores de ambos campos.

Para cada uno de los totales presentados puede crearse una gráfica de pastel, ya que en cada una implica representar por separado la información de cada uno de los campos, y solo se tiene una columna que representar (la de los valores totales). Veamos los ejemplos de las gráficas construidas para cada total:

Gráfica 1. Mujeres y hombres encuestados.


Gráfica 2. Encuestados por sexo


Segundo punto a tomar en cuenta: ¿cómo se van a presentar los resultados del cruce de valores?
Para los valores del cruce de campos puede crearse una gráfica de columnas, y para evitar mostrar una comparación entre cada estado civil de hombres y mujeres, la gráfica debe crearse de forma que contemple dos bloques de columnas: un bloque para hombres y otro bloque para mujeres; en ellos cada columna debe mostrar los resultados de cada estado civil; de esta forma se podrá comparar por ejemplo si entre las mujeres se ha encuestado a más solteras que casadas, y se evita que la gráfica muestre juntos los datos de hombres y mujeres solteras, y con ello se evita dar a entender que se encuesto a mas hombres que mujeres solteras (ya que no puede comparar así porque no se tiene igual cantidad de hombres y mujeres encuestados). Observe como se mostraría la gráfica ya construida:

Gráfica 3. Encuestados por sexo y estado civil

Si por error se lleva a construir la siguiente gráfica a partir de los datos de la tabla presentada anteriormente, se estaría comparando entre hombres y mujeres a partir de las cantidades de encuestados obtenidas (y solo es adecuado crear una gráfica de esta forma si se tiene la misma cantidad de hombres y mujeres encuestados, o si se han obtenido a partir de la tabla de los porcentajes):



Ahora veamos otro ejemplo de tabulación en el que se presentan los resultados obtenidos en el campo "p1_gustaChoco" pero clasificándolos en base al campo "sexo". Para poder hacer la comparación de las respuestas de hombres y mujeres encuestados, es necesario recurrir a construcción de una tabla equivalente con los porcentajes calculados. 
Observe ambas tablas y note que en los datos de la tabla de la izquierda (la del conteo puro) aparentemente se ve que más mujeres han elegido cada opción, sin embargo no debemos olvidar que se tiene a mayor cantidad de mujeres encuestadas (eso es visible en la fila totales). Tomar la cantidad de personas no es adecuado, lo más adecuado es tomar los porcentajes para hacer la comparativa. Por ello es preciso obtener los porcentajes de cada valor y crear una tabla equivalente (tabla de la derecha en amarillo), a fin de poder comparar lo que dijeron los hombres y mujeres encuestados, y ver si mayor proporción de hombres o de mujeres ha elegido una u otra opción. 

En este caso puede optarse por una gráfica de columnas, seleccionando los datos a partir de la tabla de los porcentajes, en la cual se presente por cada opción de respuesta del campo principal (p1_gustaChoco) un par de columnas con los resultados de hombres y mujeres:

Gráfica 4. Gusto por el chocolate (hombres y mujeres)

En esta gráfica es posible apreciar fácilmente la comparación entre las respuestas. y por ejemplo leer más fácilmente: que a mayor proporción de hombres que de mujeres les gusta demasiado el chocolate.

Con esta tabla de porcentajes tenemos la libertad de graficar como deseemos, por lo tanto, en caso de no pretender comparar entre las elecciones de hombres y mujeres, podemos optar también por crear la gráfica creando dos grandes grupo de columnas, presentando por un lado el gusto de las mujeres por el chocolate y por otro el gusto de los hombres, y en ese caso lo que podremos comparar las elecciones de las mujeres entre sí, y las de los hombres entre sí, observe:


No olvide que son dos formas de presentar la misma información, y solo debe elegir una de ellas.

Es obvio que al clasificar los datos en base a otro campo es porque se quieren mostrar los resultados conforme a esa campo clasificador. Pero recuerde que siempre en la columna o en el renglón totales se presentan los valores del campo principal sin clasificar (en el ejemplo "p1_gustaChoco" en la columna), y siempre tenemos la opción de crear una gráfica de pastel para ese total. Si lo deseamos podemos crear la gráfica a partir de los totales originales (tabla de la izquierda) o de los porcentajes calculados a partir de los totales (es indiferente), sin embargo tenga presente que la gráfica de pastel va a mostrar porcentajes en las rebanadas y lo mejor sería que prefiera elegir la columna totales de la tabla original).




Elegir que gráficas construir depende de lo que vayamos a necesitar presentar en el reporte, y siempre se debe elegir entre la tabla o la gráfica, pero no se puede optar por presentar ambas representaciones de la misma información, ya que no se debe duplicar la información presentada, por más tentador que resulte. Podría optar por presentar una tabla de la información del cruce de los valores (sin los totales) y una gráfica de la información de los totales; pero si pone la tabla completa con totales, no deberá presentar la gráfica de los totales. Aunque generalmente la información de los totales se deja para la redacción de párrafo que introduce la tabla o gráfica en el informe o reporte de investigación.




Veamos otro ejemplo, en la tabla responde la pregunta de consulta: ¿Cómo prefieren consumir el chocolate los hombres y mujeres encuestados? 

Observe como en la construcción de la tabla participan 5 campos que son producto de respuestas de cuadro, y que se usa al campo "sexo" para clasificar las respuestas (recuerde que se construyen la tabla solo con las respuestas "si" de la serie de campos "p2_").

Si desea graficar la comparativa entre lo elegido por hombres y lo elegido por las mujeres, debe seleccionar los datos de la tabla equivalente con los porcentajes. Se puede optar por una gráfica de barras, que presentaría los resultados de la siguiente forma:

Gráfica 5. Preferencia de mujeres y hombres en la presentación de consumo de chocolate

Pero si quiere optar por crear una gráfica con dos bloques separados, en donde en un bloque de barras grafique todas las opciones de presentación elegida por las mujeres, y en otro bloque de barras se grafiquen todas elecciones de los hombres (recuerde que de esta forma no compara hombres contra mujeres, sino las presentaciones elegidas por cada grupo), entonces la gráfica adecuada seria de columnas y quedaría de la siguiente forma:



Veamos otro ejemplo de tabulación de datos, pero en este caso se presenta la información de tres campos; como puede ver ocupa los dos campos empleados en el segundo ejemplo presentado, pero en este caso se incluye un segundo campo como clasificador, lo cual le da un nivel de profundidad adicional en la distribución de la información:


En la aplicación Calc es imposible que podamos graficar una distribución de datos como la presentada en esta tabla, sin embargo en Excel si es posible graficar la información presentada en la tabla anterior de la siguiente forma:


Veamos un ejemplo final, una tabla que presenta los datos de cuatro campos:


Como puede darse cuenta, la lectura de la tabla es compleja, pero presenta la información de la mejor manera posible, pero como tiene mucha mayor profundidad en la distribución de los datos, se dificulta completamente la construcción de una gráfica.


Espero que hasta el momento vaya quedando claro que:

  1. Los totales se pueden graficar por separado, siempre y cuando presenten los resultados de un solo campo.
  2. Si va a comparar resultados en base al campo clasificador (por ejemplo lo que dicen los hombres con lo que dicen las mujeres), entonces debe tomar los resultados de la tabla equivalente en la que se calcularon los porcentajes en base a cada total del campo clasificador.
  3. Si quiere mostrar las respuestas del campo principal en las barras o columnas (aun cuando se han clasificado los datos en base a otro campo), puede tomar los valores de la tabla original (la de los valores puros del conteo) para crear la gráfica mostrando la cantidad de encuestados, pero debe elegir con cuidado la distribución de la información, de forma que las barras o columnas no muestren los valores del campo clasificador, sino que los valores de ese campo cree los bloques generales en los que se van a presentar las barras o columnas con cada uno de los resultados del campo principal. 


Lea a conciencia lo aquí presentado, de forma que antes de que piense en crear gráficas, revise si la forma en la que ha creado las tablas resultantes es la adecuada para crear gráficas o en dado caso necesita realizar ajustes a la distribución de la información que contienen los campos. Además considere que debe elegir para cada consulta cómo va a presentar dichos resultados en el reporte de investigación, si lo hará usando una gráfica o si lo hará usando una tabla. Piense bien en la información que desea mostrar, elija en cuales casos va a usar la tabla original, en cuales casos debe construir las tablas completas con los porcentajes, y en cuáles consultas puede construir gráficas para usarlas para representar la información obtenida.

Puede descargar el contenido de esta entrada AQUI.

En las siguientes entradas se verá cómo utilizar las aplicaciones CALC y EXCEL para construir gráficas.

Saludos

M.C. Bertha López Azamar




P.D. Alumno UNPA, si ya leíste la entrada, pon la letra de tu grupo y las iniciales de tus apellidos primero y luego de tu nombre en un comentario de esta entrada.