Aclarando algunos aspectos sobre los totales en las tablas resultantes

Hola jóvenes

Antes de empezar de lleno con el tema de la semana, en esta breve entrada vamos a aclarar algunos aspectos que no deben pasar desapercibidos al trabajar las consultas a la base de datos.

Los totales generales en las tablas resultantes

Cuando se responden preguntas de consulta a la base de datos, se trabaja con dos o más campos, por ello es preciso poner atención a los totales que estamos obteniendo en el piloto de datos, mismos que trasladamos a la tabla resultante.

Veamos la siguiente consulta (ya analizada y resuelta en clases de la semana anterior): "Mostrar qué tanto le gusta el chocolate a los hombres y mujeres encuestados". Al dar respuesta a la pregunta de consulta se obtuvo la siguiente tabla resultante:


La información que presenta dicha tabla se corresponde con el cruce de valores entre el campo "sexo" y el campo "p1_gustaChoco".  Puede observar tres espacios principales en la tabla, una con los resultados del cruce de los valores de ambos campos (área en color blanco), y dos con los totales (un total en filas y un total en columnas, coloreado en celeste). En este caso como son dos campos, cada total se corresponde con los totales generales obtenidos en cada campo: el total mostrado en fila es el total del campo "sexo" y el total que se muestra en columna se corresponde con los valores puros del campo "p1_gustaChoco".

Para comprender mejor esto, ahora veamos lo que arroja el piloto de datos cuando se incluye solo uno de los campos a la vez. En primer lugar, observe  a continuación lo que presenta el piloto de datos cuando solo se incluye el campo "sexo".

Compare estos valores obtenidos contra los totales ubicados en la última fila de la tabla resultante al combinar los dos campos (la que responder la pregunta de consulta); como puede ver, los totales que muestra la tabla resultante se corresponden con los valores que obtenemos solo si ponemos el campo "Sexo". Ahora veamos lo que muestra el piloto de datos si solo incluimos el campo "p1_gustaChoco", observe como los valores obtenidos son exactamente los mismos que muestra la columna Totales de la tabla resultante al cruzar ambos campos:


Como puede ver no se obtiene el mismo resultado si solo se usa un campo en el piloto de datos, al que se obtiene cuando estamos combinando dos campos en el piloto de datos. Esa es la riqueza de las preguntas de consulta que se construyen, combinar campos y ver los datos que se obtienen como resultado. Pero los campos  no se deben combinar sin razón, siempre debe haber una lógica implicada en la creación de las consultas, siempre debemos poner atención al hecho de si los datos tienen relación entre si o si no la tienen. Cuando creamos consultas casi siempre se recurre a un campo de pregunta principal (una de las preguntas numeradas en la encuesta) y a uno o más campos de clasificación (es decir, un campo de dato personal).


Veamos otra consulta: "¿Cómo prefieren consumir el chocolate los hombres y mujeres encuestados?" Al dar respuesta a la pregunta de consulta se obtuvo la siguiente tabla resultante, en donde los datos se clasifican con relación al contenido del campo "sexo" (campo ubicado en columnas):


En esta tabla podemos observar que no se presentan totales de cada columna (es decir, no hay una fila con total). Ya se explicó que como la tabla se construye incluyendo en cada fila los resultados de un campo diferente, entonces los valores que se encuentran en cada columna NO SE DEBEN SUMAR, si alguien sumará los valores de la columna etiquetada como "mujeres", no obtendría el total de mujeres encuestadas (17), sino que obtendría otro valor que no tienen ningún significado razonable.

Recordemos que en los campos que son producto de preguntas con opciones de cuadro, cada uno de esos campos solo tiene dos opciones de respuesta ("si" y "no") de las cuales solo interesa saber la respuesta "si" (es decir, quién marco el cuadro al contestar la encuesta), veamos como ejemplo, que se obtiene en el piloto de datos, si solo incluimos el campo "p2_consBebida":


Observe como de este piloto de datos solo interesa el valor "11", el cual indica cuantos encuestados marcaron el cuadro al contestar la encuesta, y que por eso en la base de datos se capturó el valor "si".  Observe cómo dicho valor (11) aparece en la última columna de la tabla resultante, eso significa que en las otras columnas de la tabla resultante se ha dividido ese valor gracias al campo sexo (el cual es el campo que termina clasificando lo que se tiene en el campo "p2_consBebida".


Ahora veamos otra consulta más, pero en este caso la consulta implica 3 campos (dos de ellos se emplean para clasificar los resultados obtenidos en el campo principal. Pregunta de consulta: "¿Le gusta más el chocolate a los hombres y las mujeres solteras que a los que no lo están?". La siguiente tabla resultante general permite dar respuesta a la pregunta, pero como puede ver es una tabla que muestra todos los valores del campo "sexo" y todos los valores del campo "edoCiv", y
no se limita solo a mostrar lo que dicen las mujeres solteras (a 4 le gusta demasiado, a 1 le gusta mucho, a 3 le gusta muy poco).


Observe que igualmente presenta totales, en la fila totales, observe que presenta los valores del campo "pq_gustaChoco":


Sin embargo, debido a que se tiene dos campos en filas, el total presentado en la última columna no representa el total especifico de ninguno de los dos campos, sino más bien el total del segundo campo pero en relación al dato clasificador primer campo; es decir, los totales representan el total obtenido en cada valor del campo "edoCiv" pero combinado con el campo "sexo". Observe como se tiene dos grandes bloques para presentar el contenido del campo "sexo":

  • el primer bloque tiene que ver con el valor "Mujeres" (Femenino) y presenta 4 filas en las que se muestran los resultados obtenidos en el campo "edoCiv", lo que significa que los totales se corresponden con los valores de estado civil pero solo de las "Mujeres" (y la suma de todos esos valores deberá dar el total de mujeres encuestadas, es decir, 4+3+8+2= 17 mujeres encuestadas).
  • el segundo bloque por lo tanto representa lo obtenido para el valor del campo sexo: "Hombre" (Masculino), así que cada fila dentro de este bloque se corresponde con cada valor del campo "edoCiv" y sera el estado civil de los hombres, que en este caso solo presenta 3 valores (igualmente, la suma de todos los totales de este bloque representa el total de hombres encuestados, es decir: 3+4+1= 8).

En este caso, para tener los totales para el campo más interno (edoCiv)  se tendrían que sumar las filas con dicho valor. Sin embargo, evitarnos las sumas a mano y mejor generamos un piloto de datos que nos permita construir una tabla resultante que muestre los valores de ambos campos clasificadores ("sexo" y "EdoCiv"). Observemos la tabla resultante y como en los totales se presenta los valores generales para cada campo, y la parte interna los resultados del cruce de ambos campo:



Veamos una última consulta en la cual se están incluyendo cuatro campos: De acuerdo a que tanto le gusta el chocolate a los hombres y las mujeres solteras , indique cómo lo prefieren consumir.
La pregunta en si misma implica los campos: sexo, edoCiv, p1_gusta choco, y p3_prefConsu. todos estos campos son productos de preguntas de círculo, por lo tanto cada campo presenta varios valores. Los resultados se pueden presentar como lo muestra la siguiente tabla resultante:


Observe como entre más campos se incluyen, ya sea en área de filas o en área de columnas, los totales representan el total de un solo campo, sino que representan el total de la combinación de valores de los campos que se combinan (sea en la fila o en la columna).

Como ya se ha presentado por separado el total de los otros campos involucrados en la consulta (cuando se pone cada uno separado en un piloto de datos), solo falta mostrar cuales son los totales del campo "p3_prefConsu", incluyendolo solo en el piloto de datos.



Recuerde, los campos se incluyen en el piloto de datos a fin de obtener el resultado de la combinación de los valores de esos campos, es decir, se obtiene una tabla que muestra la clasificación de valores, de acuerdo a como se haya organizado el contenido (cuál campo se ha colocado en qué área, y en qué orden). No es lo mismo lo que vamos a obtener en un piloto de datos en el que se incluya un solo campo, que lo que vamos obtener si incluimos más campos. Y recuerde igualmente que no se trata solo de incluir un campo u otro, se trata de resolver una pregunta de consulta, y los valores involucrados en esa pregunta de consulta se encuentran almacenados en campos de la base de datos.

Ponga atención a lo aquí presentado respecto a la lectura de los totales que se presentan en las tablas resultantes, ya que en la siguiente entrada vamos a comenzar a calcular porcentajes, a fin de tener dicho dato disponible para el momento en el que vayamos a comenzar a redactar los párrafos el reporte de investigación.

Saludos

M.C. Bertha López Azamar




P.D. Alumno UNPA, si ya leíste la entrada, pon la letra de tu grupo y las iniciales de tus apellidos primero y luego de tu nombre en un comentario de esta entrada.