Cómo extraer campos y dominios desde la encuesta

Hola jóvenes

Mientras damos tiempo a que las personas contesten la encuesta creada usando formularios de Google Drive (a las que les envíen la liga de su encuesta en línea), llego el momento de aprender a construir la base de datos desde cero, es decir, desde un formato impreso (su encuesta) crearla empleando la hoja de cálculo.
  • Cabe aclarar que al trabajar la base de datos en la hoja de cálculo, se trata de una simulación de lo que en el área de cómputo se le llama base de datos, ya que al usar las hojas de cálculo lo que vamos a hacer es tener todos los campos y registros de información en una sola hoja del libro de cálculo.
En esta estrada se trabajará con el análisis general del tipo preguntas y respuestas que pueden contener las encuestas que han construido, en las siguientes se procede con un análisis adicional de ejemplo, luego se presentará la estructura general del archivo de hoja de cálculo en donde se va a construir la base de datos, para finalmente presentar un ejemplo donde se muestra cómo construir una pequeña base de datos.
  • Cabe aclarar que el trabajo del formulario es un trabajo aparte (en donde la aplicación generará su propia base de datos, y luego veremos como descargarla para trabajar los siguientes temas). Debido a la contingencia, en esta ocasión fue necesario recurrir a este recurso para recopilar la información (a distancia), ya que no fue posible aplicar la encuesta impresa (en físico), sin embargo, aun cuando existen recursos en línea, en ocasiones no se tiene la posibilidad de realizar todas las tareas empleando un formulario en línea, debemos ser conscientes de ello, por lo que es necesario aprender a construir bases de datos desde formatos impresos, así que esta semana van a crear una base de datos desde una encuesta impresa (concretamente la versión final diseñada en el procesador de textos). Comencemos.

Cómo extraer campos y dominios desde la encuesta

Antes de pretender irse a encender la computadora, primero es preciso un análisis meticuloso que permita reconocer cuáles preguntas de la encuesta representan en sí mismas campos, y cuáles no deben considerarse como tal, y en su lugar, es preciso reconocer a sus respuestas como campos de la base de datos.
  • Tenga a la mano una copia impresa de la encuesta que ha diseñado en el procesador de textos, a fin de que pueda ir tomando nota de las cuestiones fundamentales para extraer de la misma los campos y dominios que conformaran su base de datos (le recomiendo que la imprima y allí haga las marcaciones correspondientes). 
Este es un paso sumamente importante, ya que define cómo va a ser todo el trabajo para la construcción de la base de datos cuando vacié lo analizado en la computadora. Debe tener presente que deberá pensar en nombres para los campos y en nombres para los dominios de valores que surjan en el análisis.
  • Nombres de los campos: cada nombre lo deberán asignar utilizando una abreviatura descriptiva relacionada con la pregunta (debe ser corto y significativo), puede utilizar letras y números, pero evite incluir espacios en blanco, en su lugar para la separación de palabras puede usar el guion bajo o en su caso trabajar con diferenciación de mayúsculas y minúsculas. También es recomendable que las preguntas que en la encuesta estén numeradas incluyan el número de la pregunta al inicio del nombre del campo.
Por ejemplo, si la pregunta de la encuesta fuera: ¿Te gusta el chocolate?, el nombre del campo podría ser: p12GustaChoco o en su caso, p12_GustaChoco
  • Nombres para los dominios: No olvide que un dominio es un conjunto de valores (de tipo cadena de caracteres). Debe ser un nombre corto, lo más concreto posible y significativo, ya que debe representar a los valores que contiene. Es indistinto que utilice el mismo nombre asignado al campo, sin embargo, para evitar confusiones se insta a no utilizar el nombre del campo como el nombre del dominio, ya que el dominio puede ser reutilizado, es decir, varios campos pueden requerir el mismo dominio de valores, y por tanto es mejor asignar un nombre significativo relacionado con los valores del dominio y no con el nombre del campo en donde se lo haya encontrado la primera vez.

Concentrémonos ahora en analizar las preguntas de la encuesta, atendamos inicialmente a los dos tipos de respuestas principales: opciones de círculos y opciones de cuadros.

Preguntas con opciones de círculos:

Cada pregunta que tenga este tipo de opciones va a representar un campo, debe recordar que en este tipo de preguntas solo se puede elegir una opción de la lista de respuestas, por lo tanto, las opciones de respuesta van a representar el dominio de valores y la pregunta como tal, el campo de la base de datos. Lo que significa que en la base de datos, las celdas que se relacionan con el campo que surge de este tipo de preguntas se van a validar con el dominio que se ha obtenido, por ello debe usar el nombre asignado al domino de valores (desde el análisis).

Veamos un ejemplo representativo, de forma que sea posible entender mejor estos conceptos, observe la siguiente pregunta:

Como puede ver, se tienen opciones de círculo, por lo tanto la pregunta representa el campo, al cual se le asignará un nombre, en este caso observe que se trata de la pregunta 4, por lo tanto podemos comenzar por pensar en iniciar el nombre con “p4_” y analizando la pregunta puede tomarse por ejemplo la palabra “tipo” y abreviar la palabra prefiere como “pref” para terminar el nombre del campo como: “p4_tipoPref”. No olvidemos el hecho de que las opciones representan un dominio, por lo tanto igualmente se le debe asignar un nombre, la lista en este caso contiene diferentes sabores de chocolate, por lo tanto puede emplearse el nombre “sabores”. Aunque, si así le resulta conveniente, de forma que pueda concentrarse en los nombres de los campos, puede dejar al final el asignar el nombre del dominio; sin embargo no olvide que debe pensar en los nombres que les va a asignar a los dominios para no dejar este trabajo hasta el momento en el que este frente a la computadora.

En la siguiente imagen se muestra cómo puede ir haciendo el trabajo en su propia encuesta (cuando se trate de este tipo de preguntas), señale el nombre del campo en la pregunta y encierre el dominio en un círculo, junto al cual igualmente puede ir anotando el nombre del dominio. Le sugiero usar un color para el nombre de los campos y otro color para el nombre de los dominios, a fin de ayudarse visualmente a reconocer cada nombre. Concluyendo el ejemplo se tiene que, el nombre del campo será: p4_tipoPref y el nombre del dominio será: Sabores




Cabe señalar que es conveniente tener cuidado con el uso de mayúsculas y minúsculas en el momento en que finalmente asigne el nombre del dominio a un rango de celdas, esto para evitar problemas de reconocimiento del nombre en caso de que la aplicación llegue a hacer diferencias entre mayúsculas y minúsculas).

Preguntas con opciones de cuadros:

Cada opción respuesta representa un campo. Debe recordar que en este tipo de respuestas se puede elegir: una, varias o ninguna opción de la lista; así se tiene que en este tipo de preguntas, son las respuestas las que representan los campos de la base de datos; es decir cada respuesta es un campo, debido a que se debe registrar en la base de datos si esa respuesta se ha elegido (marcado) o no se ha elegido (no se ha marcado). Por lo tanto, en este caso la pregunta como tal NO representa un campo, solo es una etiqueta que da significado a lo que representa cada respuesta. Debe quedar claro que las respuestas de este tipo de preguntas NO representan un dominio de valores.

  • Los campos que surgen de este tipo de preguntas (de cuadros) pueden validarse, pero de forma que se pueda capturar dos tipos de valores: Si, o, No; capturar el valor “Si” en la base de datos significaría que el encuestado ha marcado el cuadro en la encuesta, el valor “No” significaría que el encuestado no ha marcado el cuadro en la encuesta impresa. Puede optarse por crear un dominio denominado SiNo que contenga únicamente los valores Si, y, No; y que puede ser usado para validar este tipo de campos)

Veamos un ejemplo representativo, de forma que sea posible entender mejor estos conceptos:


Como se explicó, en este tipo de preguntas, no se asignará nombre de campo a la pregunta, sino a las respuestas, ya que cada cuadro representa un campo, observe en la siguiente imagen cómo se tienen 5 opciones, por lo tanto se tiene la necesidad de contemplar 5 campos (y asignarles nombre):


De esta forma, en su propia encuesta puede ir indicando los nombres de campo para cada una de las preguntas que tengan opciones de cuadro (casillas de verificación).

Preguntas con respuestas donde se incluye la opción "Otro":

Ahora bien, veamos qué hacer en el caso de las preguntas de opciones en donde se añade la opción “Otro”. Tenga presente que cuando la opción “otro” no incluye línea no ocasiona problema alguno, ya que se sigue tomando tal cual como una opción más de la lista, y se debe trabajar como ya se mencionó en cada caso anteriormente. Sin embargo, se debe poner atención cuando la opción aparece así “Otro:_________________”, es decir con una línea al lado, en donde, independientemente del tipo de opciones que sean (de círculos o de cuadros), la opción como tal da oportunidad de introducir algún texto diferente al de las opciones propuestas, por lo tanto, en el caso de las opciones de circulo significa que debe haber un campo adicional para que pueda capturarse dicha respuesta, y para asignar el nombre al campo simplemente puede optar por usar el número de la pregunta (ej. P5_) y añadirle la palabra “otro” (quedando por ejemplo el nombre del campo como: p5_Otro).

Veamos el siguiente ejemplo, que contiene opción “Otro” junto a un grupo de respuestas de circulo:


Observe como se necesitan dos campos para la pregunta 15: uno campo para poder capturar cualquiera de las 4 posibles opciones, mismas que representan un dominio (Información del personal de salud, Capacitar a los padres de familia para que hablen con sus hijos, Fomentar la distribución de preservativos, Otros), y el segundo campo es para tener espacio para poder capturar lo que algún usuario escriba en el caso de haber elegido la opción “otros”. Al primer campo podría llamársele por ejemplo: p15_ActInfPrev y el segundo campo se llamará: p15_Otros y además el nombre del dominio puede ser: OpcionesInformar (Donde también se incluye la opción "Otro").

Ahora bien, en el caso de las opciones de cuadro, ya se ha dicho que cada opción implica la necesidad de crear un campo, la diferencia de la opción “Otro:_________________” con las demás enlistadas es que, mientras en los campos de las demás opciones estos se validan con el dominio SiNo (recuerde que se dijo que contiene los valores Si, y, No), en el caso del campo para la opción “Otro” no puede aplicársele dicha validación, ya que en este caso, al incluirse una línea se espera que el encuestado introduzca un valor (diferente a los listados), por ello no es posible saber cuál valor puede introducir, de esta forma este campo no puede validarse en la base de datos. Veamos el siguiente es un ejemplo en el que se incluye la opción “Otro”:


En este caso hay menos problemas con la creación de los campos, ya que se debe tener presente que cada cuadro representa un campo (el único problema en la imagen de la pregunta es en el diseño, ya que en la opción “Otros” no pusieron el cuadro, pero eso no significa que no es otra opción). Se tiene así a 7 opciones por lo tanto se trata de 7 campos, los primeros 6 indican únicamente que se puede marcar la opción o dejarla sin marcar, por lo tanto los campos pueden ser validados con el dominio SiNo (recuerde que se dijo que contiene los valores Si, y, No), sin embargo, el séptimo campo no puede aplicársele la validación, ya que como se ve en la imagen, en este caso se ha incluido una línea, y esto significa que se espera que el encuestado introduzca un valor, y no es posible saber cuál valor puede introducir, por lo tanto, dicho campo no puede validarse en la base de datos.

Veamos otro ejemplo en el donde no se trata de una opción adicional, sino de una pregunta mal formulada o planteada en el diseño, ya que se encuentra unida innecesariamente a la pregunta 1, como si fuera parte de las respuestas, pero no lo es:


Aquí claramente se puede observar que se necesita un campo para la pregunta 1, y como la pregunta ¿Por qué?, se encuentra unida innecesariamente a la pregunta 1 como si fuera parte de las respuestas, pero no lo es, se trata de una pregunta aparte que no se formula completa debido a que quieren crear relación con la pregunta anterior; por lo tanto, se trata de un segundo campo que se corresponde con una pregunta abierta (no tiene un dominio de valores conocidos, y por lo tanto no hay un dominio de valores válidos que asignar, y la pregunta no se puede validar). 

Preguntas de línea:

Ahora bien, en el caso de preguntas en las que solo se indica una línea para que se capture un valor, se trata de una pregunta que representa un campo, y se debe analizar qué es lo que se espera que se capture, para determinar si se tiene un rango de valores numéricos especifico o no, o si igualmente se trata de un dominio de valores (textos) conocido y finito, o no. Veamos un ejemplo:


Observe como en el caso del campo “edad” se trata de un campo en el que se espera que se introduzcan valores numéricos enteros para indicar los años de vida de una persona; y dependiendo de la encuesta que se trate será el límite máximo de edades para definir así el rango de valores aceptables. Ejemplo, si se trata de una encuesta aplicable a menores de edad el rango de valores podría quedar asignado como: 1 a 17, pero si se trata de una encuesta aplicable al público en general entonces habría que ampliar el rango de valores a aceptar, en este caso podría considerarse edades validas: 1 a 100.

Ahora bien, si se observa la solicitud del estado civil (campo: edoCiv), se ha indicado simplemente una línea para que allí el encuestado introduzca una de las opciones ya conocidas para el estado civil de una persona, pero el hecho de haber omitido la lista de opciones, no significa que el dominio de valores sea infinito, sino que se trata de un dato cuyo dominio de valores es finito y conocido, por lo tanto, es necesario que se considere el dominio de valores válidos al momento de construir la base de datos: soltero, casado, unión libre, divorciado, separado, viudo (en este caso sin considerar el femenino de cada caso ya que aparte se está tomando en cuenta el solicitar el género de la persona, con el campo “sexo”). 
Veamos ahora el último campo de la imagen anterior, “ocupacion”, como puede ver se indica igualmente una línea para que el encuestado pueda escribir la ocupación que tenga, sin embargo, en este caso no podemos hablar de que se pueda considerar crear un dominio de valores válidos, ya que se trata de un dominio de valores demasiado grande y es imposible poder considerar todas las posibles ocupaciones, por lo tanto se trata de un campo que no es posible validar al momento de construir la base de datos.

Preguntas de opciones agrupadas en una tabla

Algo que igualmente se debe tener presente es el diseño en el que se suelen agrupar preguntas y opciones en una tabla (cuando se opta por ahorrar espacio en la encuesta ya que las opciones son compartidas por varias preguntas), veamos el siguiente ejemplo:



En este caso en cada renglón se puede elegir una opción, ya que se tiene un dominio con tres valores: 1-2 veces por semana, 3-4 veces por semana, 4 o más veces por semana (al cual puede llamársele frecuenciaConsumo). La pregunta como tal no representa un campo, ya que la pregunta se formula simplemente para poder hacer la agrupación de lo que se señala en la tabla para elegir una opción en cada renglón, por lo tanto, al tener 7 renglones se trata de 7 campos; se les puede llamar respectivamente: p10_Brócoli, p10_Zanahoria, p10_Papa, p10_Acelga, p10_Colifror, p10_Pepino, p10_Otro. Note como al tener las preguntas agrupadas en una tabla, se anula la posibilidad de poder poner una línea para que el encuestado capture un valor diferente, por ello, observe cómo en este caso la opción “otro” es una opción simple en la lista (ya que no se presenta una línea), por lo tanto no se tiene que incluir ningún otro campo adicional.


Estos son los tipos generales de preguntas que se manejan en las encuestas, y su forma de transformarlas en campos y dominios requeridos para construir la base de datos.  En la siguiente entrada se presentará un análisis general de ejemplo a fin de complementar estos conceptos.

Comience a analizar su propia encuesta, no olvide que es un trabajo que se hace en papel y aun no tiene necesidad de la computadora. No olvide que se tienen distintos tipos de preguntas en una encuesta y que cada una debe ser analizada a detalle para determinar qué hacer y cómo transformarla en campos de la base de datos.

AQUÍ puede descargar el contenido de esta entrada.

Saludos

M.C. Bertha López Azamar




P.D. Alumno UNPA, si ya leíste la entrada, pon la letra de tu grupo y las iniciales de tus apellidos primero y luego de tu nombre en un comentario de esta entrada.