Filtrando datos en hoja de cálculo

Hola jóvenes

Al obtener los registros de la base de datos, logramos tener un concentrado de datos lo suficientemente grande como para comenzar a encontrar cierta la información de interés.

Una de las formas más básicas y simples de observar los datos es usando los filtros; otra más robusta y un poco más compleja, pero mucho más eficiente e ideal para obtener información estadística es empleando los pilotos de datos (tablas dinámicas).

En ésta entrada vamos a concentrarnos en la forma simple: filtrar rangos de celdas en la hoja de cálculo.

  • Para seguir más fielmente los ejemplos de esta entrada, y la siguiente, puede descargar la base de datos de ejemplo (en archivo de Calc o en archivo en Excel).

¿Qué significa filtrar datos en la hoja de cálculo?

Bueno, básicamente es clasificar los datos en base a ciertos criterios, y reducir el gran conjunto de datos (la base de datos) a un conjunto más pequeño, en el que solo se mostrarán aquellos datos (registros de información de la base de datos) que cumplan dichos criterios.

Los criterios (o condiciones) se van eligiendo de acuerdo a cada campo (cada columna), y es posible elegir uno o varios criterios, es decir elegir valores en diversos campos.

  • Obviamente, el primer criterio realiza el primer filtro (primera clasificación, primera reducción de los datos), y 
  • Si se elige un segundo criterio, entonces de los datos que quedaron al aplicar el primer criterio, se aplica una segunda clasificación (una segunda reducción).
  • Si se continúa aplicando un nuevo criterio cada vez, siempre será sobre los registros que van quedando de la configuración de los criterios anteriores (la aplicación de los filtros anteriores).

Como puede verse, es como hacer una búsqueda, en la que cada que se aplica un filtro (en un campo) se descartan ciertos registros. Por ejemplo:

  • Se desea saber que dijeron sobre las votaciones las mujeres solteras que trabajan.
  • Por ello filtrar es como decir, quiero saber solo lo que dijeron las "mujeres" (primer filtro), pero de ellas solo las "solteras" (segundo filtro), pero de ellas sólo las que "trabajan" (tercer filtro).

Cabe mencionar que en el caso del filtrado de datos, no se elimina ningún registro de la base de datos, simplemente se ocultan, y ello lo pueden comprobar observando la numeración de los renglones, cada vez que se aplica un filtro, ya no se verá la numeración continua (lo que indica que algunos renglones se ocultaron).

Ahora bien ninguna columna de la base de datos se va a ocultar al aplicar los filtros, siempre se muestra la totalidad de las columnas de la base de datos. Además, no se realizarán conteos, lo que se muestran son los datos, es decir, se muestran los registros de información.

  • Una diferencia fundamental con los pilotos de datos en donde lo que se realizan son conteos de los datos que cumplen ciertos criterios, pero en donde no se muestran los registros de información, solo totales de acuerdo a la clasificación realizada

Tipos de filtros que se pueden aplicar

En las hojas de cálculo se puede elegir entre algunos tipos de filtros, cada uno garantiza que sólo algunas de las filas (registros) del concentrado de datos (base de datos) sean visibles. Cada hoja de cálculo (OpenOffice, LibreOffice, Excel, Google Drive) dispone de diversas posibilidades para la aplicación de filtros, así se tienen opciones como:

  • Un filtro automático, filtra los datos de acuerdo con una cadena o un valor especificados, mostrando únicamente aquellos registros de datos que coinciden con el valor elegido en el campo de datos seleccionado (pueden elegirse valores para tantos campos como se requiera).
  • Un filtro estándar o predeterminado, utiliza opciones especificadas previamente para filtrar los datos, generalmente se configura utilizando un cuadro de diálogo, en el cual se pueden definir áreas que contienen valores en campos de datos específicos. En el caso de la hoja de cálculo Calc se puede utilizar un filtro predeterminado para conectar un máximo de tres condiciones mediante los operadores lógicos Y u O.
  • Un filtro avanzado o especial, utiliza criterios de filtrado de celdas específicas. Supera la restricción de tres condiciones y permite un total de ocho condiciones de filtro. En los filtros especiales, las condiciones se insertan directamente en la hoja.

NOTA: Cuando selecciona filas filtradas y luego aplica formato o borra las filas seleccionadas, esta acción se aplica únicamente a las filas filtradas. Las filas ocultas no se ven afectadas. Es lo contrario de lo que ocurre con las filas que se han ocultado manualmente (En Calc por ejemplo mediante Formato - Filas - Ocultar filas). Las filas que se han ocultado manualmente se borran cuando se borra una selección que las contiene.

Cómo filtrar los datos en la hoja de cálculo

Para aplicar filtros lo primero es colocar el cursor en alguna celda dentro del rango de celdas que se desea filtrar (colóquese dentro de la base de datos, puede hacerlo de preferencia sobre la celda A1 que es donde debe comenzar el primer nombre de campo de la base de datos (Hoja BD).


En el caso de Calc

Vaya al menú Datos, y elija Filtro, a lo cual se mostrará un submenú, vamos a probar en primer lugar con el filtro Automático:


Una vez elegido el filtro la hoja de cálculo podrá ver una punta de flecha en cada nombre de campo (cada celda de la primera fila), y de acuerdo al campo en cuestión, podrá elegir como hacer el filtrado. Observe a continuación como al hacer clic sobre el botón de flecha del campo “edoCiv”, se muestra una lista de opciones (las tres primeras son comunes en todos los campos, sin embargo, las siguientes dependen de los valores que contenga el campo en cuestión):


Entonces, lo que debe hacer es elegir en la lista el valor o cadena de caracteres que desea utilizar como criterio para el filtro. Si en la lista se elige por ejemplo el valor “Viudo” (en el campo EdoCiv), mostrará todos los registros de los viudos, entonces podrá observar algo como lo que se muestra en la siguiente imagen, en donde solo se tienen tres registros con el valor “Viudo”.


En el caso de Calc solo puede elegirse un valor de la lista, y por default se aplica el operador de igualdad para hacer la comparación y filtrar los datos, pero si lo que se desea es elegir todos los registros a excepción de los viudos (es decir que muestre los casados, divorciados y solteros), entonces en necesario recurrir a la opción “Filtro-predeterminado” (dentro de la lista de la flecha), al hacer clic podrá observar el siguiente cuadro de diálogo y cambiar el operador de comparación.


Así se tiene que si elige la condición “<>” para el filtrado, ahora ya no se van a mostrar los registros de los “viudos”, observe el ejemplo (por espacio solo se muestran algunas columnas de la base de datos):


Recuerde que a partir del primer filtrado es posible elegir un nuevo campo y aplicar un nuevo filtrado en base a valores de dicho campo. Incluso observe cómo en el cuadro de diálogo de Filtro predeterminado era posible elegir dos condiciones adicionales. Cuando aplica un filtro adicional en otra columna de un rango de datos filtrado, entonces los demás cuadros combinados listan solamente los datos filtrados.

Observe cómo la o las columnas que se ha utilizado para el filtro, se identifican mediante un botón de flecha de color distinto.

En resumen, para aplicar un filtro automático debe seguir los siguientes pasos:
  1. Seleccione las columnas en las que desee utilizar el Filtro automático.
  2. Elija Datos - Filtro - AutoFiltro . Las flechas del cuadro combinado se muestran en la primera fila del área seleccionada.
  3. Para ejecutar el filtro, pulse en la flecha desplegable del encabezado de la columna y elija un elemento.
  4. Sólo se muestran las filas cuyo contenido cumple los criterios de filtro. Las otras filas se filtran (ocultan).
En caso de que desee eliminar un filtro aplicado a un campo, lo que debe hacer es ir al campo en cuestión, hacer clic en el botón de la punta de flecha y elegir la opción “Todo”. Ahora bien, si lo que quiere es eliminar por completo todos los filtros aplicados, lo que debe hacer es ir al menú y elegir las opciones: Datos / Filtro / Eliminar filtro y con ello se mostraran todos los registros de información de la base de datos, y ahora puede proceder a elegir nuevos criterios de filtrado. Si lo que desea es dejar de utilizar el Filtro automático, seleccione de nuevo Datos - Filtro - Filtro automático.


Veamos ahora que pasa en el caso se Excel

Para aplicar Filtro automático vaya al menú Datos y en la cinta de opciones seleccione Filtro:


Podrá observar el botón de punta de flecha en el nombre de cada campo. Al elegir el campo al cual aplicar el primer filtro, se mostrara un menú, veamos el ejemplo del campo “edoCiv”:


Como puede observar, en esta aplicación da la opción de aplicar el ordenamiento de los registros en base al campo; así mismo observe cómo es posible desmarcar (o marcar) los valores que sean necesarios para hacer el filtrado. Así si queremos que solo muestre los registros de los viudos, entonces solo se dejaría seleccionada la casilla con el valor “Viudo”:


Pero si lo que se quiere es mostrar todos los registros excepto en los que aparezca el valor “Viudo” solo dicha casilla se debe desmarcar:


Al igual que en Calc, en Excel es posible elegir varios criterios de filtrado, esto implicará ir a diferentes campos a elegir el valor para aplicar en el filtrado, y no olvide que cada filtro adicional en otra columna se aplica en base a los datos filtrados previamente por el criterio o criterios previos.

Observe que igualmente puede elegir la opción de "filtrado de texto" o "filtrado de número", dependiendo del tipo de dato del campo, y para cada caso se obtendrá una lista opciones de comparación a elegir.
Por ejemplo, campo EdoCiv es de tipo texto, por lo que se mostrará "Filtrado de texto" con las siguientes opciones :


Para el caso de datos numéricos, la opción se indica como “Filtrado de número”, ejemplo al elegir “edad”, se muestran las opciones:


Ahora bien, para eliminar el o los filtros aplicados, debe ir a elegir en el menú Datos, la opción “Borrar”, lo que eliminará todas las combinaciones de filtrado previamente elegidas. Pero si lo que desea es únicamente eliminar el criterio de filtrado en un campo, lo que debe es ir al campo, presionar el botón de flecha y hacer clic en la opción “(Seleccionar todo)”.

Cómo aplicar filtros en Hoja de cálculo de Google Drive

Para aplicar filtros en esta hoja de cálculo, vaya al menú Datos, en donde podrá elegir “Crear un filtro


A lo que podrá observar igual que en las otras aplicaciones, una punta de flecha en cada nombre de campo (primera fila). Si hace clic en el símbolo junto al nombre del campo se expandirá un menú contextual del cual podrá elegir como realizar el filtrado, por ejemplo, en el campo “edoCiv” en la imagen siguiente puede ver las opciones para “Filtrar por valores”:


Si elige Filtrar por condición es posible elegir entre las opciones de comparación para la condición y escribir el valor de comparación, independientemente del tipo de dato se muestran las siguientes opciones:


Aplicar filtros avanzados

Veamos en Calc como aplicar este tipo de filtrado. Primero, copie en otra hoja los encabezamientos de las columnas que utilizará para hacer el filtrado, es decir, los nombres de los campos de la hoja de la base de datos (BD) que se deben filtrar y, a continuación, introduzca los criterios de filtro en las filas situadas abajo de los encabezamientos. Los datos dispuestos horizontalmente en una fila estarán siempre conectados mediante el operador lógico Y, mientras que los dispuestos verticalmente en una columna lo estarán mediante el operador O.

  • Ejemplo: Se desea filtrar los registros de mujeres, sin importar el estado civil, y de aquellos que sean viudos, sin importar el sexo, para ello se configurarían los criterios como se muestra en la imagen. Observe que cada valor de cada campo está ubicado en diferente renglón; esto se debe a que si se ubica en el mismo renglón entonces aplicaría el operador Y, lo que haría que buscara los registros de las mujeres que son viudas, y eso es algo que no se desea.

Una vez creada la matriz de filtro, lo siguiente es ir a la hoja de la base de datos (BD) y colocarse dentro del área de datos (área de la hoja que se desea filtrar).

En tercer lugar, vaya al menú Datos - Filtro - Filtro especial, lo que abrirá el cuadro de diálogo Filtro especial:


En este cuadro debe definir las condiciones del filtro, para ello deberá hacer clic en el icono reducir (señalado en el círculo en rojo), de forma que el cuadro de diálogo se reduce, quedando solo visible:


De forma que pueda ir a la hoja donde se han escrito los criterios y seleccionar las celdas que contienen los criterios. Al hacer esto, se tendrá el rango de celdas donde previamente se habían escrito los criterios:


Una vez que el rango aparece en la caja de texto del cuadró de diálogo, haga clic nuevamente en el icono reducir, para que se expanda el cuadro de diálogo. Por último, pulse el botón Aceptar. Con ello comprobará que las únicas filas visibles son aquellas de la hoja de datos (BD) cuyo contenido cumple los criterios de filtro.


Las demás filas se han ocultado de forma temporal; para hacer que reaparezcan seleccione las filas de la hoja de cálculo y utilice la orden Formato - Fila - Mostrar.

Como puede ver, este tipo de filtrado permite filtrar celdas basadas en dos criterios de filtrado que no necesariamente se aplican en combinación, como se hacía con el filtrado automático, sino que se aplican por separado en cada campo.

En el caso de Excel, el proceso es similar, lo que cambia es la presentación del cuadro de diálogo. Debe ir la opción de menú Datos y luego en el área de “Ordenar y filtrar” elegir la opción “Avanzadas”, a lo que se mostrará el siguiente cuadro de diálogo:


Como puede observar, en Excel se solicita especificar el “Rango de la lista” que en este caso hace referencia al rango de celdas que contiene la base de datos, el cual se selecciona automáticamente si nos encontramos dentro de las celdas de la base de datos al elegir las opciones del menú que abren el cuadro de diálogo, pero que para el ejemplo se seleccionó manualmente a fin de que mostrará la referencia de la hoja donde se encuentra la base de datos (observe que es en BD).

Para especificar los criterios de filtrado (los cuales previamente se escribieron en celdas de otra hoja), por ello debe seleccionarse el rango de celdas que contienen dichos criterios (observe que en este caso se encuentran en la hoja Dominios).

Al elegir estos rangos de celdas y presionar el botón Aceptar, se obtiene el filtrado (al ser el ejemplo igual que al que se hizo en Calc, mostrará los mismos resultados ya presentados).

Para eliminar el filtro, deberá ir al menú Datos, y elegir en el área de “Ordenar y filtrar” elegir la opción “Borrar”, con ello se vuelven a mostrar todos los registros de información.


  • NOTA: Aun cuando se hayan aplicado filtrados, las funciones aritméticas también tienen en cuenta las celdas que no están visibles debido a la aplicación de un filtro. Por ejemplo, la suma total una columna incluye también los valores que se encuentran en celdas filtradas (ocultas). Aplique la función SUBTOTALES si sólo se deben tener en cuenta las celdas visibles tras la aplicación de un filtro.


Como ya se ha señalado, al hacer el filtrado de registros, solo se ocultan aquellos registros de datos que no cumplen con los criterios, y se muestra todo el contenido de los campos, sin embargo no se realizan conteos, y por tanto no se pueden obtener datos estadísticos (y la generación de gráficas a partir de ellos). Ésta es la diferencia fundamental que se tiene entre lo que es la aplicación de filtros y la generación de pilotos de datos, lo cual se estudiará posteriormente.

Puede descargar AQUÍ el contenido de la entrada en pdf.

Saludos

M.C. Bertha López Azamar




P.D. Alumno UNPA, si ya leíste la entrada, pon la letra de tu grupo y las iniciales de tus apellidos primero y luego de tu nombre en un comentario de esta entrada.