15a Cápsula (in)formativa – Research on Research Lab

Cómo usar preguntas filtro en encuestas online

A menudo necesitamos hacer encuestas a un grupo de individuos caracterizados por algún rasgo común: que sean consumidores de un determinado producto, que hayan padecido una enfermedad determinada, que hayan viajado a una destinación turística en los últimos meses… Este tipo de encuestas, en las que el universo objeto de estudio es sólo una parte muy concreta de la población total, son cada día más frecuentes en el ámbito empresarial debido a la tendencia a la microsegmentación del mercado.

En ocasiones, el rasgo característico que define el universo puede observarse antes de administrar el cuestionario. En una encuesta cara a cara dirigida a usuarios de autobús, el entrevistador que busca participantes por la calle podría dirigirse a paradas de autobús para abordar a personas que estén esperando el transporte público.

Algo parecido ocurre cuando hacemos investigación a través de Internet: si disponemos de información a priori sobre las personas a las cuáles me dirijo, puedo prescindir de invitar a participar a aquellas que ya sé de antemano que no cumplen con el rasgo característico deseado.

Esta práctica es algo habitual cuando hacemos investigación usando Paneles Online. Los Paneles son bases de datos de personas que han aceptado de antemano participar en encuestas y que han facilitado algunos datos personales para ello, típicamente sexo y edad. Algunos Paneles también registran información adicional como región, nivel socioeconómico, composición del hogar, y en algunos casos, incluso registran otros datos de consumo como qué marcas compran, que automóviles conducen, etc. Si la encuesta que queremos realizar a través de un Panel se dirige a individuos caracterizados por un rasgo ya identificado a priori, podremos administrar la encuesta sin preámbulos.

La necesidad de usar filtros

Sin embargo, no siempre el rasgo que caracteriza al universo objeto de investigación se conoce de antemano. En una encuesta cara a cara en la que buscamos consumidores de un producto, necesitaremos preguntar a cada individuo, antes de administrar la encuesta, si consume el producto en cuestión.

Del mismo modo, en encuestas online enviada a una base de datos o a un Panel Online que no tenga registrada la información que caracteriza a mi universo, necesitaré preguntar por dicha información previamente a realizar la encuesta. Incluso aunque la información esté registrada, es frecuente volver a confirmar el rasgo característico antes de empezar la encuesta, ya sea para verificar que la información que facilitó en su día sigue siendo válida hoy, o para asegurar que no cometió un error en la entrega de datos.

Las preguntas que se añaden a un cuestionario con la finalizada de verificar que el individuo forma parte del universo que queremos estudiar se denominan filtros.

Dónde colocar un filtro

Por definición, un filtro debería ir siempre al principio del cuestionario. Su función es evitar que una persona que no forma parte del universo estudiado pueda completar la encuesta, algo que sería inapropiado tanto para el respondiente – podría verse enfrentado a preguntas a las cuáles no sabría qué responder – como para el investigador.

Otra razón obvia para situar los filtros al principio es el coste. Si la entrevista es personal o telefónica, filtrar en un punto avanzado del cuestionario sería malgastar el tiempo del entrevistador. Si el cuestionario es online (por ejemplo, a través de un Panel), podrían suceder dos cosas: (1) si no estamos incentivando a los participantes filtrados, estaríamos malgastando el tiempo del respondiente y reduciendo su predisposición a participar en el futuro, mientras que si (2) el panel sí incentiva a los filtrados, estaríamos incurriendo en un sobrecoste innecesario.

Un filtro especial: el control de cuotas

Existe otra razón por la cual podemos querer evitar que un individuo, pese a pertenecer al universo que estoy estudiando, entre en nuestra muestra: el control de cuotas (ver 9ª Cápsula). Este caso sucede cuando queremos una muestra que mantenga unas proporciones representativas del universo estudiado en relación a unas variables concretas (por ejemplo, mitad hombres y mitad mujeres). En este caso, puede ser necesario descartar a un individuo porque ya tenemos la cuota cubierta con otros individuos de sus características.

La ubicación de este 'control' debe realizarse a continuación de las preguntas implicadas en las cuotas, que suelen ser sociodemográficas: sexo, edad, región, clase social, etc. Nuevamente, resulta conveniente situar dichas preguntas al inicio del cuestionario, junto al resto de filtros, para reducir costes y molestias a los participantes.

Esta conveniencia puede entrar en conflicto con la preferencia del investigador respecto a dónde situar las preguntas sociodemográficas dentro del cuestionario. Algunos investigadores (Hernández, Fernández y Baptista, 2003) sugieren que este tipo de preguntas (sexo, edad, población…) son las más intrusivas con el participante, por lo que situarlas al principio puede generar desconfianza, y el consecuente abandono del cuestionario. Otros, por el contrario, consideran que este tipo de preguntas, al ser fáciles de responder en comparación a preguntas sobre preferencias ('valora del 1 al 10 en qué medida te gusta...'), son un buen inicio para 'entrenar' al participante en la tarea de completar un cuestionario.

En cualquier caso, situar este tipo de preguntas al final cuando forman parte de un control de cuotas nos obligaría a asumir el coste de todos los individuos descartados como si fuesen participaciones válidas, algo inasumible en la mayoría de proyectos.

Efectos del cuestionario que pueden afectar a un filtro online

La validez de la información que obtenemos en un filtro es crítica: si un respondiente nos proporciona información falsa o inexacta, podrá completar la encuesta sin formar parte del universo, o por el contrario, será excluido pese a formar parte del mismo. Varios factores deben considerarse cuando diseñamos un filtro para un cuestionario online:

  1. (1) Efecto del 'yes-saying': Diversos estudios (ver 5ª Cápsula) muestran que los respondientes tienen mayor predisposición a decir 'sí' que a decir 'no'. Este fenómeno afecta de pleno a los filtros, especialmente en los siguientes casos:
    1. a) Cuando usamos un filtro formulado como una única pregunta aislada de respuesta 'sí/no': '¿Bebes refrescos de cola? Sí/No'.
    2. b) Cuando la decisión sobre responder 'sí' o 'no' depende de en qué medida el respondiente realiza una actividad: '¿Eres un bebedor habitual de refrescos de cola? ¿Bebes al menos dos veces por semana refrescos de cola?'. En este tipo de preguntas, el respondiente, ante la duda sobre si su nivel de consumo lo califica para responder afirmativamente, tenderá a responder afirmativamente.
  2. (2) Efecto del 'check-all-that-apply' vs 'yes-no': Según vimos en la 6ª Cápsula, mostrar listas de opciones en un formato 'check-all-that-aply' (listas en las que el respondiente puede seleccionar múltiples opciones) produce resultados diferentes a mostrar listas de elementos con parejas de opciones 'sí / no'. En el primer caso se obtienen menos menciones que en el segundo.
    Este comportamiento afectará a los filtros que se formulen usando estos formatos de preguntas. Por ejemplo, si el universo de un estudio lo constituyen individuos que consuman dos tipos de bebidas concretas entre una lista de 20 bebidas diferentes, si usamos un formato 'check-all-that-apply' se recogerán menos menciones y un menor número de individuos superará el filtro. Por el contrario, si usamos un formato 'sí/no', observaremos el efecto contrario.
  3. (3) Efecto del incentivo: La mayoría de Paneles Online incentivan la participación en las encuestas. Si además, el Panel sólo incentiva a aquellas personas que superan los filtros, aquellos panelistas con cierta experiencia dentro del panel pueden comprender el funcionamiento de los filtros y aprender a identificarlos. Si algo así sucede, podrían tratar de responder afirmativamente las preguntas filtros para obtener incentivos.
    Este efecto es especialmente grave, ya que un respondiente que miente en un filtro, con toda probabilidad facilitará información inválida en la encuesta, reduciendo la calidad de los datos del estudio.
Recomendaciones

Atendiendo a las consideraciones anteriores y a la gravedad que cada efecto puede tener, algunas recomendaciones a tener en cuenta cuando diseñemos filtros:

  1. (1) Evitar en la medida de lo posible preguntas filtro aisladas, en formato de pregunta simple con opciones de respuesta 'sí/no', especialmente si la respuesta depende del grado en que el respondiente realiza una actividad.

    '¿Ves habitualmente la TV? Sí / No'

    Este tipo de preguntas sufren un doble efecto: el “yes-saying” o tendencia a responder 'sí' ante la duda, y la respuesta fraudulenta de aquellas personas que sólo estén interesadas en obtener un incentivo por participar en un estudio. En ambos casos, el filtro sobre-estimaría el universo, dejando pasar individuos no aptos.

  2. (2) Si necesitamos usar preguntas aisladas tipo 'sí/no', podríamos formularlas en negativo (la opción que pasa el filtro es 'no').

    '¿Eres una persona que rara vez ve la TV?
    Sí, la veo poco / No, suelo verla a menudo'

    Si bien es cierto que esta opción tenderá infra-estimar a los individuos válidos para el estudio, puede ser más seguro para los resultados del estudio, y es más robusta frente a individuos que pretendan saltar el filtro de forma fraudulenta. Sin embargo, es necesario tener en cuenta que las preguntas en sentido negativo pueden ser más confusas para el respondiente.

  3. (3) Si optamos por incluir el filtro en una pregunta de respuesta múltiple ('check-all-that-apply'), deberíamos evitar listas de opciones demasiado extensas, ya que podríamos sufrir la falta de atención del respondiente en la evaluación de cada una de las opciones.

    '¿Cuáles de estas actividades realizas habitualmente?
    Practicar deporte
    Ver la TV
    Ir al cine
    Salir a cenar a restaurantes
    (...)
    Ninguna de las anteriores'

    En este caso, sufriríamos el efecto inverso al de la pregunta 'sí/no' aislada, el filtro descartaría personas válidas para el estudio.

  4. (4) El formato 'check-all-that-apply' es más robusto que una pregunta simple aislada tipo 'sí/no', frente a participantes fraudulentos que deseen pasar el filtro de forma malintencionada: si sólo una de las opciones de la lista permite pasar el filtro, puede ser difícil de identificar para un participante. Otra medida de seguridad a aplicar sería la de descartar aquellas personas que marquen todas las opciones disponibles de la pregunta 'check-all-that-apply', siempre y cuando la lista se diseñe de tal manera que sea inverosímil esta posibilidad para un individuo sincero (es decir, poniendo opciones incompatibles en la lista).

  5. (5) Un tercer formato de pregunta filtro posible sería el de listas de opciones múltiples con opción de respuesta “sí/no”.

    '¿Cuáles de estas actividades realizas habitualmente?
    Practicar deporte Sí / No
    Ver la TV Sí / No
    Ir al cine Sí / No
    Salir a cenar a restaurantes Sí / No...'

    Este formato probablemente es el más seguro: si la lista de opciones está bien diseñada, podemos detectar respondientes fraudulentos que respondan 'sí' a todas las opciones, y por el propio formato de la pregunta, sufriremos menos el problema de falta de atención en la evaluación de cada una de las alternativas, por lo que perderemos menos respondientes válidos que en el formato 'check-all-that-apply'. En cualquier caso, seguiríamos padeciendo el “yes-saying”, aunque seguramente menos que en una pregunta aislada.

  6. (6) El mensaje que mostramos a los respondientes que son filtrados es otra cuestión a tener en cuenta. Es una práctica común, que proviene de metodologías offline, comunicar mensajes de tipo 'lo sentimos, pero usted no tiene el perfil que estamos buscando'. Mostrar este tipo de mensajes es innecesario y en ciertas circunstancias puede acarrear problemas: por ejemplo, si la encuesta la estamos enviando a un Panel Online, mostrar mensajes de este tipo crea insatisfacción en el participante y le previene para el futuro, promoviendo una actitud fraudulenta en próximas encuestas. Para evitar estos problemas, podemos comunicar simplemente que la encuesta ha finalizado con éxito, y el respondiente puede pensar que se trata de una encuesta corta. En algunos casos es posible completar la encuesta filtrada con algunas preguntas de relleno para que el mensaje sea más creíble.

  7. (7) En el momento de diseñar el filtro, es importante conocer la procedencia de la muestra. Si estamos trabajando con un Panel Online, factores como el incentivo, la forma de reclutamiento de miembros, las políticas de incentivación de la participación o la frecuencia con la que los participantes son encuestados, pueden influir en la eficacia de un filtro. Por ejemplo, en paneles incentivados que envían encuestas a sus miembros con mucha frecuencia, podemos padecer más problemas de respondientes fraudulentos que tratan de saltar filtros (por la combinación entre incentivo y mayor número de oportunidades para aprender el funcionamiento de los filtros). Por el contrario, paneles que incentivan tanto a panelistas aptos para completar las encuestas como a aquellos que son filtrados, son más robustos frente a comportamientos fraudulentos respecto a los filtros.

En definitiva, las preguntas filtro de una encuesta son elementos que deben diseñarse con especial cuidado, teniendo en consideración los efectos que puede tener en su respuesta el formato de pregunta que empleemos, así como el origen de la muestra con la que estemos trabajando.

Referencias bibliográficas:
  1. -Hernández Sampieri, R., Fernández Collado, C. y Baptista Lucio, P. (2003). Metodología de la investigación (3a ed.). México: McGraw-Hill.

CONTACTO

* Campos obligatorios