Interpretación de datos estadísticos

0
12

La noticia elegida para realizar este análisis, es la publicada en el medio digital El Independiente (https://www.elindependiente.com) , titulada “Todo abierto en la comunidad de Madrid: empate técnico entre izquierda y derecha”, publicada el 18 de Mayo de 2019.

En dicha noticia, se hace una previsión de los resultados electorales a la Comunidad de Madrid, en base a un sondeo realizado para el mismo medio  por el Insituto Dym (https://institutodym.es/).

  1. Presentación de los datos y población:

En la noticia se presentan 3 gráficos estadísticos. Los dos primeros gráficos, que hacen referencia a la repartición de escaños en la Comunidad de Madrid, adoptan la forma de medio anillo. Es la representación gráfica más típica para la presentación de repartición de escaños, ya que el número de escaños adjudicados suele ser de manera aproximada, partiendo de una horquilla en la cual se mueven los diferentes partidos. El tercer gráfico, es un gráfico de barras horizontales que muestra la intención de voto a cada uno de los partidos en porcentaje.

El tipo de estadística utilizado, es estadística descriptiva, mediante la cual se pretende exponer cuál va a ser la elección de voto de las personas entrevistadas. Analizando la ficha técnica del estudio (recogida al final del artículo), es posible constatar que unidad de análisis del sondeo es una muestra de la población de la Comunidad de Madrid, formada por 802 personas.

Por otro lado, en los tres gráficos, los datos se presentan en forma de valores relativos. Los escaños no podrían considerarse valores absolutos, ya que es necesario tomar los datos absolutos (los cuáles serían los votos de cada formación) y traducirlos a escaños. Prácticamente, sería trasladar un dato absoluto a un dato relativo, en el caso de los dos primeros gráficos traducidos en escaños y en el tercer gráfico traducido en porcentaje.

En cuanto a las variables, estaríamos trabajando con variables cualitativas o categóricas nominales, ya que  la respuesta a la pregunta clave del sondeo “¿A quién tiene intención de votar en las próximas elecciones autonómicas a la Comunidad de Madrid?” obtiene una respuesta en forma de partido político. A partir de ahí, mediante una tabla de frecuencias, se pueden obtener los porcentajes correspondientes para su representación, e incluso traducir este porcentaje en escaños. Hay que destacar a este respecto, que no es posible conocer si los porcentajes trabajados corresponden a porcentajes simples o porcentajes válidos.

En cuanto al volumen de la muestra, se ha realizado una comprobación utilizando una aplicación vía web, para comprobar si el tamaño de la muestra es el adecuado para la extrapolación siguiendo los siguientes pasos:

  1. Comprobación de los datos de la población de la Comunidad de Madrid, mediante la consulta en el INE (datos de 2018).
  2. La población total en la Comunidad de Madrid a fecha de 2018, era de 6.578.079 habitantes. Al ser proporcionados los datos de toda la población, se han sumado los datos de aquellas personas menores de edad (el INE proporciona los datos de población en las diferentes edades mediante grupos quinquenales). Se obtienen las siguientes referencias:
    1. De 0 a 4 años à 320.026
    1. De 5 a 9 años à 355.467
    1. De 10 a 14 años à 344.185
    1. De 15 a 19 años à 314.696
  3. De esta manera, si sumamos los habitantes de los diferentes grupos de edad, obtenemos 1.334.374. A pesar que están incluidas las personas de 18 a 19 años, podríamos considerar que la muestra se tiene que tomar aproximadamente sobre un volumen de población de 5.243.705 personas que se encuentran en edad de votar.
  4. Mediante aplicación online (https://www.feedbacknetworks.com/cas/experiencia/sol-preguntar-calcular.html) es posible obtener una aproximación de la muestra adecuada introduciendo los datos incluídos en la ficha técnica del estudio, como muestra la tabla a continuación:

Con lo cual, con los datos poblacionales proporcionados (de manera aproximada) y  los datos de la ficha técnica del estudio, podemos concluir que la muestra escogida (802 entrevistas) es adecuada para el fin del estudio.

2. Vacíos de información para interpretación de los datos:

En el primer gráfico (justamente el de la portada de la noticia), podemos apreciar que no se especifican ningún tipo de unidad. Simplemente observamos un gráfico de medio anillo, que proporciona unos colores adjudicados a una formación política, y unos datos numéricos sin ninguna leyenda. En el segundo gráfico ya se especifica que estos números corresponden a los posibles escaños que obtendría cada formación en las próximas elecciones.

Por otro lado, en ambos gráficos encontramos una porción del anillo que corresponde a “otros”, sin especificar a que corresponde este concepto. No indica si es parte de personas que se van a abstener, formaciones políticas que no obtendrían representación por no superar la barrera electoral o a qué hace alusión.

En el tercer gráfico dentro de la misma noticia, nos habla del porcentaje estimado de voto a cada formación. Los diferentes porcentajes, suman 100 %, pero tampoco se sabe si son porcentajes simples, o porcentajes válidos. Se sigue con el mismo problema con el ítem “otros”, que no sabemos a qué corresponde. Tampoco se conoce si existen casos perdidos o no.

Por otro lado, es curioso que en un estudio con una muestra de 802 entrevistas, no se haga alusión en ningún momento al volumen de personas que aún no han decidido su voto, van a votar nulo, se van a abstener o van a votar en blanco. Precisamente, en unos momentos en los que la actualidad política es bastante convulsa, es difícil asimilar que en un estudio de este tipo, todos los elementos de la muestra, y a posteriori su extrapolación, tengan decidido el voto de una manera tan definitiva.

Otro elemento a tener en cuenta, es que en la ficha técnica del estudio, se especifica “Para cada una de las modalidades de recogida de información se han aplicado cuotas específicas de sexo, edad y actividad laboral.”, mientras que en la recogida de información se afirma “Entrevista telefónica asistida de ordenador realizadas a teléfonos fijos y móviles a partir de la selección de numeraciones aleatorias. Entrevista online.” Aquí encontramos una gran contradicción, ya que se supone que la muestra ha sido seleccionada mediante “muestreo aleatorio simple”. Parece sumamente complicado aplicar criterios de aleatoriedad junto a cuotas específicas mediante llamadas telefónicas aleatorias y entrevistas online. La impresión es que lo único fiable de la muestra es su volumen.

Por último, destacar que no aparecen las entrevistas por ningún lugar del artículo, para poder comprobar si se han introducido preguntas de control.

3. Comentario crítico:

Después del análisis del estudio, da la impresión que es una solicitud de un estudio de bajo presupuesto por parte del periódico, para poder redactar una noticia sustentada en unos datos estadísticos, con la finalidad de publicar un artículo con unos posibles resultados electorales en la Comunidad de Madrid.

Lo que se pretende destacar a todas luces, es que puede haber una mayoría de partidos de ideología de izquierda, que el partido que ostenta la primera posición en el estudio no obtiene la victoria desde 1987, y que a pesar de ello logró gobernar con Izquierda Unida. Se destacan los malos resultados del PP, a pesar que recupera parte del electorado que votó a VOX en las pasadas elecciones generales.

Por otro lado, no se aportan los medios utilizados para realizar el estudio, para darle mayor fiabilidad.

A lo largo del texto se van introduciendo nuevos datos, como la valoración de los diferentes líderes, pero sin aportar ningún porcentaje de personas y valoraciones, ni tampoco realizando un análisis exhaustivo de los datos para conocer si las valoraciones a los líderes tienen un carácter objetivo o son fruto de la ideología del votante, degradando al contrincante ideológico.

Ni en los gráficos ni a lo largo del texto, se hace alusión a casos perdidos, ni abstencionismo o similar. A mi parecer, esto representa un error muy grave, que resta fiabilidad a todo el trabajo, presentando datos y resultados sesgados sin explicar el motivo.

Bajo mi humilde punto de vista, y como opinión personal, parece más un estudio encaminado a movilizar al electorado del centro derecha, con la finalidad de recentralizar el voto fraccionado con la finalidad de evitar una mayoría de partidos de izquierda, aludiendo a un supuesto empate técnico, que sería resuelto a través de dicha centralización de los votos inclinando la balanza de la repartición de escaños.

Recursos utilizados:

Artículo analizado: Todo abierto en la Comunidad de Madrid: empate técnico entre izquierda y derecha;Consultado 19/05/2019 y disponible en El Independiente https://www.elindependiente.com/politica/2019/05/18/encuesta-comunidad-madrid-empate-tecnico-entre-izquierda-y-derecha/

Población de la Comunidad de Madrid. Fuente consultada: INE, en 19/05/2019. Disponible en http://www.ine.es/jaxi/Tabla.htm?path=/t20/e245/p08/l0/&file=02002.px

Análisis de la idoneidad de la muestra del estudio. Consulta realizada en 19/05/2019. Herramienta disponible en https://www.feedbacknetworks.com/cas/experiencia/sol-preguntar-calcular.html

Dejar respuesta

Please enter your comment!
Please enter your name here