Datanálisis Analizado

“Hay mentiras, malditas mentiras y estadísticas.” – Mark Twain

Última encuesta de Datanálisis (para muchos la encuestadora más seria), los resultados no son sorpresa ni para oficialistas ni para opositores.

Acá el link de los resultados de la misma, con todo el detalle.

Este análisis no busca descalificar sin argumentos a Datanálisis, por el contrario creo que es una excelente empresa en recolección de datos, con metodologías serias, pero que al realizar los análisis comete fallas y hace supuestos que realmente abren la imaginación a cualquiera a pensar el por qué de fallas tan deliveradas.  El análisis debate y cuestiona principalmente el “Error” muestral que maneja Datanálisis en su ficha ténica.

 

Análisis:

 

Este análisis asume lo siguiente:

1) La metodología de toma de muestras y por ende de proceso de encuestar es correcta.  Más si cuestiona la metodología elegida para el universo muestral y ciertas características del mismo.

2) Los resultados “crudos” no están manipulados de manera alguna.  Sin embargo el análisis de “datos filtrados” incurre en ligerezas y supuestos que son difíciles de sustentar.
Lámina 3   Los datos básicos o ficha técnica la pueden ver acá:

Ficha Técnica

A destacar:  (ambos puntos se hacen relevante más adelante)

  • ENCUESTA REALIZADA POR VÍA TELEFÓNICA.
  • La abstencíon no está bien definida.  Sólo hay las opciones “Seguro” y “algo Seguro”.  Al parecer no era interesante saber si alguien realmente no iba a votar.
  • Aparte la ficha ténica destaca un error de +-3,04% y nivel de confianza de 95%.

Láminas 5 y 6

 

Lámina 5

Las láminas 5 y 6 sólo muestran la intención de voto, y la variación de las mismas semana a semana.    En palabras sencillas a la pregunta:  Por quién votará usted en las elecciones del 7O las respuestas fueron:

  • 37,5% Chávez
  • 23,2% Radonski
  • 16,5% No sé
  • 15,8 % No contestó
  • El resto no res relevante para este análisis.

Chávez se jactó de que en una semana había crecido un punto y Radonski había perdido 2 y a manera de proyección citó que la “brecha crecía”.   Acá hacemos referencia a la ficha técnica que acotaba un +-3,04% de error.   Perfectamente la variación cabe en el error, especialmente porque las variables son dependientes una de la otra al totalizar a 100%.
Entonces realmente esto pudo ser al revés y Chávez con toda seguridad diría que está dentro del error, pero aprovechando que le ayuda dice que se trata de una brecha creciente.  Conclusión:  Totalmente infundada la teoría de Chávez

Las láminas 9, 10, 11 y 12 hablan sobre qué tan “duros” son los votos de cada candidato, pero realmente no aportan nada de valor.

Lámina 14

Lámina 14

En este punto se pone realmente interesante el análisis de la encuesta.  Del 100%, casi un tercio (32,3%) dijo que No Sabe o NO dijo por quién iba a votar.  El análisis hace esta salvedad asumiendo que el 15,8% que decidió no responder (ver lámina 5) sabe por quién va a votar pero decide no decirlo.  Mientras que hay un 16,5% que al parecer no tendría problema en decir por quén votará, pero simplemente no sabe aún.

Acá yo hago la primera salvedad.  Si bien podrían existir estos 2 grupos.  También podría ser perfectamente que si alguien lo llama a su casa y para usted es un perfecto desconocido al cual no puede no verle el carné de identidad.  Si usted decide que no quiere revelar por quién va a votar puede decir que no va a contestar, o perfectamente un “no sé”.  Asumir que existen estos 2 grupos me parece válido, sin duda debe haber gente que aún no sepa por quién votar (en mi opinión mucho menos que el 16,5%) pero en todo caso es una ligereza ponerle un número.
Adicionalmente el grupo “no contestó” debe ser atendido y considerado.  Esta son gente que va a votar de acuerdo a la encuesta (los que al parecer van a votar pero no están seguro son sólo el 8,6%  Lámina 3)) y están ya aislados en la Lámina 14 como el grupo “Ninguno”.

En este punto yo planteo una hipótesis con fundamentos del por qué Datanálisis no lo incluye, pero a su vez de por qué entonces han debido dar un margen de error más grande a su encuesta, llegando a superar el 25%.

Hipótesis:  En la Venezuela de hoy es muy riesgoso para un empleado público revelar que votará en contra de Chávez el 7O y sólo lo haría a gente de su entera confianza.  Un encuestador por telefóno (que es probablemente la forma de encuestar más impersonal) no es alguien de su entera confianza.

  • Sustento 1:  Chávez no ha dicho una sola vez que el “voto es secreto”
  • Sustento 2:  El CNE tiene 2 publicidades en las cuales se toca de manera irresponsable el tema de las captahuellas que es súmamente sensible en Venezuela.  En estos 2 comerciales a pesar de no decir que el voto es identificable por la captahuella (lo cuál es totalmente imposible), hace su mejor esfuerzo en confundir y mostrar que la máquina de votación está unida al captahuella, más no hace énfasis en que el sistema no permite saber el orden de votación.
  • Sustento 3:  Miles de empleados despedidos de organismos públicos bajo control oficialista por mostrar afinidad política distinta “o deslealtad”.

Pregunta Retórica:  ¿En unas elecciones donde el gobierno actual es el principal empleador del país, a quién le interesaría confundir dejando entrever que el voto de alguna manera no es secreto, y que con esto el futuro de su empleo, ayuda social, etc. podría estar comprometido?

Por qué Datanálisis no considera esto?  Datanálisis busca en su encuesta ser objetivo, y realmente a pesar de que esta situación es bien conocida en el país, es difícil cuantificar cuánta gente tiene miedo de que su voto se sepa y cuánta no.  Por esto sería ciertamente irresponsable por parte de Datanálisis hacer juicio al respecto.  Pero… no es entonces arriesgado lanzar pronósticos donde UN TERCIO de la gente simplemente no contestó?.
Qué margen de error podría haber?

Lámina 14

En la Lámina 14 Datanálisis trata de responder esta pregunta.  Sin embargo considerando todo lo anterior, creo que es el punto donde el análisis se vuelve completamente irresponsable, las razones por las que esto ocurre de seguro son especulables.  Yo asumo que simplemente “se permitieron ligerezas” en el análisis.

Para ponerlo en contexto:  A la gente que el encuestador llamó por teléfono a su casa, que como dijimos antes el encuestado no puede verle la cara, ni una credencial, a esta persona le preguntaron por quién votaría y dijo “No sé”.  Y ya se explicó antes la poca precisión de los que dijeron “No Sé” porque de verdad están indecisos, y aquiellos que lo dijeron como una forma más amable de decir “no te voy a responder esta encuesta”.   El encuestador les preguntó algo así como “Si es vida o muerte y tienes que elegir a alguien, a quién eliges”.

  • Chávez 7,2%
  • Radonski 3,2%
  • No Sé  43,6%
  • No Contesta 32,3%.

Datanálisis decide totalizar a Chávez + Radonski  =  7,2% + 3,2%  =  Y sacar los porcentajes relativos de cada uno  Chávez ~70%  Radonski 30%.  Y decir:

A pesar de que no tenemos idea de por quién va a votar 78,6% de los indecisos (43,6% No Sé + 32,3% No contestó) nos tomamos la ligereza de decir que se van a repartir en.. aver….  70% Chávez 30% Radonski.

Lámina 17

Lámina 17

Y con esto, por supuesto la brecha de intención de voto crece aún más y deja a Chávez en 44,7% y a Radonski en 26,4%.

Esta es la parte del análisis que considero inaceptable, al menos sin que Datanálisis indique un error de +-30% en su ficha ténica, lo cuál dejaría la encuesta como un documento totalmente inútil, y en mí opinión dejaría al encuestador sin entrevistas controversiales, minutos en TV, etc, etc.

La pregunta es:  Qué pasa si los que dicen que no contestan son gente que sí sabe pero tiene miedo a la única persona a la que le podría tener miedo la mayoría de los encuestados, (pues siendo muy conservador si asumimos que TODOS los empleados públicos tienen miedo de revelar su voto por el contrario, igual debemos considerar que el oficialismo controla a 83% de los empleados públicos contra un 17% en organismos de la oposición, los números son aún más altos para aquellos que se benefician de programas sociales del oficialismo Vs. a los de la oposición).

Tendríamos 83% de empleados públicos con miedo de revelar el voto a su empleador, es decir que votarían por Radonski y 17% de empleados públicos que votarían por Chávez.

Busquemos entonces al 15,8% que decidió no contestar la encuesta y calculemos el 83% y 17% respectivamente.  Quedaría un agregado de 13,1% para Radonski y 2,86% para Chávez.

Sumando esto a los resultados de la primera pregunta Láminas 5 y 6  Chávez quedaría con 40,2% y Radonski con 36,6%.  Un panorama completamente distinto a los supuestos 20 puntos de ventaja.

Y qué pasa con el 16,5% que dice que “No Sabe”, la pregunta clave está detrás de entender cuánta de esta gente realmente “No Sabe” y cuánta de esta gente “Tengo Miedo de Decir”.

Lo que puedo decir es que si de esos “No Sabe” llega a haber tan sólo 37% de ellos que tienen miedo de que su empleador sepa su voto, pues votarán por el contrario.  Siguiendo la metodología de análisis que apliqué para los “No Responde” con 83% de empleados y beneficarios del oficialismo y 17% de la oposición, ya Radonski quedaría por arriba en las encuestas.

De ninguna manera considero válida hacer una especulación con cifras, más si creo que es relevante destacar el hecho que existe una incertidumbre tal en esta encuesta, y que con tan sólo pequeños cambios cualquiera de los candidatos podría resultar ganador, que considero que el valor de la misma es cuando mucho de “divertimento” para el público general.

En esta encuesta se pretendió decir:  No tengo idea de por quién votará 1/3 de los electores, pero el ganador es Chávez.  Creo que el error de esta encuesta, es no declarar su verdadero error.

No me atrevo a decir que Datanálisis está a favor o en contra del gobierno, pienso que si en la primera pregunta la oposición llevara la ventaja, el resultado daría una brecha positiva para la oposición pero igual el análisis sería muy cuestionable, y el resultado para el encuestador el mismo: Entrevistas en TV, polémicas, etc.  Realmente creo que esto último es el objetivo principal de Datanálisis.

Espero les sea útil.

 

 

 

 

About aldonin

Yeah, it's overwhelming but what else can we do Get jobs in offices and wake up for the morning commute?
This entry was posted in Estadística, Opinión, Política, Sociedad and tagged , , , , , , , , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s