UCV

UCV
UCV

lunes, 23 de julio de 2018

Determinación del tamaño de muestra para estimar medias poblacionales

La pregunta es: ¿que tan grande debemos seleccionar el tamaño de muestra para una investigación o un experimento?

"Esto es importante y no debe de tratarse con ligereza", porque tomar una muestra más grande  de lo necesario para alcanzar los resultados deseados, es un desperdicio de los recursos, tanto en costo y tiempo de la investigación, y si tenemos muestras pequeñas con frecuencia conducen a resultados sin uso práctico. Entonces, el tamaño de la muestra depende de la Desviación Estándar de la Población, el Grado de Confiabilidad o Nivel de Significación y el Error Estándar o Deseado
La fórmula para el cálculo de la muestra es:



                                                                       no
                                                                     n =     ---------            (1)
                                                                   1  +  no
                                                                                                                 N

donde:

                                                      2           2
                                               Z   
                                   no = ----------------                           (2)
                                                     2
                                               e 

Z= Nivel de significación

S= Desviación estándar

e= Error de medición estándar

El tamaño de la muestra requiere que se conozca la desviación estándar, pero generalmente se desconoce. Como resultado, tiene que estimarse. Las fuentes de estimaciones que se usan con mas frecuencia son las siguientes:

1.- Puede extraerse una muestra piloto o preliminar de la población y puede usarse la varianza calculada a partir de esta muestra como una estimación de    .

2.- Puede obtenerse con estimaciones obtenidas de estudios anteriores.

3.- Si se tiene la sensación de que la población de la cual se va a extraer la muestra está distribuida aproximadamente en forma normal, puede usarse el hecho de que el recorrido es aproximadamente igual a seis desviaciones estándar y calcular S=R/6. Este método requiere de cierto conocimiento del valor máximo y mínimo de la variable a estudiar de la población.



Ejemplo 1.

Mi amiga Veruska, nutrióloga  de salud de un Hospital de la Ciudad de Caracas, desea conducir una investigación entre una población de muchachas adolescentes, con el fin de determinar su ingestión diaria promedio de proteínas, está buscando el consejo de un estadístico, relativo al tamaño e muestra que debe tomar.

¿qué procedimiento sigue el estadístico para proporcionar asistencia a la nutrióloga ?

Antes que el estadístico pueda ayudar a Veruska,  ésta debe dar tres detalles de información:

a.- el ancho deseado del intervalo de confianza,

b.- el nivel de confianza deseado, y

c.- la magnitud de la varianza de la población.

Supongamos que a la nutrióloga le gustaría un intervalo de 10 unidades de ancho, es decir, le gustaría que su estimación de error deseado estuviera dentro de cinco unidades aproximadamente de la verdadera, en cualquier dirección. Supongamos también que se decide por nivel de confianza del 95% y que, de su experiencia pasada, la nutrióloga siente que la desviación estándar de la población es probablemente alrededor de 20 gramos. Ahora el estadístico tiene la información necesaria para calcular el tamaño de muestra.

Datos:

Nivel de confianza de  95% , quiere decir,  que este dato lo llevamos a la tabla de la curva de la normal y equivale a Z = 1,96

Error estándar = 5, ya que ella quiere que su intervalo de confianza sea + o - igual a 5 del promedio aritmético.

Y la Desviación estándar  o variabilidad de sus datos es de 20 gramos.

Supongamos que la población de interés es grande de modo que el estadístico puede ignora la corrección por población finita y usa a la formula (2).

Haciendo las sustituciones apropiadas se encuentra que el valor n es:

n = [ (1,96x1,96)x(20x20)]/(5x5)  = 61,44

se le recomienda  que se tome una muestra de 61 personas.


Determinar el tamaño de muestra para estimar proporciones

Este método es esencialmente igual al que se describió anteriormente, suponiendo que el muestreo garantice la normalidad aproximada de la distribución P, se llega a la a la siguiente fórmula es decir
                           2     
 cambiar     por PxQ

donde P es la proporción en la población que posee la característica de interés, y obviamente es el parámetro que se esta tratando de estimar , veamos un ejemplo

Ejemplo 2

Se está planeando una encuesta con el fin de determinar qué proporción de familias en cierta área son medicamente indigentes. Se tiene la impresión de que la proporción no puede ser mayor que 35%. Se desea un intervalo de confianza del 95% con un error del 5 %. ¿Qué tamaño de muestra de familias debe seleccionarse?



                                                      2           
                                               Z    Px
                                   no = ----------------                       
                                                     2
                                               e 


Sustituimos


                                                      2           
                                            1,96x.(0,35)x(0,65) 
                                   n = --------------------------------------------    = 349,6                   
                                                                   2
                                               (0,05)

Entonces el tamaño de muestra es de 350.

viernes, 6 de julio de 2018

La Aleatoriedad

 
De un modo muy general, podemos decir que la probabilidad es la disciplina que se ocupa del estudio de lo aleatorio (o estocástico) y que un proceso estocástico es el estudio de lo aleatorio cuando se incorpora la variable tiempo. Por ejemplo, lo que sucede al lanzar una moneda no es un proceso estocástico; sin embargo, la secuencia de resultados obtenidos al lanzar una moneda varias veces seguidas sí que lo es.


No importa cuanto se sepa acerca de una acción financeira, aun no se puede saber con certeza como cambiara el precio a continuación, de la misma manera, no importa cuanto sepa sobre una moneda antes que se voltee, aun no puede predecir a que valor llegara después. El factor común: La Aleatoriedad

En el campo de las telecomunicaciones encontramos distintas áreas que requieren del “control ”de lo aleatorio. Nos servimos de la teoría de la señal para ilustrar el concepto de aleatorio en este campo. Una señal aleatoria es una onda en el tiempo que sólo puede caracterizarse mediante la probabilidad. Más concretamente, una señal de radio o televisión, cuya emisión está muy controlada, pues llegar al receptor con ciertas perturbaciones como pitidos de fondo o “nieve”en la imagen. La onda que se superpone a la emisión de la radio o de la televisión es una tensión que vista en el osciloscopio fluctúa aleatoriamente (sin un patrón específico) en el tiempo. Esta onda se denomina ruido. La señal anterior es inherente a cualquier emisión considerada en el campo de la telecomunicación y no es en absoluto deseable, es un “mal”con el que se convive. Ahora bien, también hay señales aleatorias deseables, como puede ser la sucesión de ceros y unos (bits) que transmite un ordenador, la energía eléctrica producida por un aerogenerador, la señal producida por un detector solar, etc. El hecho de que las señales anteriores sean aleatorias se debe a que hay fenómenos aleatorios que las generan, como la fuente de información a la que accede el ordenador, la velocidad del viento o las condiciones meteorológicas.


Según Wikipedia: "La aleatoriedad se asocia a todo proceso cuyo resultado no es previsible más que en razón de la intervención del azar. El resultado de todo suceso aleatorio no puede determinarse en ningún caso antes de que este se produzca. El estudio de los fenómenos aleatorios queda dentro del ámbito de la teoría de la probabilidad y, en un marco más amplio, en el de la estadística.
La palabra aleatorio se usa para expresar una aparente carencia de propósito, causa, u orden. El término aleatoriedad se usa a menudo como sinónimo con un número de propiedades estadísticas medibles, tales como la carencia de tendencias o correlación."


El concepto de aleatoriedad y el papel que desempeña en la naturaleza ha ocupado a los investigadores desde hace siglos. En sus días, pensadores como Leibniz y Laplace desterraron el azar del funcionamiento del mundo al sostener que nada ocurre sin que haya una razón para ello y que todo proceso natural debería poder predecirse sin ambigüedades una vez se conociesen por completo todas las condiciones iniciales de un sistema. En el siglo XX, sin embargo, la mecánica cuántica cambió las reglas del juego y reclamó para sí una noción de aleatoriedad intrínseca en las leyes físicas. Desde entonces, un sinfín de experimentos han demostrado que la naturaleza, después de todo, sí es capaz de llevar a cabo «actos de creación pura».


Un sistema es aleatorio, cuando no se puede predecir un resultado con certeza, incluso cuando se tiene toda la información disponible. Pero puede explorar el comportamiento de sistemas aleatorios utilizando modelos matemáticos, que operan en el mundo de las probabilidades, que describen el comportamiento probable de los sistemas aleatorios bajo diferentes condiciones







Algunos ejemplos complejos:

a) El numero esperado de llamadas telefónicas que llegan por minuto a una centralita es de 10. Simular una realización del proceso que cuenta el numero de llamadas hasta el minuto i, con i = 1, . . . , 100. Consideramos la hipótesis  habitual de que el numero de llamadas por unidad de tiempo se comporta como una Poisson.

b) Un observatorio meteorológico realiza mediciones cada 5 minutos de la temperatura en el exterior en un día caluroso de agosto en el que no hay grandes alteraciones climatologícas.

c) Un parque eólico tiene un potente anemómetro que mide permanentemente la velocidad del viento en metros por segundo. Durante un seguimiento continuo de una hora, observamos velocidades que se comportan como una distribución gamma de parámetros α = 2 y β = 2.

d) El sistema de alarma de un edificio tiene un sensor que transmite la senal 0 mientras no detecta una intensidad de corriente superior a 20 amperios, en el momento que lo detecta transmite un valor igual a uno. Suponemos que la intensidad de corriente, I, se comporta como una exponencial trasladada 15 unidades. Esto es, I = 15 + X, donde X ∼ ξ(0.25).





Para finalizar, vean el esquema de un proceso estocástico



>

Una opinión sobre las encuestas

Las encuestas son interesantes instrumentos de medición y como tales, cada quien le da el uso que desee. Para evaluar su confiabilidad sugiero tomar en cuenta el tamaño de la muestra, la precisión, el error típico, el grado de confiabilidad, la ubicación geográfica, los costos asociados y el mecanismo ha implementar para la medición.

La necesidad de que en  las investigaciones por muestreo (lo que comúnmente se denomina "Encuesta"), hay que definir varios aspectos a la hora de realizarla.

1.- Establecer el diseño muestral, que es la columna vertebral del estudio.

2.-Precisar las Variables a medir incluyendo los costos.

3.- Los objetivos

4.- Definir conceptualmente el fenómeno a estudiar.

Esta es una disciplina científica, pero  hay quien la considera como una bola de cristal, sin embargo los Estadísticos hacemos un seguimiento del comportamiento del mercado e identificamos los posibles escenarios, por ejemplo, en los estudios políticos o electorales,  se plantean varios escenarios para obtener el porcentaje (%)  en intención de votos de los aspirantes a algún cargo público, además se plantean varios escenarios en la manera como se fueran a distribuir los encuestados que no dicen por quien va a votar.

Siempre debe haber un rigor en el análisis y resultados de las encuestas y no deben estar sesgada por algún tipo de interés, ademas se debe de estudiar con mucho cuidado su metodología que nos permita encontrar razones porque nos lleva a un pronostico determinado, para que luego se pueda leer, interpretar y analizar  los resultados correctamente.

La publicación de las encuestas son relevantes para los habitantes de un país, quienes cada día aspiran a tener mas información y mayor interés por los estudios de opinión, mas allá  de que existan buenas y malas encuestadoras y por otro lado si hay una sociedad que piensa que le mienten tanto los servidores públicos como las instituciones. Por tales razones hay forma de interpretar la realidad y por ende se necesita de instrumentos de medición con calidad y que sean comparables.

Se debe tener unos standares mínimos que permitan que una encuesta sea mas o menos confiables para los ciudadanos de las nuevas y venideras sociedades, que puedan revisar los diferentes estudios de opinión con una credibilidad aceptable.

Es importante resaltar, que los estudios de opinión, independientemente de los resultados que arrojen, desatan lo que le llaman "pasiones" porque en los grupos sociales crea un fervor para las  conversas y discusiones al respecto.

Hay varios mitos sobre las encuestas, uno de ellos es que "las encuestas son manipuladas por quienes la pagan". Si fuera cierto, en vez de contratar a una empresa encuestadora, la persona o grupo podría escribir en una hoja unos datos, gráficas y las presenta. Otro mito es "la encuesta es una fotografía del momento", en países como el nuestro donde hay una hiperinflación exagerada, esa condición cambia diariamente y las encuesta que se hace hoy, y mañana se la hacen a la misma persona y esa respuesta es totalmente diferente, ademas que tratan de justificarse por los errores que cometen en las predicciones, proyecciones y análisis e interpretación de resultados, ya que cuando se hace un estudio por muestreo se supone que se va a inferir sobre algún fenómeno de estudio, para un tiempo determinado. Otro mito es " los instrumentos de medición pueden ser visto como buenos y malos", ya que estos son elaborados a petición del cliente y no para ser divulgado en medios de comunicación para resaltar unas pocas características que se quieren que se resalten,las mismas deben de tener un rigor técnico y que sean confiable.

Para culminar, ofrezco un esquema de como puede realizarse una investigación por muestreo:


  • Plantear los Objetivos y finalidades
  • Terminología y conceptos. Medidas estadísticas a utilizar
  • Cuestionarios  ( se diseñan conforme a los objetivos del estudio y el periodo de investigación)
  • Universo de estudio
  • Diseño, tamaño y selección de las muestras
    • Encuesta previa o piloto
    • Encuesta definitiva
  • Costos asociados a la investigación
  • Periodo y tipo de observación
  • Levantamiento de las encuestas
  • Calculo de errores de muestreo-Inferencia sobre los resultados muestrales
  • Tabulación y análisis de resultados

Fredy Zavarce
Estadístico -UCV
Especialista en Finanzas-UCV
Profesor del Post grado UCV
Profesor de UCV-CUFM
Cátedras: Estadística - Matemáticas y
Modelos Cuantitativos
correo: zavafree@gmail.com

Una teoría matemática de la comunicación


Hace 70 años esta semana Claude Shannon introdujo el campo de la teoría de la información con su ponencia "una teoría matemática de la comunicación", que ha sido citado más de 100, 000 veces: (Via

"70 years ago this week Claude Shannon ushered in the field of information theory with his paper "A Mathematical Theory of Communication", which has been cited over 100,000 times": (via )


Euler proved that π/4=arctan(1/2)+arctan(1/3), which can be used for computing digits of π (using the arctangent series). I wondered if I could prove it without using a trig identity for tangent (which I'd have to look up). Good news: Easy to do using the law of cosines.


Euler demostró que π / 4 = arctan (1/2) + arctan (1/3), que se puede usar para calcular los dígitos de π (usando la serie arctangent). Me preguntaba si podría probarlo sin usar una identidad trigonométrica para la tangente (que tendría que buscar). Buenas noticias: fácil de hacer usando la ley de los cosenos.

lunes, 11 de junio de 2018

Promedios, Mediana y Moda

PROMEDIO ARITMÉTICO

Se define como el valor mas representativo de una serie de valores, es una medida de tendencia central. Es importante señalar que el promedio y media aritmética tienen el igual significado.

Los promedios se dividen en simples, agrupados y en ponderados.

Se denota por promedio simple:     

  Teniendo una serie de valores X1, X2, X3,...,Xn, Su formula de cálculo viene dada por la siguiente expresión:   
  
Es decir, sumatoria de todos los valores y el resultado lo divido entre el numero de datos



Ejemplo:

Las edades de un grupo de niños son las siguientes:  2; 4; 6; 8; 10

para calcular el promedio o media aritmética 

          2 +4 +6 +8 + 10       30
 X = ---------------------- =  ----- =  6
                      5                    5


Interpretación: el promedio de edades de los 5 niños es de 6 años



MEDIA ARITMÉTICA O PROMEDIO PARA DATOS AGRUPADOS


Su formula de calculo es: 

donde: Xi = punto medio de cada intervalo de una distribución de frecuencias

            fi = frecuencia absoluta de cada intervalo
            
             n = total de datos


Ejemplo:

La siguiente distribución representa los minutos de lectura de un grupo de estudiantes que asisten a la biblioteca

Minutos de
Lectura              Fi        

0----------10        4
10,1------20        3
20,1------30        2
30,1------40        1

Paso 1: Hallar el Punto medio de cada intervalo, es decir, en el ejemplo el punto medio para el primer intervalo es la mitad entre 0 y 10 el cual es igual a 5, y así sucesivamente, calculamos los siguientes puntos medios

Minutos de
Lectura              Fi        Xi

0----------10        4         5
10,1------20        3        15
20,1------30        2        25
30,1------40        1        35

Paso 2: Multiplicar cada punto medio por la frecuencia absoluta

Minutos de
Lectura              Fi        Xi       FiXi

0----------10        4         5          20
10,1------20        3        15         45
20,1------30        2        25         50
30,1------40        1        35         35

Paso 3: Hallamos la sumatoria de esa columna

Minutos de
Lectura              Fi        Xi       FiXi

0----------10        4         5          20
10,1------20        3        15         45
20,1------30        2        25         50
30,1------40        1        35         35

Total                 10                   150

Paso 4: Hallamos el promedio dividiendo el valor de la sumatoria de FiXi = 150 entre el numero de datos que son 10

⤲ = 150/10 = 15    es decir que 15 minutos es el promedio de lectura de los 10 estudiantes



MEDIA ARITMÉTICA O PROMEDIO PONDERADO

Su formula de calculo es: 


Donde : Xi = valor de la variable i-esima 
   
              Wi = peso o importancia 

Ejemplo

Las Notas y el numero de créditos de cada cátedra o materia  de un semestre de la alumna "Daniela Carolina" son las siguientes:

Cátedra             Crédito (Wi)          Nota (Xi)   
---------------------------------------------------
Contabilidad            3                        10
Matemáticas            4                        12
Inglés                       2                        16
Estadística               6                        14

Paso 1: Multiplicar peso por nota 
Cátedra             Crédito (Wi)          Nota (Xi)         XiWi
----------------------------------------------------------------------
Contabilidad            3                        10                   30
Matemáticas            4                        12                   48 
Inglés                       2                        16                   32
Estadística               6                        14                   84

Paso 2: Hallamos la sumatoria de los créditos y la de la columna XiFi
Cátedra             Crédito (Wi)          Nota (Xi)         XiWi
----------------------------------------------------------------------
Contabilidad            3                        10                   30
Matemáticas            4                        12                   48 
Inglés                       2                        16                   32
Estadística               6                        14                   84

Total                       15                                            194

Paso 3: el promedio ponderado es   ⤲w = 194/15 = 12,93 es la nota promedio ponderada de ese semestre de la alumna Daniela Carolina



MEDIANA

                                                  0-------------------------------N
                                                                      N/2

La mediana es una medida de tendencia central que divide la población en dos partes iguales, 50% para la derecha y 50% para la izquierda

Se denota con Md

Ejemplo : las edades de un grupo de niños son  2; 6; 4; 8; 10

primero ordenamos y luego seleccionamos el valor central  2; 4; 6; 8; 10 luego el valor central es el 6                                            

                                                          Md = 6

Ejemplo: las edades de un grupo de personas son las siguientes:  10; 20; 30; 40; 50; 60

para hallar mediana primero ordenamos los valores o datos y luego seleccionamos los dos valores centrales, sumamos y dividimos entre 2

Md = (30+40)/2 = 35


MEDIANA PARA DATOS AGRUPADOS

Su formula de cálculo es: 
Donde: Li = Limite inferior del intervalo donde esta la mediana
            
            Fi-1 = Frecuencia acumula anterior a la clase donde esta la mediana

            fi = frecuencia absoluta donde esta la mediana

            ai = Tamaño del intervalo

Ejemplo
La siguiente distribución representa los minutos de lectura de un grupo de estudiantes que asisten a la biblioteca

Minutos de
Lectura              fi        

0----------10        4
10,1------20        3
20,1------30        2
30,1------40        1

Total                  10 

para hallar la media vamos a seguir estos pasos.

Paso 1: Hallar N/2 = 10/2 = 5

Paso 2: Hallar la frecuencia acumulada, para ello insertamos una columna a la derecha de la distribución

Minutos de
Lectura              fi        Fi

0----------10        4          4
10,1------20        3          7
20,1------30        2          9
30,1------40        1         10

Total                  10

Paso 3: Preguntaremos por la regla de decisión  ¿Frecuencia Acumulada es mayor e igual a N/2?

Aquí comenzamos a comparar 4 es mayor e igual a 5? la respuesta es "no", entonces, en el primer intervalo no esta la mediana

pasamos al segundo valor de la frecuencia acumulada... 7 es mayor e igual 5? "si", entonces, en el intervalo de 10, 1 a 20 se encuentra la mediana

Minutos de
Lectura              fi        Fi

0----------10        4          4
10,1------20        3          7
20,1------30        2          9
30,1------40        1         10

Total                  10

Luego buscamos los parámetros de la formula

Li = 10,1      Fi -1 = 4       fi = 3     ai = 20-10,1 = 9,9

Sustituimos en la formula  Me = 10,1 +  (5-4)*9,9     = 13,4
                                                                  ------    
                                                                     3   



MODA: es le valor que mas se repite

Ejemplo : Las edades de 6 niños son las siguientes: 2; 4; 6; 8; 4  la moda seria = 4

En una serie de datos puede haber mas de una moda o puede que no haya moda



El siguiente vídeo es recomendado para aclarar alguna duda:



y aquí les dejo un enlace para cualquier duda https://blogs.ua.es/violeta/tag/videos/

para cualquier consulta Zavafree@gmail.com

domingo, 27 de mayo de 2018

Partes de un Gráfico


Los gráficos son una representación visual de un conjunto de observaciones o datos, que han sido recolectados, de un evento, suceso, experimento, situación, etc., los cuales los ordenan y clasifican. Sin embargo, es importante conocer y tener presente sus respectivas partes ya que, un gráfico bien realizado habla por si solo, estas partes  son las siguiente:

  1. Titulo del Cuadro
  2. Cuerpo del Cuadro
  3. Las Variables respectivas tanto en el eje de las ordenadas (Y) como en el eje de las abscisas (X)
  4. Leyenda
  5. Fuente
  6. Notas


En el siguiente vídeo, recomendado, aprenderán a realizar y/o elaborar un gráfico en excel, espero lo disfruten....







Tipos de Gráficos 

1.- Lineas


2.- Barras


3.- Circular o Torta






4.- Pictograma

5. Pareto



6.- Gráfico de Control


7.- Histograma y Polígono e Frecuencia



8.- Área o superficie


9.-  Histograma - Curva Normal

10.- Teoría del Caos







jueves, 10 de mayo de 2018

La importancia de la Estadística

La importancia del conocimiento de la Estadística en nuestros días

La Estadística es una rama de las matemáticas más cercana a nuestra vida cotidiana de lo que pensamos. La utilizamos continuamente en nuestro lenguaje, incluso sin darnos cuenta, haciendo familiares términos como población, muestra, porcentaje, media, moda… Hoy en día, cualquier persona informada posee un vocabulario básico de Estadística que utiliza habitualmente y, en la mayoría de los casos, entiende.
Los anuncios publicitarios hablan de porcentajes de descuento en los precios de los productos. Las noticias de los medios de comunicación, divulgan continuamente diferentes estadísticas sobre la intención de voto de los electores hacia un partido político u otro, la evolución de la tasa de desempleo, las estadísticas de los accidentes de circulación, la tasa de natalidad y mortalidad, la tasa de inflación interanual, el porcentaje de gasto de los gobiernos en cada partida presupuestaria, etc.
Prácticamente todas las ciencias, tanto tecnológicas como sociales, utilizan aspectos fundamentales de la Estadística
En nuestros días, la Estadística se ha convertido en una ciencia aplicada a lo cotidiano que se utiliza como método efectivo para describir y predecir con exactitud hechos y fenómenos de índole muy diversa: políticos, sociales, psicológicos, sanitarios, biológicos, físicos y hasta deportivos. Y es que a medida que ha ido aumentando la complejidad en el mundo, se hace más difícil la toma de decisiones informadas y racionales sin tener un conocimiento objetivo lo más preciso posible de los fenómenos y las situaciones, para lo cual es necesario contar con la orientación que nos proporcionan herramientas de análisis científico altamente confiables como es la Estadística, que nos permitan realizar elecciones acertadas y eficientes, ayudándonos a resolver los problemas de la vida cotidiana. De ahí que actualmente resulte imprescindible aprender y servirse de ella como forma de minimizar la probabilidad de cometer errores.
En términos generales podemos afirmar que la Estadística se puede utilizar para mejorar el rendimiento de la vida diaria, ya que es una guía universal frente a la incertidumbre de lo desconocido.

jueves, 26 de abril de 2018

LA MAGNITUD DE LAS ENCUESTAS

Las encuestas son interesantes instrumentos de medición y como tales, cada quien le da el uso que desee. Para evaluar su confiabilidad sugiero tomar en cuenta el tamaño de la muestra, la precisión, el error típico, el grado de confiabilidad, la ubicación geográfica, los costos asociados y el mecanismo ha implementar para la medición.

La necesidad de que en  las investigaciones por muestreo (lo que comúnmente se denomina "Encuesta"), hay que definir varios aspectos a la hora de realizarla.

1.- Establecer el diseño muestral, que es la columna vertebral del estudio.

2.-Precisar las Variables a medir incluyendo los costos.

3.- Los objetivos

4.- Definir conceptualmente el fenómeno a estudiar.

Esta es una disciplina científica, pero  hay quien la considera como una bola de cristal, sin embargo los Estadísticos hacemos un seguimiento del comportamiento del mercado e identificamos los posibles escenarios, por ejemplo, en los estudios políticos o electorales,  se plantean varios escenarios para obtener el porcentaje (%)  en intención de votos de los aspirantes a algún cargo público, además se plantean varios escenarios en la manera como se fueran a distribuir los encuestados que no dicen por quien va a votar.

Siempre debe haber un rigor en el análisis y resultados de las encuestas y no deben estar sesgada por algún tipo de interés, ademas se debe de estudiar con mucho cuidado su metodología que nos permita encontrar razones porque nos lleva a un pronostico determinado, para que luego se pueda leer, interpretar y analizar  los resultados correctamente.

La publicación de las encuestas son relevantes para los habitantes de un país, quienes cada día aspiran a tener mas información y mayor interés por los estudios de opinión, mas allá  de que existan buenas y malas encuestadoras y por otro lado si hay una sociedad que piensa que le mienten tanto los servidores públicos como las instituciones. Por tales razones hay forma de interpretar la realidad y por ende se necesita de instrumentos de medición con calidad y que sean comparables.

Se debe tener unos standares mínimos que permitan que una encuesta sea mas o menos confiables para los ciudadanos de las nuevas y venideras sociedades, que puedan revisar los diferentes estudios de opinión con una credibilidad aceptable.

Es importante resaltar, que los estudios de opinión, independientemente de los resultados que arrojen, desatan lo que le llaman "pasiones" porque en los grupos sociales crea un fervor para las  conversas y discusiones al respecto.

Hay varios mitos sobre las encuestas, uno de ellos es que "las encuestas son manipuladas por quienes la pagan". Si fuera cierto, en vez de contratar a una empresa encuestadora, la persona o grupo podría escribir en una hoja unos datos, gráficas y las presenta. Otro mito es "la encuesta es una fotografía del momento", en países como el nuestro donde hay una hiperinflación exagerada, esa condición cambia diariamente y las encuesta que se hace hoy, y mañana se la hacen a la misma persona y esa respuesta es totalmente diferente, ademas que tratan de justificarse por los errores que cometen en las predicciones, proyecciones y análisis e interpretación de resultados, ya que cuando se hace un estudio por muestreo se supone que se va a inferir sobre algún fenómeno de estudio, para un tiempo determinado. Otro mito es " los instrumentos de medición pueden ser visto como buenos y malos", ya que estos son elaborados a petición del cliente y no para ser divulgado en medios de comunicación para resaltar unas pocas características que se quieren que se resalten,las mismas deben de tener un rigor técnico y que sean confiable.

Para culminar, ofrezco un esquema de como puede realizarse una investigación por muestreo:


  • Plantear los Objetivos y finalidades
  • Terminología y conceptos. Medidas estadísticas a utilizar
  • Cuestionarios  ( se diseñan conforme a los objetivos del estudio y el periodo de investigación)
  • Universo de estudio
  • Diseño, tamaño y selección de las muestras
    • Encuesta previa o piloto
    • Encuesta definitiva
  • Costos asociados a la investigación
  • Periodo y tipo de observación
  • Levantamiento de las encuestas
  • Calculo de errores de muestreo-Inferencia sobre los resultados muestrales
  • Tabulación y análisis de resultados

Fredy Zavarce
Estadístico -UCV
Especialista en Finanzas-UCV
Profesor del Post grado UCV
Profesor de UCV-CUFM
Cátedras: Estadística - Matemáticas y
Modelos Cuantitativos
correo: zavafree@gmail.com


lunes, 23 de abril de 2018

Tipos de preguntas mas frecuentes en los cuestionarios




La encuesta es quizás el instrumento más conocido y utilizado para recolectar información por los investigadores sociales, cuando se quiere lograr precisión y representatividad, para acceder a la conclusión sobre la existencia de regularidades de estructuras sociales y sobre los sujetos insertos en ellas, es importante resaltar que las preguntas de la encuesta tienen que ir ligadas o asociadas a los objetivos generales y específicos de una investigación proyecto.  Aunque los antecedentes de la encuesta nos remiten a los estudios de John Sinclair (Informe Estadístico de Escocia, 1791-1825), James Kay Shuttleworth (Las condiciones morales y físicas de la vida de los obrero de la industria textil en Manchester, 1832) y Charles Booth (Vida y trabajo de los habitantes de Londres, 1889-1891) no será hasta después de la Segunda Guerra Mundial cuando la encuesta empiece a ser la técnica predominante gracias a estudios del mercado estadounidense de carácter privado como los de Gallup, Crossley y Ropper, en Venezuela hay muchas encuestadora entre ellas están Datanalisis,  Datincorp, IVAD, Venebarómetro, Hinterlcae, etc. Conceptualmente la encuesta puede considerarse como una técnica o una estrategia entendida como un conjunto de procesos necesarios para obtener información de una población realizada  a una muestra representativa. La información se recoge de forma estructurada formulando  preguntas y en el mismo orden a cada uno de los encuestados.  Evitar preguntas que puedan incitar determinadas respuestas.

Los criterios básicos de formulación de preguntas, que no son otra cosa que aplicar el sentido común al entendimiento de un contenido, como son:
a.- Claridad en las preguntas y utilizar un lenguaje sencillo. Para ello hay que evitar tanto el uso de vocablos extranjeros y de palabras ambiguas (p.ej. e-learning, progresista, conservador, alineación, chavista... ) como mezclar dos atributos en una misma pregunta ya que con ello el entrevistado no podría separar una respuesta de otra.
P.ej. ¿cree usted que el envase y la calidad de este producto son buenos?.

b.- Facilitar la memoria. Las preguntas deben referirse siempre al pasado más inmediato.

c.- Evitar la realización de cálculos. En los casos en los que sea necesario es preferible recurrir a promedios más que a cifras muy concretas.

d.- Evitar preguntas que puedan incitar determinadas respuestas
e.- Preguntas lo más cortas posibles.

f.- Proporcionar respuestas flexibles y “cómodas” para el entrevistado. Sobre todo en las preguntas más comprometidas o susceptibles de ser contestadas con ciertas reservas conviene preguntar de forma indirecta o de forma aproximada.

 Por. ej.
¿Que edad tiene Ud.? ____________
¿Trabaja en el Gobierno? ______¿Cuál es su ingreso mensual?__________

Estos son los principales tipos de preguntas:

1.- Cerradas: son aquellas preguntas que tienen dos alternativas, también pueden denominarse dicótomas

Ej. El producto "X" tiene un buen precio:   SI __    NO____



2.- Múltiple: Son aquellas que pueden tener varias opciones para responder


Ej: De los  jugos que vende la cantina de la Universidad cuales tienen mejor sabor:

a. Fresa___   b. Durazno___    c. Mango_____    d. Patilla____ e. Lechoza____ f. Guanabana ____


3.- Escala de Lickert: es aquella que se determina por el acuerdo o no de un producto o un servicio


Ej. El servicio de la cantina de la Universidad mantiene la calidad?

a.Muy de acuerdo___ b. De acuerdo___  c. Poco de acuerdo ___   d.- Nada de acuerdo


4.-De gusto: son aquellas preguntas que se dirigen a conocer el gusto del consumidor

Ej. Con respecto al almuerzo que prepara la cantina de la universidad que opinas:

a. Me gusta Mucho __
b. Me gusta __
c. Me gusta poco __
d. No me gusta __



5.-Clasificación: Con esta pregunta le damos una importancia al producto o al servicio

Ej- El servicio medico que ofrece la Universidad es:


|----------------------------|----------------------|--------------------|---------------------------|
      Muy Importante         Importante           Poco Importante    Nadada Importante 




6.-Jerarquía.  Con esta pregunta se jerarquiza de mayor a menor el servicio o producto a considerar

Ej. De los servicios que ofrece la Universidad cuales según su criterio  son mas necesarios para el estudiante.  (Enumere del 1 al 7 )

a. Comedor___      b. Servicio médico___  c. Biblioteca___                                           

d.Sala de Computación ___ e. Orientación___ f. Gimnasio____     g. Cultura___



7.- De Control: Esta pregunta hace énfasis en chequear la veracidad del encuestado, si esta falseando la información q esta dando.

Ej. Como se enteró del Servicio Medico de la Universidad

a. Prensa___ b.Radio___ c. Internet___ d. Otro____(Especifique)_______________

Aquí podemos resaltar que si el servicio médico no tiene publicidad en ningún medio, el encuestado esta mintiendo, así que es de suponer que no es confiable.



8.- Rango: estas son las preguntas mas difíciles y complicadas de conseguir respuestas, porque tocan la susceptibilidades del encuestado

Ej. Puede indicarme el ingreso mensual en bs.

para conseguir una respuesta hay que ofrecer un  rangos


a.     Bs 1000,0------------Bs. 1500,0

b.     Bs. 1500,1----------  Bs. 2000,0

c.     Bs. 2000,1------------Bs. 2500,0

d.    Bs. 2500,1------------Bs. 3000,0

e.    Bs. mayor a Bs 3000,0




9. Carita feliz: Son aquellas asociados a la motivación de la persona por el producto y/o servicio

Ej. Como considera Ud. la calidad de los Docentes en la Universidad

                     😀___😃__😊__😕__😦__😯__😲__😶__😤__😣__




10.- Abiertas: Son aquella que se le pide la opinión al encuestado

Ej. Que opina Ud. de los salones de clases  de la Universidad?__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________


Elaborado Por:
Fredy Zavarce
Estadístico - UCV
Especialista en Finanzas- UCV
Profesor de la Cátedra: Modelos Cuantitativos en Finanzas
FACES-UCV
Profesor del Colegio Universitario Francisco de Miranda-
Cátedras Estadística y Matemáticas