Tamaño de Muestra

Tamaño de Muestra
Información sobre la plantilla
Estadística aplicada.jpg
Concepto:Cantidad de unidades muéstrales a seleccionar para hacer un experimento.

Tamaño de Muestra. Es la cantidad de unidades muéstrales a seleccionar para hacer un experimento.

Definición

En la selección de la muestra se debe tener en cuenta que las porciones, individuos, plantas o animales, que constituyen la misma, deben ser tomados, siempre que sea posible, de forma aleatoria, es decir al azar, de modo que se garantice que cualquier miembro de la población, indiferentemente y con igual probabilidad, pueda formar parte de la muestra. Esta condición de aleatoriedad es imprescindible, ya que todos los métodos estadísticos han sido desarrollados para aplicarse en muestras al azar y son, por tanto, inútiles en muestras seleccionadas por otros procedimientos.

De la muestra deben eliminarse los individuos que representan una anormalidad o características exageradas que no corresponden con los demás individuos de la población. La selección de las muestras,la forma, el procedimiento que se va a emplear para la eliminación o no de algún sujeto, etc., es una labor de suma responsabilidad y siempreque sea posible se debe considerar valoraciones de un equipo multidisciplinario, es decir, está decisión no es solo estadística, un valor que desde el punto de vista estadístico parezca estar muy desviado del resto de los resultados puede ser una ocurrencia normal del proceso experimental.

¿Qué tamaño de muestra tomar?

Es una pregunta indispensable en toda investigación, también puede formularse como ¿Qué tamaño de muestra se necesita para llegar a un determinado objetivo experimental?, este objetivo puede ser estimar el comportamiento promedio de una variable, estimar con que probabilidad (proporción) ocurre un proceso, entre otros. Lo más importante para responder esta interrogante es tener bien claro el objetivo que se persigue, y una idea más o menos precisa de la dispersión de los datos. Las fórmulas para el cálculo del tamaño de muestra están descritas en la literatura de forma dispersa, por ello, se muestran en este trabajo para facilitarle el trabajo al investigador.

Conceptos básicos

Población

El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes. "Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". (Levin y Rubin, 1996). "Una población es un conjunto de elementos que presentan una característica común". (Cadenas, 1974).

Ejemplo:

-Todas las plantas de un campo de frijol.

-Todos las personas que habitan en la provincia Mayabeque, Cuba.

Muestra

Se llama muestra a una parte de la población a estudiar y que sirve para representarla (Spiegel, 1991). "Una muestra es una colección de algunos elementos de la población, pero no de todos". (Levin y Rubin, 1996). "Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", (Cadenas, 1974).

Ejemplo: Se encuestaron 350 personas de la Provincia Mayabeque.

El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo. Pero, la muestra seleccionada debe ser representativa, adecuada y valida. Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población. Una muestra adecuada y valida se refiere a que la muestra debe ser obtenida de tal manera que permita establecer un mínimo de error posible respecto de la población. Para que una muestra sea fiable, es necesario que su tamaño sea obtenido mediante procesos matemáticos que eliminen la incidencia del error. Los expertos en estadística utilizan la información de la muestra para hacer inferencias sobre la población que esta representa. En consecuencia muestra y población son conceptos relativos. Una población es un todo y una muestra es una fracción o segmento de ese todo.

Experimento

Tiene dos acepciones, una general y una particular. La regla general se refiere a "tomar una acción" y después observar las consecuencias. Se requiere la manipulación intencional de una acción para analizar sus posibles efectos y la aceptación particular (sentido científico) "Un estudio de investigación en el que se manipulan deliberadamente una o más variables independientes (supuestas efectos), dentro de una situación de control para el investigador".

Por ejemplo se desea conocer el efecto de un tratamiento sobre el crecimiento de las plantas, entonces se realiza un experimento donde de dos parcelas “similares” en una se aplica el tratamiento y en la otra no. En cada parcela se miden antes de aplicar el tratamiento 50 plantas seleccionadas al azar y al cabo del tiempo en que el tratamiento debe hacer efectos se miden estas 50 plantas para ver su incremento en crecimiento y por consiguiente determinar el efecto del tratamiento.

Parámetro

Son las medidas o datos que se obtienen sobre la población o la muestra. «Parámetro estadístico: número que se obtiene a partir de los datos de una distribución estadística y que sirve para sintetizar alguna característica relevante de la misma.». (Encarta, 2009) «Parámetro (en estadística): Cierta cantidad que caracteriza de alguna forma a la población, como su media o su mediana» (Clapham, 1998) «En estadística descriptiva tenemos una serie de expresiones que permiten disponer de unos valores numéricos que reflejan el comportamiento global del suceso estadístico, calculados a partir de los datos individuales. Estas expresiones son los parámetros estadísticos» (Serret, 1998). Un parámetro estadístico es una medida poblacional. Este enfoque es el tradicional de la estadística descriptiva. En este sentido, su acepción se acerca a la de medida o valor que se compara con otros, tomando una unidad de una determinada magnitud como referencia. Por su parte, la facción más formal de la estadística, la estadística matemática y también la inferencia estadística utilizan el concepto de parámetro en su acepción matemática más pura, esto es, como variable que define una familia de objetos matemáticos en determinados modelos.

Así se habla, por ejemplo, de una distribución normal de parámetros μ y σ como de una determinada familia de distribuciones con una distribución de probabilidad de expresión conocida, en la que tales parámetros definen aspectos concretos como la esperanza, la varianza, la curtosis, etc. Otro ejemplo común en este sentido es el de la distribución de Poisson, determinada por un parámetro, λ; o la distribución binomial, determinada por dos parámetros, n y p. Desde el punto de vista de la estadística matemática, el hecho de que estas distribuciones describan situaciones reales y los citados parámetros signifiquen un resumen de determinado conjunto de datos es indiferente.

Estadístico

Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros. En estadística un estadístico (muestral) es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo de estimar o inferir características de una población o modelo estadístico. Así por ejemplo, la media, la mediana, la moda son estadísticos de una muestra. Si se tiene una muestra estadística de valores para una variable aleatoria X con distribución de probabilidad F(x,θ) (donde θ es un conjunto de parámetros de la distribución) se define la media muestral n-ésima como: Media_Muestral.png

Error experimental

Conocido también como Error Muestral, de estimación o estándar. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo.

Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían de muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.

Nivel de Confianza

Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.

El nivel de confianza se indica por 1-α y habitualmente se da en porcentaje (1-α) %. Hablamos de nivel de confianza y no de probabilidad (la probabilidad implica eventos aleatorios). Si repetimos el proceso con muchas medias muéstrales podríamos afirmar que el (1-α) % de los intervalos así construidos contendría al verdadero valor del parámetro. Los valores que se suelen utilizar para el nivel de confianza son el 90%, 95%, 99% y 99,9%. En las fórmulas de tamaño de muestra se suele utilizar el percentil 1- a/2 de la distribución normal, así para a=0,05 1- a/2 toma valor 0,975.

Varianza poblacional

Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

Si se tiene una muestra estadística de valores para una variable aleatoria X con distribución de probabilidad F(x,θ) (donde θ es un conjunto de parámetros de la distribución) se define la varianza muestral a:

Fórmulas

Población infinita

El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos. En ocasiones la población es finita pero tienen un tamaño desconocido, entonces se trata como si fuera infinita. Para tomar una muestra en una población de este tipo se aplica la fórmula:

Donde Z es Z1-a/2 percentil 1- a/2 de la distribución normal para un nivel a de significación, según la tabla de percentiles:


    1- a/2
       
    0.90
       
    0.95
       
    0.975
       
    0.99
       
    0.995
       
    0.999
       
    0.9995
           
    Z1-a/2
       
    1.282
       
    1.645
       
    1.96
       
    2.326
       
    2.576
       
    3.090
       
    3.291
        
    Siendo a 0,05 Z toma valor 1.96. 

En la fórmula, p denota la probabilidad con que ocurre un suceso, es decir si queremos probar que la muestra tiene media X, la probabilidad con que esto ocurre puede tomarse como 0,50, lo cual indica que es igualmente probable que ocurra como que no. q=1-p.

Ejemplo: Se desea estimar la densidad promedio de ácaros que hay en un campo de frijol, se desconoce la cantidad de plantas que tiene el campo y se asume un error 0,10 de equivocarse en la estimación.

Lo cual indica que se deben muestrear 96 plantas. La forma en que deben ser tomadas dependerá del diseño que se elija de acuerdo con las condiciones del campo.

Población Finita

Una población finita es aquella que está formada por un limitado número de elementos, por ejemplo; el número de personas que habita en un determinado municipio.

Ejemplo: Supongamos que se desea conocer cuantas plantas hay que tomar de un total de 600 para tener una información adecuada de la densidad de una plaga con error estándar menor del 3% y 95 % de confiabilidad.

Según la fórmula se deben muestrear 384 plantas, si le resulta imposible puede sacrificar el error subiéndolo a 5%, 10%, 15% o hasta 25% teniendo en cuenta que si la distribución de la población a medir es agregada el muestreo no debe ser completamente al azar porque puede tener una idea errónea de la densidad poblacional subestimándola, es mejor tomar plantas con síntomas y sin síntomas tratando de monitorear el mayor numero de parches sintomáticos.

Estimar una proporción

En este caso se desea conocer con que probabilidad ocurre determinado fenómeno, entonces la fórmula para calcular el tamaño de muestra mínimo para tener una estimación adecuada de dicha probabilidad es:

P. Es la proporción esperada (0.90 por ejemplo) d Es el error máximo permisible, esto es la cantidad mínima que aceptamos que el valor real se aleje del esperado sin resultar un error significativo.

Por ejemplo, se desea conocer qué cantidad de pollos habría que pesar para determinar que más del 90% aumenta de peso al ingerir una determinada dieta (Hipótesis nula H0: P=0.90 y Hipótesis alternativa H1: P>0.90), en este o en casos similares, se decide el erro máximo permisible, por ejemplo 0.10, y se calcula:

Se deben pesar 43 pollos.

Comparar dos proporciones

Cuando en lugar de estimar una proporción se comparan dos proporciones (H0: P1=P2 y H1: P1¹P2), se emplea la fórmula:

Siendo a el nivel de confianza o significación también conocido como error de primer tipo (rechazar H0 siendo verdadera) y b el error de segundo tipo (aceptar H0 siendo falsa). Cuando las proporciones a comparar son pequeñas (del orden 10-3 o inferiores), se emplea la fórmula:

Estimar una media

La fórmula más empleada es la que se utiliza para estimar la media de una población con varianza S2 y un error máximo permisible d:

Es similar a la fórmula para estimar media de una población finita pero ahora se conoce la varianza de la variable que se analiza.

Comparar una media con un valor

Si nuestro objetivo es probar la hipótesis Ho µ=µ0 se empleará la fórmula:

Comparar dos medias

Esto, puede extenderse a la prueba H0 : µ1=µ2 entonces se emplea la fórmula:

Comparar medias provenientes de a grupos

Si nuestro objetivo es comparar las medias de a grupos, se empleará la fórmula:

S2: varianza d: Error máximo permisible a: Nivel de significación b 2(1-P) Probabilidad de una diferencia sea encontrada significativa. y valores de la tabla T de students. n0 : n inicial conocida.

Realizar análisis de regresión

Para realizar un análisis de regresión en el cual se quiere que la correlación sea elevada, se debe tomar una n tal que:

r. coeficiente de correlación estimado.

Fuentes