Distribución T de Student
| ||
= Z \sqrt{ \frac{\nu\ }{V} }</math>
donde
- Z es una variable aleatoria distribuida según una normal típica (de media nula y varianza 1).
- V es una variable continua que sigue una distribución χ² con <math> \nu\ </math> grados de libertad.
- Z y V son independientes
Si μ es una constante no nula, el cociente <math> \frac{Z+\mu}{\sqrt{V/\nu\ }} </math> es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad <math>\mu</math>.
Sumario
Aparición y especificaciones de la distribución t de Student
Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media μ y varianza σ2. Sea
- <math>\overline{X}_n=(X_1+\cdots+X_n)/n</math>
la media muestral. Entonces
- <math>Z=\frac{\overline{X}_n-\mu}{\sigma/\sqrt{n}}</math>
sigue una distribución normal de media 0 y varianza 1.
Sin embargo, dado que la desviación estándar no siempre es conocida de antemano, Gosset estudió un cociente relacionado,
- <math>T=\frac{\overline{X}_n-\mu}{S_n/\sqrt{n}},</math>
- <math>S ^ 2(x) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x}) ^ 2 </math>
es la cuasivarianza muestral y demostró que la función de densidad de T es
- <math>f(t) = \frac{\Gamma((\nu+1)/2)}{\sqrt{\nu\pi\,}\,\Gamma(\nu/2)} (1+t^2/\nu)^{-(\nu+1)/2}</math>
donde <math> \nu\ </math> es igual a n − 1.
La distribución de T se llama ahora la distribución-t de Student.
El parámetro <math> \nu\ </math> representa el número de grados de libertad. La distribución depende de <math> \nu\ </math>, pero no de <math>\mu</math> o <math>\sigma</math>, lo cual es muy importante en la práctica.
Intervalos de confianza derivados de la distribución t de Student
El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media: <math> \overline X = \frac{S}{\sqrt{n}} </math>, siendo entonces el intervalo de confianza para la media: <math> \overline{X} = \pm t_{\alpha/2,n-1} \frac{S}{\sqrt{n}} </math> .
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.
Para efectos prácticos el valor esperado y la varianza son:
<math> E(t(n))= 0</math> y <math>Var (t(n-1)) = n/(n-2)</math> para <math> n > 2 </math>
Historia
La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica de cerveza, Guinness, que prohibía a sus empleados la publicación de artículos científicos debido a una difusión previa de secretos industriales. De ahí que Gosset publicase sus resultados bajo el seudónimo de Student.[1]
Distribución t de Student no estandarizada
La distribución t puede generalizarse a 3 parámetros, introduciendo un parámero locacional <math>\mu</math> y otro de escala <math>\sigma</math>. El resultado es una distribución t de Student no estandarizada cuya densidad está definida por:[2]
- <math>p(x|\nu,\mu,\sigma) = \frac{\Gamma(\frac{\nu + 1}{2})}{\Gamma(\frac{\nu}{2})\sqrt{\pi\nu}\sigma} \left(1+\frac{1}{\nu}\left(\frac{x-\mu}{\sigma}\right)^2\right)^{-\frac{\nu+1}{2}} </math>
Equivalentemente, puede escribirse en términos de <math>\sigma^2</math> (correspondiente a la varianza en vez de a la desviación estándar):
- <math>p(x|\nu,\mu,\sigma^2) = \frac{\Gamma(\frac{\nu + 1}{2})}{\Gamma(\frac{\nu}{2})\sqrt{\pi\nu\sigma^2}} \left(1+\frac{1}{\nu}\frac{(x-\mu)^2}{\sigma^2}\right)^{-\frac{\nu+1}{2}} </math>
Otras propiedades de esta versión de la distribución t son:[2]
- <math>
\begin{align} \operatorname{E}(X) &= \mu \quad \quad \quad \text{para }\,\nu > 1 ,\\ \text{Var}(X) &= \sigma^2\frac{\nu}{\nu-2}\, \quad \text{para }\,\nu > 2 ,\\ \text{Moda}(X) &= \mu . \end{align} </math>
Referencias
Enlaces externos
- Tabla de distribución de T de Student
- Prueba t de Student en la UPTC de Colombia
- Tabla distribución t de Student
- Distribución t-Student: Puntos porcentuales para probabilidad superior
- Probability, Statistics and Estimation en inglés. Primeros Studentes en la página 112.
- [1] Calcular la probabilidad de una distribución t-Student con R (lenguaje de programación)