Distribución T de Student

Plantilla:Ficha de distribución de probabilidad = Z \sqrt{ \frac{\nu\ }{V} }</math>

donde

Si μ es una constante no nula, el cociente <math> \frac{Z+\mu}{\sqrt{V/\nu\ }} </math> es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad <math>\mu</math>.

Aparición y especificaciones de la distribución t de Student

Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media μ y varianza σ2. Sea

<math>\overline{X}_n=(X_1+\cdots+X_n)/n</math>

la media muestral. Entonces

<math>Z=\frac{\overline{X}_n-\mu}{\sigma/\sqrt{n}}</math>

sigue una distribución normal de media 0 y varianza 1.

Sin embargo, dado que la desviación estándar no siempre es conocida de antemano, Gosset estudió un cociente relacionado,

<math>T=\frac{\overline{X}_n-\mu}{S_n/\sqrt{n}},</math>


<math>S ^ 2(x) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x}) ^ 2 </math>

es la cuasivarianza muestral y demostró que la función de densidad de T es

<math>f(t) = \frac{\Gamma((\nu+1)/2)}{\sqrt{\nu\pi\,}\,\Gamma(\nu/2)} (1+t^2/\nu)^{-(\nu+1)/2}</math>

donde <math> \nu\ </math> es igual a n − 1.

La distribución de T se llama ahora la distribución-t de Student.

El parámetro <math> \nu\ </math> representa el número de grados de libertad. La distribución depende de <math> \nu\ </math>, pero no de <math>\mu</math> o <math>\sigma</math>, lo cual es muy importante en la práctica.

Intervalos de confianza derivados de la distribución t de Student

El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media: <math> \overline X = \frac{S}{\sqrt{n}} </math>, siendo entonces el intervalo de confianza para la media: <math> \overline{X} = \pm t_{\alpha/2,n-1} \frac{S}{\sqrt{n}} </math> .

Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.

Para efectos prácticos el valor esperado y la varianza son:

<math> E(t(n))= 0</math> y <math>Var (t(n-1)) = n/(n-2)</math> para <math> n > 2 </math>

Historia

La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica de cerveza, Guinness, que prohibía a sus empleados la publicación de artículos científicos debido a una difusión previa de secretos industriales. De ahí que Gosset publicase sus resultados bajo el seudónimo de Student.[1]

Distribución t de Student no estandarizada

La distribución t puede generalizarse a 3 parámetros, introduciendo un parámero locacional <math>\mu</math> y otro de escala <math>\sigma</math>. El resultado es una distribución t de Student no estandarizada cuya densidad está definida por:[2]

<math>p(x|\nu,\mu,\sigma) = \frac{\Gamma(\frac{\nu + 1}{2})}{\Gamma(\frac{\nu}{2})\sqrt{\pi\nu}\sigma} \left(1+\frac{1}{\nu}\left(\frac{x-\mu}{\sigma}\right)^2\right)^{-\frac{\nu+1}{2}} </math>

Equivalentemente, puede escribirse en términos de <math>\sigma^2</math> (correspondiente a la varianza en vez de a la desviación estándar):

<math>p(x|\nu,\mu,\sigma^2) = \frac{\Gamma(\frac{\nu + 1}{2})}{\Gamma(\frac{\nu}{2})\sqrt{\pi\nu\sigma^2}} \left(1+\frac{1}{\nu}\frac{(x-\mu)^2}{\sigma^2}\right)^{-\frac{\nu+1}{2}} </math>

Otras propiedades de esta versión de la distribución t son:[2]

<math>

\begin{align} \operatorname{E}(X) &= \mu \quad \quad \quad \text{para }\,\nu > 1 ,\\ \text{Var}(X) &= \sigma^2\frac{\nu}{\nu-2}\, \quad \text{para }\,\nu > 2 ,\\ \text{Moda}(X) &= \mu . \end{align} </math>

Referencias

Enlaces externos