SPSS

Revisión del 16:21 23 sep 2011 de Antonio jc.vcl (discusión | contribuciones) (Página creada con '{{Desarrollo}} {{Ficha Software |nombre=Statistical Package for the Social Sciences (SPSS) |familia= |imagen= |tamaño= |descripción= |imagen2= |tamaño2= |descripción...')
Statistical Package for the Social Sciences (SPSS)
Información sobre la plantilla
GéneroPrograma estadístico
Sistemas Operativos compatiblesWindows, Linux

Statistical Package for the Social Sciences (SPSS). [[Paquete

estadístico|programa estadístico]] informático muy usado en las

ciencias sociales y las empresas de investigación de mercado. En la

actualidad, la sigla se usa tanto para designar el programa estadístico

como la empresa que lo produce. Originalmente SPSS fue creado como el

acrónimo de Statistical Package for the Social Sciences aunque

también se ha referido como "Statistical Product and Service Solutions"

(Pardo, A., & Ruiz, M.A., 2002, p. 3).

Como programa estadístico es muy popular su uso debido a la capacidad

de trabajar con bases de datos de gran tamaño. En la versión 12 es de 2

millones de registros y 250.000 variables. Además, de permitir la

recodificación de las variables y registros según las necesidades del

usuario. El programa consiste en un módulo base y módulos anexos que se

han ido actualizando constantemente con nuevos procedimientos

estadísticos. Cada uno de estos módulos se compra por separado.

Actualmente, compite no sólo con softwares licenciados como lo son SAS,

MATLAB, Statistica, Stata, sino también con software de

código abierto y libre, de los cuales el más destacado es el [[Lenguaje

R]]. Recientemente ha sido desarrollado un paquete libre llamado

PSPP, con una interfaz llamada PSPPire que ha sido compilada

para diversos sistemas operativos como Linux, además de versiones

para Windows y OS X. Este último paquete pretende ser un clon

de código abierto que emule todas las posibilidades del SPSS.

Historia

Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale

H. Bent. Entre 1969 y 1975 la Universidad de Chicago por

medio de su National Opinion Research Center estuvo a cargo del

desarrollo, distribución y venta del programa. A partir de 1975

corresponde a SPSS Inc.

Originalmente el programa fue creado para grandes computadores. En

1970 se publica el primer manual de usuario del SPSS por Nie y

Hall. Este manual populariza el programa entre las instituciones de

educación superior en EE. UU. En 1984 sale la primera versión

para computadores personales.

Desde la versión 14, pero más específicamente desde la versión 15 se ha

implantado la posibilidad de hacer uso de las librerías de objetos del

SPSS desde diversos lenguajes de programación. Aunque principalmente se

ha implementado para Python, también existe la posibilidad de

trabajar desde Visual Basic, C++ y otros lenguajes.

El 28 de junio de 2009 se anuncia que IBM, meses después de

ver frustrado su intento de compra de Sun Microsystems, adquiere

SPSS, por 1.200 millones de

dólares.[1]

Versiones del SPSS

SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del

que han aparecido las siguientes versiones:

  • SPSS-X (para grandes servidores tipo UNIX)
  • SPSS/PC (1984, en DOS. Primera versión para computador portátil)
  • SPSS/PC+ (1986 (en DOS)
  • SPSS for Windows 6 (1992) / 6.1 para Macintosh
  • SPSS for Windows 10 / for Macintosh 10 (2000)
  • SPSS for Windows 11 (2001) / for Mac OS X 11(2002)
  • SPSS for Windows 13 (2004): Permite por primera vez trabajar con

múltiples bases de datos al mismo tiempo.

  • SPSS for Windows 16 (Octubre de 2007): En la lista de usuarios de

SPSS "SPSSX (r) Discussion [SPSSX-L@LISTSERV. UGA. EDU]" varios

funcionarios de la empresa anunciaron previamente la salida de la

versión 16 de este software. En ella se incorporó una interfaz basada

en Java que permite realizar algunas

mejoras en las facilidades de uso del sistema.

  • SPSS for Windows 17 (2008): Incorpora aportes importantes como el

ser multilenguaje, pudiendo cambiar de idioma en las opciones siempre

que queramos. También incluye modificaciones en el editor de sintaxis

de forma tal que resalta las palabras claves y comandos, haciendo

sugerencias mientras se escribe. En este sentido se aproxima a los

sistemas IDE que se utilizan en programación.

  • SPSS for Windows 18 (2009): Cambia su denominación de SPSS por

PASW 18.

  • IBM SPSS Statistics 19.0 (2010)

Módulos del SPSS

El sistema de módulos de SPSS, como los de otros programas (similar al

de algunos lenguajes de programación) provee toda una serie de

capacidades adicionales a las existentes en el sistema base. Algunos de

los módulos disponibles son:

  • Modelos de Regresión
  • Modelos Avanzados
    • Reducción de datos: Permite crear variables sintéticas a

partir de variables colineales por medio del Análisis Factorial.

    • Clasificación: Permite realizar agrupaciones de observaciones

o de variables (cluster analysis) mediante tres algoritmos

distintos.

    • Pruebas no paramétricas: Permite realizar distintas pruebas

estadísticas especializadas en distribuciones no normales.

  • Tablas: Permite al usuario dar un formato especial a las

salidas de los datos para su uso posterior. Existe una cierta tendencia

dentro de los usuarios y de los desarrolladores del software por dejar

de lado el sistema original de TABLES para hacer uso más extensivo de

las llamadas CUSTOM TABLES.

  • Tendencias
  • Categorías: Permite realizar análisis multivariados de

variables normalmente categorías. También se pueden usar variables

métricas siempre que se realice el proceso de recodificación adecuado

de las mismas.

análisis de datos recogidos para este tipo específico de pruebas

estadísticas.

  • Mapas: Permite la representación geográfica de la información

contenida en un fichero (descontinuado para SPSS 16).

  • Pruebas Exactas: permite realizar pruebas estadísticas en

muestras pequeñas.

  • Análisis de Valores Perdidos: Regresión simple basada en

imputaciones sobre los valores ausentes.

  • Muestras Complejas: permite trabajar para la creación de

muestras estratificadas, por conglomerados u otros tipos de muestras.

  • SamplePower (cálculo de tamaños muestrales)
  • Árboles de Clasificación: Permite formular árboles de

clasificación y/o decisión con lo cual se puede identificar la

conformación de grupos y predecir la conducta de sus miembros.

  • Validación de Datos: Permite al usuario realizar revisiones

lógicas de la información contenida en un fichero ".sav" y obtener

reportes de los valores considerados atípicos. Es similar al uso de

sintaxis o scripts para realizar revisiones de los ficheros. De la

misma forma que estos mecanismos es posterior a la digitalización de

los datos.

  • SPSS Programmability Extension (SPSS 14 en adelante). Permite

utilizar el lenguaje de programación Python para un mejor control

de diversos procesos dentro del programa que hasta ahora eran

realizados principalmente mediante scripts (con el lenguaje SAX Basic).

Existe también la posibilidad de usar las tecnologías .NET de

Microsoft para hacer uso de las librerías del SPSS. Aunque algunos

usuarios han cuestionado sobre la necesidad de incluir otros lenguajes,

la empresa no tiene esto entre sus objetivos inmediatos.

Desde el SPSS/PC hay una versión adjunta denomina SPSS Student

que es un programa completo de la versión correspondiente pero limitada

en su capacidad en cuanto al número de registros y variables que puede

procesar. Esta versión es para fines de enseñanza del manejo del

programa

Manejo

SPSS tiene un sistema de ficheros en el cual el principal son los

archivos de datos (extensión. SAV). Aparte de este tipo existen otros

dos tipos de uso frecuente:

  • Archivos de salida (output, extensión. SPO): en estos se despliega

toda la información de manipulación de los datos que realizan los

usuarios mediante las ventanas de comandos. Son susceptibles de ser

exportados con varios formatos (originalmente HTML, RTF o TXT,

actualmente la versión 15 incorpora la exportación a PDF junto a los

formatos XLS y DOC que ya se encontraban en la versión 12)

  • Archivos de sintaxis (extensión. SPS): Casi todas las ventanas de

SPSS cuentan con un botón que permite hacer el pegado del proceso que

el usuario desea realizar. Lo anterior genera un archivo de sintaxis

donde se van guardando todas las instrucciones que llevan a cabo los

comandos del SPSS. Este archivo es susceptible de ser modificado por el

usuario. Muchos de los primeros usuarios del SPSS suelen escribir estos

archivos en vez de utilizar el sistema de pegado del programa.

Existe un tercer tipo de fichero: el fichero de scripts (extensión.

SBS). Este fichero es utilizado por los usuarios más avanzados del

software para generar rutinas que permiten automatizar procesos muy

largos y/o complejos. Muchos de estos procesos suelen no ser parte de

las salidas estándar de los comandos del SPSS, aunque parten de estas

salidas. Buena parte de la funcionalidad de los archivos de scripts ha

sido ahora asumida por la inserción del lenguaje de programación Python

en las rutinas de sintax del SPSS. Procedimientos que antes solo se

podían realizar mediante scripts ahora se pueden hacer desde el sintax

mismo.

El programa cuando se instala trae un determinado número de ejemplos o

utilidades de casi todos los ficheros en cuestión. Estos son usados

para ilustrar algunos de los ejemplos de uso del programa.

Fichero de datos de SPSS

Los ficheros de datos en formato SPSS tienen en Windows la extensión.

SAV. Al abrir un fichero de datos con el SPSS, vemos la vista de datos,

una tabla en la que las filas indican los casos y las columnas las

variables. Cada celda corresponde al valor que una determinada variable

adopta en un cierto caso.

Además de esta vista de datos, en las últimas versiones del programa

existe una vista de variables en la que se describen las

características de cada una. En esta vista las filas corresponden a

cada variable y las columnas nos permiten acceder a sus

características:

  • Nombre, limitado a 8 caracteres.
  • Tipo de variable (compárese este listado de opciones con los tipos de

variables estadísticas existentes)

    • Numérico, número en formato estándar)
    • Coma decimal, número con comas cada tres posiciones y con un punto

como delimitador de los decimales

    • Punto decimal, número con puntos cada tres posiciones y con una coma

como límite delimitador de los decimales.

    • Notación científica, número que se expresa con un formato tal que se

sigue de una E y un número que expresa la potencia de 10 a la que se

multiplica la parte numérica previa

    • Fecha
    • Moneda dólar, formato numérico con el que se expresan cantidades en

dólares

    • Moneda del usuario, formato numérico con el que se expresan

cantidades en la moneda definida en la pestaña de monedas del cuadro de

diálogo "Opciones"

    • Cadena de caracteres o variable alfanumérica
  • Tamaño total
  • Tamaño de la parte decimal
  • Etiqueta de la variable
  • Etiquetas para los valores
  • Valores perdidos
  • Espacio que ocupa en la vista de datos
  • Alineación de la variable en la vista de datos
  • Escala de medición.

Algunos usuarios pasan por alto las características de las variables

cuando se trabaja en la base de datos. Sin embargo, cuando se utilizan

scripts o Python las características de las variables pueden tomar gran

relevancia en la construcción de procedimientos ad-hoc.

Fichero de sintaxis de SPSS

Se pueden generar estos archivos de sintaxis con la ayuda del programa

mismo, pues en casi todas las ventanas donde se realizan tareas en el

SPSS existe un botón "Pegar". Este botón cierra la ventana en cuestión

y guarda la sintaxis de las acciones seleccionadas en dicha ventana.

Una vez salvado este archivo es susceptible de modificación.

La sintaxis tal cual se presenta a continuación fue producida

directamente con el SPSS. Este programa le da un formato legible a la

sintaxis, formato que el software en algunos casos no requiere para su

correcto uso.

Otra peculiaridad de las sintaxis del SPSS es que no son "case

sensitive". Ante lo cual es común ver sintaxis escritas solo en

mayúsculas, solo en minúsculas o bien una combinación propia de cada

usuario. Esta situación se modifica para aquellas personas que hacen

uso de Python dentro de sus sintaxis, pues éste es un lenguaje

sensitivo a las variaciones entre mayúsculas y minúsculas. Esto obliga

a estos usuarios a escribir sintaxis con mayor cuidado.

El siguiente ejemplo ilustra como abrir un fichero de datos mediante

sintaxis y como llevar a cabo una frecuencia y una tabla de

contingencia con datos de uno de los archivos de ejemplo que instala el

programa.

  • Este es un comentario, debe ir precedido por un asterisco y finalizado

por un punto.

Plantilla:Sistema

Véase también

Enlaces externos

incluye una base de datos de soluciones (Puedes logearte usando "guest"

como Usuario y Password)

de archivos para programadores de SPSS (FAQ, command syntax;

macros; scripts; python)

Discussion] - SPSS Listserv activa desde 1996. Discusses

programming, statistics and analysis

learn SPSS] - Recursos para aprender SPSS

Reports] - El Reporte 1 compara Stata, SAS y SPSS con R ([[Lenguaje

R|R]] es un lenguaje y ambiente de trabajo para cálculo estadístico y

graficación).

Using SPSS For Data Analysis] - Tutorial del SPSS elaborado en Harvard

Fuentes

para desarrolladores de aplicaciones usando SPSS, incluye materiales y

ejemplos de Python programmability feature

estadísticos del SPSS

preguntas del SPSS

expertos en el uso del SPSS en el mundo

comp.soft-sys.stat.spss] - SPSS Usenet newsgroup via [[Google

Groups]]

(Inglés)

un software libre que se puede utilizar en lugar del SPSS