SPSS
| ||||||
Statistical Package for the Social Sciences (SPSS). [[Paquete
estadístico|programa estadístico]] informático muy usado en las
ciencias sociales y las empresas de investigación de mercado. En la
actualidad, la sigla se usa tanto para designar el programa estadístico
como la empresa que lo produce. Originalmente SPSS fue creado como el
acrónimo de Statistical Package for the Social Sciences aunque
también se ha referido como "Statistical Product and Service Solutions"
(Pardo, A., & Ruiz, M.A., 2002, p. 3).
Como programa estadístico es muy popular su uso debido a la capacidad
de trabajar con bases de datos de gran tamaño. En la versión 12 es de 2
millones de registros y 250.000 variables. Además, de permitir la
recodificación de las variables y registros según las necesidades del
usuario. El programa consiste en un módulo base y módulos anexos que se
han ido actualizando constantemente con nuevos procedimientos
estadísticos. Cada uno de estos módulos se compra por separado.
Actualmente, compite no sólo con softwares licenciados como lo son SAS,
MATLAB, Statistica, Stata, sino también con software de
código abierto y libre, de los cuales el más destacado es el [[Lenguaje
R]]. Recientemente ha sido desarrollado un paquete libre llamado
PSPP, con una interfaz llamada PSPPire que ha sido compilada
para diversos sistemas operativos como Linux, además de versiones
para Windows y OS X. Este último paquete pretende ser un clon
de código abierto que emule todas las posibilidades del SPSS.
Sumario
Historia
Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale
H. Bent. Entre 1969 y 1975 la Universidad de Chicago por
medio de su National Opinion Research Center estuvo a cargo del
desarrollo, distribución y venta del programa. A partir de 1975
corresponde a SPSS Inc.
Originalmente el programa fue creado para grandes computadores. En
1970 se publica el primer manual de usuario del SPSS por Nie y
Hall. Este manual populariza el programa entre las instituciones de
educación superior en EE. UU. En 1984 sale la primera versión
para computadores personales.
Desde la versión 14, pero más específicamente desde la versión 15 se ha
implantado la posibilidad de hacer uso de las librerías de objetos del
SPSS desde diversos lenguajes de programación. Aunque principalmente se
ha implementado para Python, también existe la posibilidad de
trabajar desde Visual Basic, C++ y otros lenguajes.
El 28 de junio de 2009 se anuncia que IBM, meses después de
ver frustrado su intento de compra de Sun Microsystems, adquiere
SPSS, por 1.200 millones de
dólares.[1]
Versiones del SPSS
SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del
que han aparecido las siguientes versiones:
- SPSS-X (para grandes servidores tipo UNIX)
- SPSS/PC (1984, en DOS. Primera versión para computador portátil)
- SPSS/PC+ (1986 (en DOS)
- SPSS for Windows 6 (1992) / 6.1 para Macintosh
- SPSS for Windows 7
- SPSS for Windows 8
- SPSS for Windows 9
- SPSS for Windows 10 / for Macintosh 10 (2000)
- SPSS for Windows 11 (2001) / for Mac OS X 11(2002)
- SPSS for Windows 11.5 (2002)
- SPSS for Windows 12 (2003)
- SPSS for Windows 13 (2004): Permite por primera vez trabajar con
múltiples bases de datos al mismo tiempo.
- SPSS for Windows 14 (2005)
- SPSS for Macintosh 13 (2006)
- SPSS for Windows 15 (2006)
- SPSS for Windows 16 (Octubre de 2007): En la lista de usuarios de
SPSS "SPSSX (r) Discussion [SPSSX-L@LISTSERV. UGA. EDU]" varios
funcionarios de la empresa anunciaron previamente la salida de la
versión 16 de este software. En ella se incorporó una interfaz basada
en Java que permite realizar algunas
mejoras en las facilidades de uso del sistema.
- SPSS for Macintosh 16
- SPSS for Linux 16
- SPSS for Windows 17 (2008): Incorpora aportes importantes como el
ser multilenguaje, pudiendo cambiar de idioma en las opciones siempre
que queramos. También incluye modificaciones en el editor de sintaxis
de forma tal que resalta las palabras claves y comandos, haciendo
sugerencias mientras se escribe. En este sentido se aproxima a los
sistemas IDE que se utilizan en programación.
- SPSS for Windows 18 (2009): Cambia su denominación de SPSS por
- IBM SPSS Statistics 19.0 (2010)
Módulos del SPSS
El sistema de módulos de SPSS, como los de otros programas (similar al
de algunos lenguajes de programación) provee toda una serie de
capacidades adicionales a las existentes en el sistema base. Algunos de
los módulos disponibles son:
- Modelos de Regresión
- Modelos Avanzados
- Reducción de datos: Permite crear variables sintéticas a
partir de variables colineales por medio del Análisis Factorial.
- Clasificación: Permite realizar agrupaciones de observaciones
o de variables (cluster analysis) mediante tres algoritmos
distintos.
- Pruebas no paramétricas: Permite realizar distintas pruebas
estadísticas especializadas en distribuciones no normales.
- Tablas: Permite al usuario dar un formato especial a las
salidas de los datos para su uso posterior. Existe una cierta tendencia
dentro de los usuarios y de los desarrolladores del software por dejar
de lado el sistema original de TABLES para hacer uso más extensivo de
las llamadas CUSTOM TABLES.
- Tendencias
- Categorías: Permite realizar análisis multivariados de
variables normalmente categorías. También se pueden usar variables
métricas siempre que se realice el proceso de recodificación adecuado
de las mismas.
- Análisis Conjunto: Permite realizar el
análisis de datos recogidos para este tipo específico de pruebas
estadísticas.
- Mapas: Permite la representación geográfica de la información
contenida en un fichero (descontinuado para SPSS 16).
- Pruebas Exactas: permite realizar pruebas estadísticas en
muestras pequeñas.
- Análisis de Valores Perdidos: Regresión simple basada en
imputaciones sobre los valores ausentes.
- Muestras Complejas: permite trabajar para la creación de
muestras estratificadas, por conglomerados u otros tipos de muestras.
- SamplePower (cálculo de tamaños muestrales)
- Árboles de Clasificación: Permite formular árboles de
clasificación y/o decisión con lo cual se puede identificar la
conformación de grupos y predecir la conducta de sus miembros.
- Validación de Datos: Permite al usuario realizar revisiones
lógicas de la información contenida en un fichero ".sav" y obtener
reportes de los valores considerados atípicos. Es similar al uso de
sintaxis o scripts para realizar revisiones de los ficheros. De la
misma forma que estos mecanismos es posterior a la digitalización de
los datos.
- SPSS Programmability Extension (SPSS 14 en adelante). Permite
utilizar el lenguaje de programación Python para un mejor control
de diversos procesos dentro del programa que hasta ahora eran
realizados principalmente mediante scripts (con el lenguaje SAX Basic).
Existe también la posibilidad de usar las tecnologías .NET de
Microsoft para hacer uso de las librerías del SPSS. Aunque algunos
usuarios han cuestionado sobre la necesidad de incluir otros lenguajes,
la empresa no tiene esto entre sus objetivos inmediatos.
Desde el SPSS/PC hay una versión adjunta denomina SPSS Student
que es un programa completo de la versión correspondiente pero limitada
en su capacidad en cuanto al número de registros y variables que puede
procesar. Esta versión es para fines de enseñanza del manejo del
programa
Manejo
SPSS tiene un sistema de ficheros en el cual el principal son los
archivos de datos (extensión. SAV). Aparte de este tipo existen otros
dos tipos de uso frecuente:
- Archivos de salida (output, extensión. SPO): en estos se despliega
toda la información de manipulación de los datos que realizan los
usuarios mediante las ventanas de comandos. Son susceptibles de ser
exportados con varios formatos (originalmente HTML, RTF o TXT,
actualmente la versión 15 incorpora la exportación a PDF junto a los
formatos XLS y DOC que ya se encontraban en la versión 12)
- Archivos de sintaxis (extensión. SPS): Casi todas las ventanas de
SPSS cuentan con un botón que permite hacer el pegado del proceso que
el usuario desea realizar. Lo anterior genera un archivo de sintaxis
donde se van guardando todas las instrucciones que llevan a cabo los
comandos del SPSS. Este archivo es susceptible de ser modificado por el
usuario. Muchos de los primeros usuarios del SPSS suelen escribir estos
archivos en vez de utilizar el sistema de pegado del programa.
Existe un tercer tipo de fichero: el fichero de scripts (extensión.
SBS). Este fichero es utilizado por los usuarios más avanzados del
software para generar rutinas que permiten automatizar procesos muy
largos y/o complejos. Muchos de estos procesos suelen no ser parte de
las salidas estándar de los comandos del SPSS, aunque parten de estas
salidas. Buena parte de la funcionalidad de los archivos de scripts ha
sido ahora asumida por la inserción del lenguaje de programación Python
en las rutinas de sintax del SPSS. Procedimientos que antes solo se
podían realizar mediante scripts ahora se pueden hacer desde el sintax
mismo.
El programa cuando se instala trae un determinado número de ejemplos o
utilidades de casi todos los ficheros en cuestión. Estos son usados
para ilustrar algunos de los ejemplos de uso del programa.
Fichero de datos de SPSS
Los ficheros de datos en formato SPSS tienen en Windows la extensión.
SAV. Al abrir un fichero de datos con el SPSS, vemos la vista de datos,
una tabla en la que las filas indican los casos y las columnas las
variables. Cada celda corresponde al valor que una determinada variable
adopta en un cierto caso.
Además de esta vista de datos, en las últimas versiones del programa
existe una vista de variables en la que se describen las
características de cada una. En esta vista las filas corresponden a
cada variable y las columnas nos permiten acceder a sus
características:
- Nombre, limitado a 8 caracteres.
- Tipo de variable (compárese este listado de opciones con los tipos de
variables estadísticas existentes)
- Numérico, número en formato estándar)
- Coma decimal, número con comas cada tres posiciones y con un punto
como delimitador de los decimales
- Punto decimal, número con puntos cada tres posiciones y con una coma
como límite delimitador de los decimales.
- Notación científica, número que se expresa con un formato tal que se
sigue de una E y un número que expresa la potencia de 10 a la que se
multiplica la parte numérica previa
- Fecha
- Moneda dólar, formato numérico con el que se expresan cantidades en
dólares
- Moneda del usuario, formato numérico con el que se expresan
cantidades en la moneda definida en la pestaña de monedas del cuadro de
diálogo "Opciones"
- Cadena de caracteres o variable alfanumérica
- Tamaño total
- Tamaño de la parte decimal
- Etiqueta de la variable
- Etiquetas para los valores
- Valores perdidos
- Espacio que ocupa en la vista de datos
- Alineación de la variable en la vista de datos
- Escala de medición.
Algunos usuarios pasan por alto las características de las variables
cuando se trabaja en la base de datos. Sin embargo, cuando se utilizan
scripts o Python las características de las variables pueden tomar gran
relevancia en la construcción de procedimientos ad-hoc.
Fichero de sintaxis de SPSS
Se pueden generar estos archivos de sintaxis con la ayuda del programa
mismo, pues en casi todas las ventanas donde se realizan tareas en el
SPSS existe un botón "Pegar". Este botón cierra la ventana en cuestión
y guarda la sintaxis de las acciones seleccionadas en dicha ventana.
Una vez salvado este archivo es susceptible de modificación.
La sintaxis tal cual se presenta a continuación fue producida
directamente con el SPSS. Este programa le da un formato legible a la
sintaxis, formato que el software en algunos casos no requiere para su
correcto uso.
Otra peculiaridad de las sintaxis del SPSS es que no son "case
sensitive". Ante lo cual es común ver sintaxis escritas solo en
mayúsculas, solo en minúsculas o bien una combinación propia de cada
usuario. Esta situación se modifica para aquellas personas que hacen
uso de Python dentro de sus sintaxis, pues éste es un lenguaje
sensitivo a las variaciones entre mayúsculas y minúsculas. Esto obliga
a estos usuarios a escribir sintaxis con mayor cuidado.
El siguiente ejemplo ilustra como abrir un fichero de datos mediante
sintaxis y como llevar a cabo una frecuencia y una tabla de
contingencia con datos de uno de los archivos de ejemplo que instala el
programa.
- Este es un comentario, debe ir precedido por un asterisco y finalizado
por un punto.
Véase también
Enlaces externos
- Página Principal SPSS - Página de soporte que
incluye una base de datos de soluciones (Puedes logearte usando "guest"
como Usuario y Password)
- Raynald Levesque's SPSS Tools - Biblioteca
de archivos para programadores de SPSS (FAQ, command syntax;
macros; scripts; python)
- [http://listserv.uga.edu/archives/spssx-l.html Archives of SPSSX-L
Discussion] - SPSS Listserv activa desde 1996. Discusses
programming, statistics and analysis
- [http://www.ats.ucla.edu/stat/spss/ UCLA ATS Resources to help you
learn SPSS] - Recursos para aprender SPSS
- [http://www.ats.ucla.edu/stat/technicalreports/ UCLA ATS Techical
Reports] - El Reporte 1 compara Stata, SAS y SPSS con R ([[Lenguaje
R|R]] es un lenguaje y ambiente de trabajo para cálculo estadístico y
graficación).
Using SPSS For Data Analysis] - Tutorial del SPSS elaborado en Harvard
Fuentes
- SPSS Developer Central - Soporte
para desarrolladores de aplicaciones usando SPSS, incluye materiales y
ejemplos de Python programmability feature
- SPSS Wiki - Un wiki con
estadísticos del SPSS
preguntas del SPSS
- SPSS Experts - Perfil de seis
expertos en el uso del SPSS en el mundo
comp.soft-sys.stat.spss] - SPSS Usenet newsgroup via [[Google
Groups]]
- SPSS Forum - Foro de usuarios del SPSS
(Inglés)
un software libre que se puede utilizar en lugar del SPSS
- ↑ [http://www.expansion.com/2009/07/28/empresas/1248784790.h tml Expansión. IBM compra SPSS]

