domingo, 13 de abril de 2014

Programas Diseñados para el Estudio de Análisis de Datos Cuantitativos






El diseño cuantitativo es una forma de aproximación sistemática al estudio de la realidad que se apoya principalmente en categorías numéricas y utiliza  referentemente como base una información factible de cuantificar realizando el análisis a través de diferentes formas de interrelacionarlas. El énfasis en el análisis de los datos cuantificados se basa en las tendencias que muestra el  comportamiento de ellos, la utilización de herramientas como la estadística y la informática, que día a día, se han convertido en auxiliares importantes de la investigación social


El procesamiento de la información requiere no solo de un proceso de planeación sino también de un plan adecuado de manipulación de los datos lo que determinará unos resultados que realmente sirvan para los objetivos del estudio. Igualmente, se muestran los procedimientos para configurar la estructura de un archivo de trabajo, introducir los datos, guardarlos, transformarlos y leerlos.

El procesamiento de los datos es una necesidad muy usual en diversas áreas: Gubernamental, de investigación, académica, etc. Aunque los campos de aplicación sean diferentes, muchos de estos procesos son comunes. Dada esta estandarización de la demanda de necesidades se han desarrollado programas especializados de manejo y gestión de datos.


Existe una gran variedad de estos programas que difieren entre sí, por ejemplo, en los aspectos de capacidad número de datos y variables, variedad de cálculos que pueden realizar y facilidad de su uso. Uno de estos programas es el SPSS (Statistical Package for the Social Sciences) , diseñado en forma modular, cada uno con menús desplegables y cuadros de diálogo que permiten acceder a las distintas funciones que ofrece el programa. Este programa facilita en forma sencilla, dos de las tareas básicas del proceso de investigación social aplicada, es decir, la entrada y grabación de los datos obtenidos y el análisis estadístico de los mismos.


Por ejemplo SPSS puede ser utilizado para evaluar cuestiones educativas.

Actualmente, compite no sólo con softwares licenciados como lo son SAS, MATLAB, Statistica, Stata, sino también con software de código abierto y libre, de los cuales el más destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire que ha sido compilada para diversos sistemas operativos como Linux, además de versiones para Windows y OS X. Este último paquete pretende ser un clon de código abierto que emule todas las posibilidades del SPSS.


Módulos del SPSS
El sistema de módulos de SPSS, como los de otros programas (similar al de algunos lenguajes de programación) provee toda una serie de capacidades adicionales a las existentes en el sistema base. Algunos de los módulos disponibles son:
Modelos de Regresión
Modelos Avanzados
Reducción de datos: Permite crear variables sintéticas a partir de variables colineales por medio del Análisis Factorial.
Clasificación: Permite realizar agrupaciones de observaciones o de variables (cluster analysis) mediante tres algoritmos distintos.
Pruebas no paramétricas: Permite realizar distintas pruebas estadísticas especializadas en distribuciones no normales.
Tablas: Permite al usuario dar un formato especial a las salidas de los datos para su uso posterior. Existe una cierta tendencia dentro de los usuarios y de los desarrolladores del software por dejar de lado el sistema original de TABLES para hacer uso más extensivo de las llamadas CUSTOM TABLES.
Tendencias
Categorías: Permite realizar análisis multivariados de variables normalmente categorías. También se pueden usar variables métricas siempre que se realice el proceso de recodificación adecuado de las mismas.
Análisis Conjunto:: Permite realizar el análisis de datos recogidos para este tipo específico de pruebas estadísticas.
Mapas: Permite la representación geográfica de la información contenida en un fichero (descontinuado para SPSS 16).
Pruebas Exactas: permite realizar pruebas estadísticas en muestras pequeñas.
Análisis de Valores Perdidos: Regresión simple basada en imputaciones sobre los valores ausentes.
Muestras Complejas: permite trabajar para la creación de muestras estratificadas, por conglomerados u otros tipos de muestras.
SamplePower (cálculo de tamaños muestrales)
Árboles de Clasificación: Permite formular árboles de clasificación y/o decisión con lo cual se puede identificar la conformación de grupos y predecir la conducta de sus miembros.
Validación de Datos: Permite al usuario realizar revisiones lógicas de la información contenida en un fichero ".sav" y obtener reportes de los valores considerados atípicos. Es similar al uso de sintaxis o scripts para realizar revisiones de los ficheros. De la misma forma que estos mecanismos es posterior a la digitalización de los datos.
SPSS Programmability Extension (SPSS 14 en adelante). Permite utilizar el lenguaje de programación Python para un mejor control de diversos procesos dentro del programa que hasta ahora eran realizados principalmente mediante scripts (con el lenguaje SAX Basic). Existe también la posibilidad de usar las tecnologías .NET de Microsoft para hacer uso de las librerías del SPSS. Aunque algunos usuarios han cuestionado sobre la necesidad de incluir otros lenguajes, la empresa no tiene esto entre sus objetivos inmediatos.

Desde el SPSS/PC hay una versión adjunta denomina SPSS Student que es un programa completo de la versión correspondiente pero limitada en su capacidad en cuanto al número de registros y variables que puede procesar. Esta versión es para fines de enseñanza del manejo del programa
 
PSPP es un una aplicación de software libre para el análisis de datos. Se presenta en modo gráfico y está escrita en el lenguaje de programación C. Usa la biblioteca científica GNU para sus rutinas matemáticas, y plotutils para la generación de gráficos. Es un reemplazo libre para el software propietario SPSS.

Características
Proporciona funcionalidades básicas como: frecuencias, tablas cruzadas, comparación de media ; regresión lineal, fiabilidad, reordenamiento de datos, pruebas no paramétricas, factor de análisis entre otras características.

Los formatos de salida pueden ser: en ASCII, PDF, PostScript o HTML así como algunos gráficos estadísticos: histogramas, Gráfico circulares y gráficos de Distribución Normal.

PSPP puede importar formatos de: Gnumeric, OpenDocument, hojas de Excel , bases de datos Postgres, valores separados por coma y archivos ASCII. Puede exportar archivos en formato SPSS y archivos ASCII. Algunas de las bibliotecas usadas por PSPP pueden ser accedidas vía programación.

   
 
InfoStat es un software para análisis estadístico de aplicación general. Cubre tanto las necesidades elementales para la obtención de estadísticas descriptivas y gráficos para el análisis exploratorio,  como métodos avanzados de modelación estadística y análisis multivariado. Una de sus fortalezas es la sencillez de su interfaz combinada con capacidades profesionales para el cálculo y el manejo de datos. Debido al origen  universitario, el programa tiene muchas facilidades para la enseñanza de la estadística que no son fáciles en encontrar en otros programas similares. La  versión en español es muy valorada por los usuarios, especialmente por los estudiantes. Una propiedad casi única entre el software estadístico es la habilidad de  InfoStat se conectarse con R, una plataforma de desarrollo de algoritmos estadísticos de dominio público de gran crecimiento. InfoStat de conecta con R  de dos maneras: mediante un intérprete integrado que permite ejecutar script de R sin salir del ambiente de trabajo de InfoStat y mediante el desarrollo de aplicaciones utilizando el motor de cálculo de R pero con la interfaz amigable que los usuarios esperan. Ese es el caso del la inclusión de modelos lineales mixtos en InfoStat. Estos han sido siempre modelos difíciles de especificar por su complejidad, pero la interfaz lograda en InfoStat nos ha permitido incorporar sus contenidos en cursos de postgrado y capacitaciones a técnicos de empresas que de otra manera hubieran sido imposibles de abordar.
InfoStat es un software para análisis estadístico que cubre tanto las necesidades básicas para la obtención de estadísticas descriptivas y gráficos para el análisis exploratorio, como métodos avanzados de modelación estadística y análisis multivariado.

El manejo del programa resulta especialmente sencillo gracias a su ordenada interfaz que nos permitirá crear cualquier tipo de diagrama, gráfico de barras, tablas de diferentes tamaños o histogramas con un simple clic.

Una vez hayamos terminado con nuestros documentos, podremos guardarlos en varios formatos distintos que nos facilitarán su uso posterior. Tenemos la posibilidad de usar el formato propio de InfoStat, Excel, TXT, DBase, Paradox e Infogen.

Infostat es una herramienta bastante útil para estudiantes y usuarios interesados en el análisis estadístico en general. Su facilidad de manejo y amplias prestaciones conforman un programa excelente.


 
OpenStat es un programa para análisis de datos estadísticos creado para personas con recursos económicos reducidos por William G. Miller PhD.

Cuando hablamos de programas de libre acceso, no significa que sea software gratuito. Hablamos de la libertad de usar, modificar y distribuir copias con o sin modificaciones y aproximadamente en el mundo diez millones de personas alrededor del mundo utilizan software gratuito. (Stallman, 2009).

 


DISTRIBUCIONES UNIDIMENSIONALES:



Todo análisis estadístico se inicia con una primera fase descriptiva de los datos. Ésta tiene por objeto sintetizar la información mediante la elaboración de tablas de frecuencias, representaciones gráficas y el cálculo de medidas estadísticas (o estadísticos). Estos procedimientos descriptivos dependen de la naturaleza de la variable o atributo que se analiza y, en este sentido, el programa SPSS los recoge en dos menús diferentes según se empleen, básicamente, para sintetizar datos cualitativos o datos cuantitativos. Así mismo, el programa diferencia entre los procedimientos descriptivos que hacen referencia al análisis de una sola variable (análisis unidimensional) de los relativos a dos o más variables conjuntamente (análisis bidimensional o multidimensional).

 DISTRIBUCIONES DE FRECUENCIAS

Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que recoge:

valores de la variable o modalidades del atributo,

frecuencia absoluta o número de veces que aparece cada valor o modalidad en la muestra,

porcentaje de veces que aparece cada valor de la variable o modalidad del atributo sobre el total de observaciones,

porcentaje válido calculado sobre el total de observaciones excluidos los valores missing,

porcentaje acumulado hasta cada uno de los valores de la variable ordenados de menor a mayor. Este porcentaje tiene interpretación sólo en los casos en que la variable sea susceptible de medida por lo menos en una escala ordinal.

 ESTADÍSTICOS

La opción Estadísticos abre un cuadro de diálogo que permite la obtención de las principales medidas de síntesis o estadísticos de una distribución unidimensional de frecuencias. éstos se presentan agrupados en cuatro clases: Valores percentiles, Tendencia central, Dispersión y Distribución.
• Valores percentiles son aquellos valores de la variable que dividen a la distribución de frecuencias en partes con igual número de observaciones: así, los cuartiles la dividen en cuatro partes guales y se obtienen directamente activando la opción Cuartiles. Si interesan los valores que dividen la distribución en k partes iguales se activa la opción Puntos de corte para (por defecto 10) grupos iguales, lo que proporciona los deciles de la distribución. En la opción Percentiles es necesario indicar cuales de ellos se desean, incluyéndolos de uno en uno con el botón Añadir.
Tendencia central permite seleccionar Media, Mediana y Moda de la distribución, así como la Suma de todos los valores de la distribución.

Dispersión permite seleccionar las siguientes medidas: Varianza, como resultado del cálculo de la expresión, y Desviación típica; el error típico de la media (E.T.media) que se define como , así como los valores Mínimo y Máximo de la variable y la Amplitud o recorrido de la variable.

• Por último, en Distribución pueden obtenerse las siguientes medidas relativas a la forma de la distribución
GRÁFICOS

Los gráficos asociados a la tabla de frecuencias que recoge del cuadro de diálogo Frecuencias son: Gráficos de barras, Gráficos de sectores o Histogramas. Para seleccionar el que interesa se activa la opción Gráficos que abre el siguiente cuadro de diálogo:
 
 
Si la característica objeto de análisis es un atributo los gráficos adecuados son el gráfico de barras o de sectores; en ambos casos pueden realizarse con frecuencias absolutas o con relativas seleccionando Frecuencias o Porcentajes, respectivamente. Si la característica es cuantitativa el gráfico adecuado es el histograma que, a su vez, puede obtenerse superponiéndole la Curva de la distribución normal activando la opción correspondiente.  

 

 
Bibliografía:
Pardo, A. y Ruiz, M. A. (2002). SPSS 11. Guía para el análisis de datos. Madrid: McGraw-Hill. ISBN 84-841-3750-7.

                      http://es.wikipedia.org/wiki/SPSS
 
                     Aigneren Miguel. DISEÑOS CUANTITATIVOS. ANÁLISIS E INTERPRETACIÓN DE LA            INFORMACIÓN                 http://aprendeenlinea.udea.edu.co/revistas/index.php/ceo/article/viewFile/1651/1303

 



 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 
 




 
 
 
 
 
 

5 comentarios:

  1. El SPSS es un programa para analisis de datos cuantitativos, presenta un esquema de facil acceso al usuario por medio de un sistema de ventanas que permite en la opcion de analisis escoger la opcion que el investigador va aplicar entre estas encontramos Informes, estadisticos descriptivos,tablas personalizadas, comparar medias, correlaciones, regresion,log lineal, otras.
    En tu postura el programa permite el analisis de los datos cuantitativos en la investigacion de distintas areas y una de estas en la educacion.

    ResponderEliminar
    Respuestas
    1. Gracias compañera por tu aporte es bueno saber que esta información es visitada y espero sirva de apoyo a otras personas que también investigan sobre análisis de software para datos cuantitativos

      Eliminar
  2. Hola María, al igual que yo escogí este mismo programa, me pareció importante esta aplicación ya que no la conocía y resulta muy fácil manejarla. Se realiza a través de 4 niveles de medida de la variable: nominal, ordinal, intervalo y razón. Entre las partes podemos nombrar el editor de datos, el editor de resultas y las gráficas. Entre sus pasos para manejar el programa se puede realizar por medio de 4 pasos carga los datos en el editor de datos, solicita los análisis estadísticos, examina los resultados de los análisis en el visor de resultados y por ultimo salva los resultados. Otra ventaja es que admite datos de otros ficheros como es de Excel, ASCII. Tiene una gran amplitud en los diferentes tipos de gráficos, histogramas, barras, matriciales. Es un programa muy bueno en mi manera de entenderlo que nos servirá para nuestros trabajos de investigación.

    ResponderEliminar
  3. Gracias LUZBETH, si es muy util a la hora de realizar el procesamiento de la información, requiere no solo de un proceso de planeación sino también de un plan adecuado de manipulación de los datos lo que determinará unos resultados que realmente sirvan para los objetivos del estudio. Igualmente, se muestran los procedimientos para configurar la estructura de un archivo de trabajo, introducir los datos, guardarlos, transformarlos y leerlos.

    ResponderEliminar
  4. Hola maria.. Yo también trabajé con el SPSS, tu información está bastante detallada. Comparto tu opinión sobre el uso del mismo. Es de fácil manejo y se creó específicamente para las ciencias sociales. Consta de barras de herramientas y menús que incluyen lo necesario para realizar el análisis de datos cuantitativos, además posee una amplia gama en cuanto a gráficos, histogramas, entre otros.

    ResponderEliminar