martes, 5 de octubre de 2010







Métodos gráficos
Más asados en estadística

Los diseños gráficos de datos estadísticos dependen de factores como el público a quien va dirigido, y los más usuales son: gráficos de línea, pictogramas, gráficos de barras y gráficos circulares.
Los gráficos de línea: se utilizan para representar las distribuciones de frecuencias; se obtienen marcando los puntos de los valores de frecuencia de cada ca­tegoría y luego se unen con línea quebrada. El ejemplo:



Si la población de donde se extraen las muestras es muy grande, se pué-den determinar intervalos de clase muy peque­ños. De este modo la representación gráfica, polígono de frecuencia, puede formarse por muchos segmentos peque­ños y así el polígono se aproxima a una curva. Dichas curvas se llaman curvas de frecuencia.
Las curvas de frecuencia presentan ciertas características.




Curvas simétricas
Se caracterizan porque las observaciones que equidistan del máximo central tienen la misma frecuencia.


Curvas segadas o moderadamente asimétricas
En ellas la cola de la curva en uno de los lados del máximo central es mayor que en el otro; dependiendo de esta carac­terística, se dice que la curva está sesgada a la derecha o a la izquierda. Si está sesgada a la derecha, tiene sesgo positivo y s¡ ocurre lo contrario, tiene sesgo negativo.

Curvas en forma de J o J invertida
En ellas el máximo se presenta en un extremo de la curva.

Curvas en forma de U
Se caracterizar porque tienen el máximo en ambos extremos.
Curvas bimodales
En este tipo de: curvas se presentan dos valores máximos.

Curvas multimodales
Presentan más; de dos valores máximos.

PICTOGRAMAS
La representación de datos estadísticos a través de píctogramas utiliza símbolos, que por su forma indican la naturaleza de di­chos datos.

GRÁFICOS DE BARRAS
Los gráficos de barras, también llamados diagra­mas de barras, consisten en levantar sobre cada valor de la variable una barra cuya longitud coin­cida con su frecuencia. Tomando de nuevo el ejem­plo de la evaluación en ciencias naturales, ten­dremos la representación del gráfico.





DIAGRAMAS CIRCULARES
Los gráficos o diagramas circulares, también de­nominados de paste/, consisten en representar los datos estadísticos sobre un círculo, donde cada variable se indica en un sector de éste y su frecuencia determina el tamaño del sector. Reto­mado el ejemplo de la evaluación en ciencias naturales, tenemos el gráfico inferior izquierdo.





Otrás representaciones gráficas
También es posible hacer representaciones gráficas con otros métodos, como cartogra­mas e histogramas.

cartogramas
Estas representaciones gráficas consisten en hacer resaltar con distintos colores o rayas diversas zonas de un mapa, de acuerdo con un criterio.

HISTOGRAMAS
Llamados también histogramas de frecuencias, es una representación gráfica que con­siste en formar una serie de rectángulos que tienen su base sobre un eje horizontal, o eje x, y su longitud corresponde al valor de la frecuencia que representa; consiste en representar las frecuencias de clase por medio de áreas de rectángulos. Son diferentes a los diagramas de barras, donde su altura mide el tamaño de la variable y se dibujan separadas, mientras que en los histogramas las frecuencias quedan representadas por el área de los rectángulos más no por su altura, y se dibujan sin dejar espacios. Si retomamos el ejemplo de las edades, el histograma que representa esta situación será:

ORDENACIÓN
Cuando los datos estadísticos son nume­rosos, poco o nada puede hacerse con ellos si no se organizan y clasifican; para ello se arreglan con algún método; es de­cir, se hace una ordenación.

PARÁMETROS
Es cualquier característica cuantificable de una población; ejemplos: el sexo, la edad, color de piel, etc.

ESTADÍSTICOS
Son los valores o resultados obtenidos de la operación con los datos de una mues­tra. Por lo general, a partir de los estadís­ticos de una muestra se estiman los pará­metros de una población. Son ejemplos de estadísticos la media, la moda y la va-rianza.

Medidas de centralización
En estadística, a menudo los procedimientos gráficos representan la distribución de frecuencia de una va­riable, que se caracteriza por parámetros o estadísti­cos, que permiten obtener una descripción cuantitati­va de dicha distribución.















ESTADÍSTICOS DE POSICIÓN O DE TENDENCIA CENTRAL
Un primer tipo de estos parámetros son los llamados estadísticos de posición o de tendencia central, con los cuales se describe cuantitativamente la posición de los valores de la variable a lo largo de su recorrido; y las más empleadas son la media aritmética, o media, la mediana y la moda, entre otras. En general, estas medi­das son los valores que tienden a situarse en el centro del conjunto de datos ordenados según su magnitud.

Media aritmética
Se define como el valor promedio de un conjunto de valores dados y se calcula sumando todos los valores del conjunto dado, dividido por la cantidad de datos que opera. Ilustremos con un ejemplo; los resultados de la promoción de estudiantes en un centro educativo se registran de acuerdo con la siguiente tabla:
La media aritmética de los estudiantes promovidos se calcula como la suma de todos los valores dados en cada uno de los cursos, dividido por el núme­ro de cursos, así:













Med¡a = 35 + 35 + 35++32 + 34 + 31+33 + 38+35+34 + 37/11 = 34,45

En la situacion de los no promovidos, se tiene que:

Media =0+0+0+3+1+9+7+2+5+6+3/11=3,27


Mediana
La mediana, en una serie de datos ordenados de manera ascenden­te o descendente, es el valor medio si el número de datos es impar, o es la media aritmética de los dos valores medios si el número de datos es par. Veamos un ejemplo: consideremos la serie de once datos ordenados de manera ascendente 1, 1, 2, 3, 4, 5, 6, ó, 6, 7, 8, la mediana es 5, porque corresponde al valor medio de la serie; antes de él hay 5 datos y después de él también hay 5 datos.

Identifiquemos la mediana en otro ejemplo, en que la serie tenga un número par de datos. Consideremos valores de una serie $ 100, $500, $1.000, $5.000; en ella no hay término del medio y en estos casos, la mediana es el valor equidistante de los dos valores centrales, que son $500 y $ 1.000. El valor equidistante es la me­dia aritmética entre ellos, o sea


500+1000/2=750

La mediana en esta situación es $750 y satisface la definición, puesto que hay dos valores, tanto por debajo como por encima de la mediana.

Moda
Es el valor que más ocurre en una distribu­ción de frecuencia. En el ejemplo de los estudiantes promovidos la moda es 35, porque es el resultado que ocurre más comúnmente; mientras que en el ejemplo de la serie 1, 1, 2, 3, 4, 5, ó, 6, 6, 7, 8 la moda es 6, y en el conjunto de números 9, 9, 9, 8, 7, 2, 2, 2, 1 las modas son 9 y 2. La moda puede tener varios valores, incluso puede no existir.


ESTADÍSTICOS DE DISPERSIÓN
Un segundo tipo son los estadísticos de dispersión, que miden el grado de variación de los valores a través de una estimación cuantitativa de su concentración en torno a puntos determinados del rango de la variable. Los más utilizados son el rango o recorrido, la desviación media y la varianza, entre otras. En ge­neral, estas medidas dan ¡dea de la separación de los datos numéricos alrededor de un valor medio.





Rango o recorrido
En una distribución de frecuencias, es la diferencia entre los dos valores extremos: el máximo y el mínimo; ejemplo, en la serie de números 1,1,2,3,4,5, 6,6,6,7,8 el rango es la diferencia entre los valores extremos, 1 y 8, es decir, 7, que se calcula hallando la diferencia entre los extremos.





Desviación media
Conocido también como promedio de desviación, es la media aritmética de los valores absolutos de las desviaciones de cada uno de los resultados de una variable respecto a la media aritmética; ejemplo, al hallar la desviación media de los números 3, 4, 5,9, 14 procedemos a calcular primero la media aritmética, así:


Media=3+4+5+9+14/5=7

desviación media=3-7+4-7+5-7+9-7+14-7/5=4+3+2+2+7/5=3,6


Varianza
La varianza es la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética. En el ejemplo anterior sobre el cálculo de la desviación media, no se tuvo en cuenta los signos y se tomó el valor absoluto de las desviaciones respecto a la media aritmética. La varianza se calcula sumando todas las desviaciones que se elevan al cuadrado y dividiendo por la cantidad de sumandos; retomando el ejemplo anterior del cálculo de la desviación media, tenemos la serie 3, 4, 5, 9, 1 4, cuya varianza es:




Media = 7
Calculando la suma de los cuadrados de las desviaciones respecto a la media:
(3-7)2 + (4-7)2 + (5-7)2 + (9-7)2 + (14-7)2 = 16 + 9 + 4 + 4 + 49= 82
Varianza =82/5=16,4