sábado, 19 de julio de 2014

MEDIDAS DE DISPERSIÓN




La dispersión o variación es una característica importante de un conjunto de datos porque intenta dar una idea de cuán esparcidos se encuentran éstos. Existen diversas medidas de dispersión, algunas de ellas son: El Rango, la Desviación media, la Varianza y la Desviación estándar o Desviación típica, en este artículo se explican cada una de ellas

Las Medidas de Tendencia Central carecen por si sola de significación, de muy poco sirve conocer la media aritmética o promedio de una serie de datos si se desconoce que tan concentrados se encuentran alrededor de dicho promedio, qué tanto se acercan o alejan los datos del promedio, es decir, cómo es la dispersión de dichos datos.

En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de igual intervalo, nivel de medición de intervalos o de razón, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes en estudio.

Las Medidas de Dispersión son las que indican la intensidad con que se dispersan o concentran las observaciones respecto de una Medida de Tendencia Central. La más utilizada es el desvío estándar (o desviación estándar o desviación típica), aunque también dan bastante información el rango, el recorrido intercuartil, y la desviación cuartílica.

La dispersión o variación es una característica importante de un conjunto de datos porque intenta dar una idea de cuán esparcidos se encuentran éstos. Existen diversas medidas de dispersión, algunas de ellas son:
Rango
Desviación media
Desviación estándar
Varianza
A continuación se explican cada una de ellas
Las medidas de dispersión se dividen en dos grandes grupos:
a.      Las medidas de dispersión absolutas: estas medidas de dispersión vienen expresadas en la misma medida en que se expresa la variable que genera la serie de datos y su valor se limita a la serie misma.
b.      Las medidas de dispersión relativas: Estas medidas de dispersión son relaciones entre medidas de dispersión absoluta y medidas de tendencia central, las cuales vienen expresadas en valores proporcionales o porcentuales y tienen como función determinar entre varias distribuciones la de mayor o menor dispersión. Heterogeneidad u homogeneidad entre dos serie de datos

Rango o Recorrido

Se define el rango de los datos como el intervalo u oscilación total de la variable en los datos recogidos y se calcula por medio de la fórmula Rang(X) = Máx(X) – Mín(X)
Donde:
Max(X): es el máximo valor que toma la variable X en los datos recogidos, en pocas palabras, el valor mayor que toman los dados.
Mín(X): es el mínimo  valor que toma la variable X en los datos recogidos, en pocas palabras, el valor menor que toman los dados.

Esta medida se calcula fácilmente, sin embargo presenta la desventaja en que no expresa realmente la concentración de los datos, presentándose casos en los cuales se obtienen intervalos exagerados cuando en realidad la serie tiene una gran concentración pero sus valores extremos difieren mucho del resto de valores de la serie. Por ejemplo, se tiene la edad de un grupo de personas, las cuales es la siguiente: 17, 18, 18, 18, 23, 15, 25, 18, 19, 17, 35. El rango será igual a (35 – 15) = 19 el cual es exagerado y no da una idea real de la concentración de los datos.

Es importante mencionar otra desventaja del rango la cual se refiere a la dificultad de esta medida para la realización de operaciones algebraicas, por lo que es poco utilizado siendo su uso más frecuente en el control de calidad industrial y como indicador de fluctuaciones en el mercado de valores.

Intervalo Semidecil

Para eliminar los valores extremos y resolver la desventaja que representa el rango se utiliza el intervalo semidecil, que se define como la diferencia entre el noveno decil y el primer decil. Así  Id = (D9 – D1)

Desviación Cuartil

Aun cuando el intervalo semidecil resuelve en parte el problema de la desviación extrema o la presencia de datos extremos, la medida de dispersión basada en las medidas de tendencia central que más se utiliza es la Desviación Cuartil, la cual se obtiene restando el cuartil 1 al cuartil 3. O sea, la desviación cuartil viene dada por: DC = (Q3 – Q1). Esta medida contiene 50% de los datos y da una mejor idea de su concentración alrededor de un valor central. Su mayor desventaja consiste en no ser una medida propicia para operaciones algebraicas.

Una medida derivada de la desviación cuartil es la Desviación Semicuartil, cuya fórmula de cálculo es la siguiente


Desviación Media

Entendiendo como desvío a la diferencia que hay entre una medida de tendencia central con cada uno de sus valores se define la desviación media como el valor promedio de los desvíos tomados en valor absoluto, de los datos con respecto a un término central. El término central en la práctica es la media aritmética, pero también puede usarse la mediana, la moda o un valor arbitrario, dependiendo de los datos estudiados. Para el cálculo de la desviación media se utilizará la siguiente fórmula:

 

Interpretación de la desviación Media


Esta medida es de fácil comprensión, los desvíos son tomados en valor absoluto porque de no ser así, la suma de éstos resultaría cero, de acuerdo con una propiedad de la media aritmética y se tiene que en una distribución de datos aproximadamente normal 57,5% de los  datos se concentran alrededor de si la distribución es moderadamente asimétrica esta concentración se aproxima a ese porcentaje.

La principal desventaja que representa la desviación media se presenta por la dificultad algebraica al tratar con valores absolutos.

Varianza

La noción de varianza se suele emplear en el ámbito de la estadística. Se trata de una palabra impulsada por el matemático y científico inglés Ronald Fisher (1890-1962) y sirve para identificar a la media de las desviaciones cuadráticas de una Variable de carácter Aleatorio, considerando el valor medio de ésta.

Se obtiene de sumar todos los desvíos respecto a la media aritmética elevados al cuadrado, dividiéndose entre el total de datos de la serie y su fórmula de cálculo es:

Propiedades de la Varianza


 

Desviación Típica o Desviación Estándar

La medida de dispersión más importante y de mayor utilidad práctica es la Desviación Típica, la cual se define como la raíz cuadrada positiva de la media aritmética de los cuadrados de los desvíos de los valores con respecto a su media aritmética; su símbolo es la letra griega sigma minúscula σ y en estadística inductiva se utiliza la letra S, y la fórmula general de la desviación típica viene dada por:


Interpretación de la Desviación Típica

Como Medida Absoluta de Dispersión, es la que mejor proporciona la variación de los datos con respecto a la media aritmética, su valor se encuentra en relación directa con la dispersión de los datos, a mayor dispersión de ellos, mayor desviación típica y a menor dispersión menor desviación típica.



Medidas de Dispersión Relativas

Hasta el momento se ha centrado el estudio en medidas de dispersión absoluta, sin embargo, éstas no permiten hacer comparaciones entre la dispersión de los valores de distribuciones distintas, debido a que ellas están afectadas por la unidad de medida de la variable observada; de allí que la comparación es imposible porque cada medida viene expresada en la unidades de medida diferente.
Es por esto que se ha construido varias medidas de dispersión relativas, las cuales vienen expresadas en porcentajes o proporciones, aunque más se utilizan porcentajes, relacionando una medida de dispersión absoluta con una Medida de Tendencia Central. Este tipo de relaciones permite comparar la variabilidad de los datos entre varias series.

El Coeficiente de Variación

La medida de dispersión relativa de mayor importancia es el Coeficiente de Variación, que se expresa en porcentaje y se calcula por la relación que existe entre la desviación típica y la media aritmética.
En fórmula: 


REFERENCIAS BIBLIOGRÁFICAS Y DOCUMENTALES

Cabrera G., Francisco A. (2007) Medidas de Dispersión. [Artículo en línea] disponible en: http://www.monografias.com/trabajos43/medidas-dispersion/medidas-dispersion.shtml#ixzz37jVREyKU [Consulta: 2014; julio 17]
García Pérez, Claudia (s/f) Unidad IV; Medidas de Dispersión. México. Universidad Autónoma del estado de Hidalgo/Sistema de Universidad Virtual. Asignatura; Estadística Aplicada. [Documento en línea] Disponible en: http://fcps.uaq.mx/descargas/prope2014/estadistica/4/medidas_dispersion.pdf [Consulta: 2014; julio, 16]
Mendenhall, W., y Reinmuth, J. E. (2000) Estadística para Administración y Economía. D.F, México: Grupo Editorial Iberoamérica S. A de C. V., 1981
Rivas González, Ernesto (2000) Estadística General. Undécima Edición. Caracas – Venezuela. Ediciones de la Biblioteca Central. Universidad Central de Venezuela
Sánchez Barajas, Genaro (s/f) Estadística Aplicada al Análisis Económico. [Documento en línea] disponible en:  http://www.economia.unam.mx/profesor/barajas/estadis/parte2.pdf [Consulta; 2014, julio 10]
Spiegel, M. R. (1991). Estadística (2da edición.). D. F, México. Editorial McGraw Hill.
Stevenson, W. J. (1981) Estadística para Administración y Economía. D. F, México. Editorial Harla.

3 comentarios: