La dispersión o variación es una
característica importante de un conjunto de datos porque intenta dar una
idea de cuán esparcidos se encuentran éstos. Existen diversas medidas de
dispersión, algunas de ellas son: El Rango, la Desviación
media, la Varianza y la Desviación estándar
o Desviación típica, en este artículo se explican cada una de
ellas
En el caso de las variables con valores que pueden definirse en términos de
alguna escala de medida de igual intervalo, nivel de medición de intervalos o
de razón, puede usarse un tipo de indicador que permite apreciar el grado de
dispersión o variabilidad existente en el grupo de variantes en estudio.
Las Medidas de Dispersión son las que indican la intensidad con que se
dispersan o concentran las observaciones respecto de una Medida de Tendencia Central. La más utilizada es el desvío estándar (o desviación estándar o
desviación típica), aunque también dan bastante información el rango, el
recorrido intercuartil, y la desviación cuartílica.
La dispersión o variación es una característica importante de un conjunto
de datos porque intenta dar una idea de cuán esparcidos se encuentran éstos.
Existen diversas medidas de dispersión, algunas de ellas son:
Rango
Desviación media
Desviación estándar
Varianza
A continuación se explican cada una de ellas
Las medidas de dispersión se dividen en dos grandes grupos:
a.
Las medidas de dispersión absolutas: estas medidas
de dispersión vienen expresadas en la misma medida en que se expresa la
variable que genera la serie de datos y su valor se limita a la serie misma.
b.
Las medidas de dispersión relativas: Estas medidas de
dispersión son relaciones entre medidas de dispersión absoluta y medidas de
tendencia central, las cuales vienen expresadas en valores proporcionales o
porcentuales y tienen como función determinar entre varias distribuciones la de
mayor o menor dispersión. Heterogeneidad u homogeneidad entre dos serie de
datos
Rango o Recorrido
Se define el rango de los datos como el intervalo u oscilación total de la
variable en los datos recogidos y se calcula por medio de la fórmula Rang(X) =
Máx(X) – Mín(X)
Donde:
Max(X): es el máximo valor que toma la variable X en los datos recogidos,
en pocas palabras, el valor mayor que toman los dados.
Mín(X): es el mínimo valor que toma
la variable X en los datos recogidos, en pocas palabras, el valor menor que
toman los dados.
Esta medida se calcula fácilmente, sin embargo presenta la desventaja en
que no expresa realmente la concentración de los datos, presentándose casos en
los cuales se obtienen intervalos exagerados cuando en realidad la serie tiene
una gran concentración pero sus valores extremos difieren mucho del resto de
valores de la serie. Por ejemplo, se tiene la edad de un grupo de personas, las
cuales es la siguiente: 17, 18, 18, 18, 23, 15, 25, 18, 19, 17, 35. El rango
será igual a (35 – 15) = 19 el cual es exagerado y no da una idea real de la
concentración de los datos.
Es importante mencionar otra desventaja del rango la cual se refiere a la
dificultad de esta medida para la realización de operaciones algebraicas, por
lo que es poco utilizado siendo su uso más frecuente en el control de calidad
industrial y como indicador de fluctuaciones en el mercado de valores.
Intervalo Semidecil
Para eliminar los valores extremos y resolver la desventaja que representa
el rango se utiliza el intervalo
semidecil, que se define como la diferencia entre el noveno decil y el
primer decil. Así Id = (D9 –
D1)
Desviación Cuartil
Aun cuando el intervalo semidecil resuelve en parte el problema de la desviación
extrema o la presencia de datos extremos, la medida de dispersión basada en las
medidas de tendencia central que más se utiliza es la Desviación Cuartil, la
cual se obtiene restando el cuartil 1 al cuartil 3. O sea, la desviación cuartil viene dada por: DC
= (Q3 – Q1). Esta medida contiene 50% de los datos y da
una mejor idea de su concentración alrededor de un valor central. Su mayor
desventaja consiste en no ser una medida propicia para operaciones algebraicas.
Una medida derivada de la desviación cuartil es la Desviación Semicuartil, cuya fórmula de cálculo es
la siguiente
Desviación Media
Entendiendo como desvío a la diferencia que hay entre una medida de
tendencia central con cada uno de sus valores se define la desviación media como el valor promedio de los desvíos tomados en
valor absoluto, de los datos con respecto a un término central. El término
central en la práctica es la media aritmética, pero también puede usarse la
mediana, la moda o un valor arbitrario, dependiendo de los datos estudiados.
Para el cálculo de la desviación media se utilizará la siguiente fórmula:
Interpretación de la desviación Media
Esta
medida es de fácil comprensión, los desvíos son tomados en valor absoluto
porque de no ser así, la suma de éstos resultaría cero, de acuerdo con una
propiedad de la media aritmética y se tiene que en una distribución de datos
aproximadamente normal 57,5% de los
datos se concentran alrededor de si
la distribución es moderadamente asimétrica esta concentración se aproxima a
ese porcentaje.
La
principal desventaja que representa la desviación
media se presenta por la dificultad algebraica al tratar con valores
absolutos.
Varianza
La
noción de varianza se suele emplear en el ámbito de la estadística. Se trata de
una palabra impulsada por el matemático y científico inglés Ronald Fisher
(1890-1962) y sirve para identificar a la media de las desviaciones cuadráticas
de una Variable de carácter Aleatorio, considerando el valor medio de ésta.
Se obtiene de sumar todos los desvíos respecto a la media aritmética
elevados al cuadrado, dividiéndose entre el total de datos de la serie y su
fórmula de cálculo es:
Propiedades de la Varianza
Desviación Típica o Desviación Estándar
La medida de dispersión más importante y de mayor utilidad práctica es la Desviación Típica, la cual se define
como la raíz cuadrada positiva de la media aritmética de los cuadrados de los
desvíos de los valores con respecto a su media aritmética; su símbolo es la
letra griega sigma minúscula σ y en
estadística inductiva se utiliza la letra S, y la fórmula general de la
desviación típica viene dada por:
Interpretación de la Desviación Típica
Como Medida Absoluta de Dispersión, es la que mejor proporciona la
variación de los datos con respecto a la media aritmética, su valor se
encuentra en relación directa con la dispersión de los datos, a mayor
dispersión de ellos, mayor desviación típica y a menor dispersión menor
desviación típica.
Medidas de Dispersión Relativas
Hasta
el momento se ha centrado el estudio en medidas de dispersión absoluta, sin
embargo, éstas no permiten hacer comparaciones entre la dispersión de los
valores de distribuciones distintas, debido a que ellas están afectadas por la
unidad de medida de la variable observada; de allí que la comparación es
imposible porque cada medida viene expresada en la unidades de medida
diferente.
Es
por esto que se ha construido varias medidas de dispersión relativas, las
cuales vienen expresadas en porcentajes o proporciones, aunque más se utilizan
porcentajes, relacionando una medida de dispersión absoluta con una Medida de Tendencia Central. Este tipo de relaciones permite comparar la variabilidad de
los datos entre varias series.
El Coeficiente de Variación
La
medida de dispersión relativa de mayor importancia es el Coeficiente de
Variación, que se expresa en porcentaje y se calcula por la relación que existe
entre la desviación típica y la media aritmética.
En
fórmula:
REFERENCIAS BIBLIOGRÁFICAS Y DOCUMENTALES
Cabrera G.,
Francisco A. (2007) Medidas de Dispersión.
[Artículo en línea] disponible en: http://www.monografias.com/trabajos43/medidas-dispersion/medidas-dispersion.shtml#ixzz37jVREyKU [Consulta:
2014; julio 17]
García Pérez,
Claudia (s/f) Unidad IV; Medidas de
Dispersión. México. Universidad Autónoma del estado de Hidalgo/Sistema de
Universidad Virtual. Asignatura; Estadística Aplicada. [Documento en línea]
Disponible en: http://fcps.uaq.mx/descargas/prope2014/estadistica/4/medidas_dispersion.pdf
[Consulta: 2014; julio, 16]
Mendenhall, W.,
y Reinmuth, J. E. (2000) Estadística para
Administración y Economía. D.F, México: Grupo Editorial Iberoamérica S. A
de C. V., 1981
Rivas González,
Ernesto (2000) Estadística General.
Undécima Edición. Caracas – Venezuela. Ediciones de la Biblioteca Central.
Universidad Central de Venezuela
Sánchez Barajas,
Genaro (s/f) Estadística Aplicada al
Análisis Económico. [Documento en línea] disponible en: http://www.economia.unam.mx/profesor/barajas/estadis/parte2.pdf [Consulta; 2014,
julio 10]
Spiegel, M. R.
(1991). Estadística (2da edición.).
D. F, México. Editorial McGraw Hill.
Stevenson, W. J.
(1981) Estadística para Administración y
Economía. D. F, México. Editorial Harla.
muy buena informacion
ResponderEliminarBastante bueno, me ayudo mucho!
ResponderEliminarExelente información
ResponderEliminar