viernes, 8 de mayo de 2009

Medidas de tendencia central

Media armónica

La media armónica, que representaremos por H, se define como sigue:

Obsérvese que la inversa de la media armónica es la media aritmética de los inversos de los valores de la variable. No es aconsejable en distribuciones de variables con valores pequeños. Se suele utilizar para promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.

Ventajas e inconvenientes:

En su cálculo intervienen todos los valores de la distribución.

Su cálculo no tiene sentido cuando algún valor de la variable toma valor cero.

Es única.

Media cuadrática
En matemáticas, la media cuadrática, valor cuadrático medio o RMS (del inglés root mean square) es una medida estadística de la magnitud de una cantidad variable. Puede calcularse para una serie de valores discretos o para una función de variable continua. El nombre deriva del hecho de que es la raíz cuadrada de la media aritmética de los cuadrados de los valores.

Esta media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en medicina.

A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media cuadrática. Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para volver a la unidad de medida original.

Otras medias estadísticas son la media aritmética, la media ponderada, la media generalizada, media armónica.


Media geométrica

Sea una distribución de frecuencias (x, n). La media geométrica, que denotaremos por G. se define como la raíz N-ésima del producto de los N valores de la distribución.

G =

Si los datos están agrupados en intervalos, la expresión de la media geométrica, es la misma, pero utilizando la marca de clase (Xi).

El empleo más frecuente de la media geométrica es el de promediar variables tales como porcentajes, tasas, números índices. etc., es decir, en los casos en los que se supone que la variable presenta variaciones acumulativas.

Ventajas e inconvenientes:

En su cálculo intervienen todos los valores de la distribución.

Los valores extremos tienen menor influencia que en la media aritmética.

Es única.

Su cálculo es más complicado que el de la media aritmética.

Además, cuando la variable toma al menos un x = 0 entonces G se anula, y si la variable toma valores negativos se pueden presentar una gama de casos particulares en los que tampoco queda determinada debido al problema de las raíces de índice par de números negativos.
La mediana
estadística es el número central de un grupo de números ordenados por tamaño. Si la cantidad de términos es par, la mediana es el promedio de los dos números centrales:
Para averiguar la mediana de un grupo de números:
Ordena los números según su tamaño
Si la cantidad de términos es impar, la mediana es el valor central.
Si la cantidad de términos es par, suma los dos términos del medio y divide por 2.

Moda
La moda estadística es el valor que más se repite en un grupo de números.
Para averiguar la moda en un grupo de números:
• Ordena los números según su tamaño.
• Determina la cantidad de veces de cada valor numérico.
• El valor numérico que más se repite es la moda.
• Puede haber más de una moda cuando dos o más números se repiten la misma cantidad de veces y además este es el máximo número de veces del conjunto.
• No hay moda si ningún número se repite más de una vez.
Ejemplo: La moda de 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 es 5.

mediana
es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil.

Varianza
Es el resultado de la división de la sumatoria de las distancias existentes entre cada dato y su media aritmética elevadas al cuadrado, y el número total de datos.
Distinguimos dos símbolos para identificar la varianza: S2 para datos muestrales, y σ2 para datos poblacionales. Note que la fórmula para la varianza muestral presenta en su denominador al tamaño de la muestra menos uno, tendencia adoptada por los estadísticos para denotar una varianza más conservadora.
Al igual que ocurre con la desviación media, podemos definir las fórmulas para datos agrupados en tablas tipo A y tipo B. Para las tablas tipo A tenemos:
Una advertencia en el uso de esta medida, es que al elevar las distancias al cuadrado, automáticamente se elevan las unidades. Por ejemplo, si unidad trabajada en los datos es centímetros, la varianza da como resultados centímetros al cuadrado.
Ejemplo:
Varianza para datos no agrupados
La siguiente muestra representa las edades de 25 personas sometidas a un análisis de preferencias para un estudio de mercado.

25 19 21 35 44
20 27 32 38 33
18 30 19 29 33
26 24 28 39 31
31 18 17 30 27
Determinar la varianza.
SOLUCIÓN
PASO 1: Calcular la media aritmética.
PASO 2: Calcular la varianza
En este punto, la varianza es identificada por S2.
La varianza equivale a 51,8567. Por elevar las unidades al cuadrado, carece de un significado contextual dentro del análisis descriptivo del caso.

La desviación típica
La desviación típica es la raíz cuadrada (positiva) de la varianza, es el parámetro de dispersión más utilizado.
La calculamos:
Utilizando habitualmente la segunda fórmula, llamada "reducida" de más fácil manejo.
Si sumamos una constante a todos los valores de la distribución la desviación típica no varía.
Si multiplicamos todos los valores por la misma cantidad la desviación típica queda multiplicada por esa cantidad.

LAS VARIABLES

DISCRETAS O DISCONTINUAS.
En caso de que pueda tomar solo ciertos valores exactos se dice que la variable es "Discreta"

CONTINUA:
Es cuando nos representan los datos con decimales.

NO COTINUAS:
Cuando nos lo representan con numeros enteros.

lunes, 23 de marzo de 2009

Diferencia de tabla y la distribucion de frecuencias

La diferencia es que las tablas de distribuciónes de frecuencias se utilizan cuando se recolectan datos, con ellas se pueden representar los datos de manera que es más fácil analizarlos y se pueden elaborar tablas de distribución de frecuencias para datos no agrupados y para datos agrupados.

Estas últimas se utiliza cuando se tienen muchos datos.

En que la tabla es una representacion grafica de datos ordenados y en la distribucion de frecuencias es cuando se ordena Xi F I etc. Por la Frecuencia.

Estadistica

Qué es estadística
Es una colección de métodos para planificar y realizar experimentos, obtener datos y luego analizar, interpretar, y formular una conclusión basada en esos datos. Es la ciencia encargada de recopilar, organizar, analizar e interpretar información numérica o cualitativa, de manera que pueda llevar a conclusiones válidas.