PARÁMETROS ESTADÍSTICOS

En Estadística es muy útil la notación con subíndices. El símbolo xi (léase "x sub i") denota cualquiera de los n valores x1, x2, x3, ....., xn que una variable x puede tomar. La letra "i" en xi puede representar cualquiera de los números 1, 2, 3, ... n y se llama subíndice.

También es muy frecuente el uso del símbolo de sumatorio para indicar la suma de todas las xi desde i=1 hasta i=n, es decir, por definición:

Medidas numéricas descriptivas:

Puesto que las representaciones gráficas no siempre consiguen ofrecer una información completa de una serie de datos, es necesario analizar procedimientos numéricos que permitan resumir toda la información del fenómeno en estudio en unos números llamados parámetros estadísticos.

Todas estas medidas tienen su fin para hacer posteriormente la inferencia estadística que como hemos dicho al principio buscamos como meta definitiva. Buscamos entonces primordialmente:la localización del centro de los datos y su variabilidad.

Los parámetros estadísticos son:

a) Medidas de centralización.- Que representan a toda la distribución. Los más importantes son la media aritmética, la mediana y la moda.

b) Medidas de dispersión.- Que indican si los valores están agrupados o dispersos. Los más importantes son la varianza y la desviación típica.

De centralización

  • 1) La moda: Es el valor de la distribución de frecuencias que tiene mayor frecuencia absoluta. En el ejemplo de las notas de los alumnos, la moda es Mo=5, pues es a esta nota a la que corresponde una mayor frecuencia. Si a dos o más valores les corresponde la misma frecuencia máxima, la distribución se llama bimodal o multimodal.

    2) La media aritmética

    Se llama así a la suma de todos los valores dividida por el número total de los mismos. Para una tabla de frecuencias en la que a cada valor de la variable xi, le corresponda una frecuencia absoluta ni la media se calcula así:

    Así, para los datos del ejemplo de las notas de un grupo de alumnos, calcularíamos la media aritmética de la siguiente manera:

    Xi ni xi*ni
    1 2 2
    2 3 6
    3 3 9
    4 9 36
    5 12 60
    6 9 54
    7 6 42
    8 3 24
    9 1 9
    10 2 20
    Total 50 262

    La media aritmética es pues:

    La media es una medida fácil de calcular, para su cálculo intervienen todos los datos pero por contra es muy sensible a los valores extremos. Por ejemplo: si tenemos los pesos siguientes, que corresponden a una serie de personas:

    67 Kg, 70 Kg, 73 Kg, 75 Kg, 70 Kg, 71 Kg, 120 Kg, 73 Kg.

    Actividad: La media aporta en este caso muy poco sentido. ¿Porqué?.

    3) La mediana.- Es un número Me tal que, al menos la mitad de los valores de la distribución es inferior o igual a Me, y al menos la mitad es superior o igual a Me.

    Para calcular la mediana, se ordenan los datos de menor a mayor. Si hay un número impar de ellos, la mediana es el que ocupa el lugar central. Si su número es par, se toma la media aritmética de los dos valores centrales. En el ejemplo de las notas de una serie de alumnos, dado que hay N=50 valores y se trata de un número par, los dos valores centrales son los que ocupan las posiciones 25 y 26. Mirando la tabla de frecuencias absolutas acumuladas vemos que ambos corresponden al valor 5 (ya que menores o iguales que él hay 29), por tanto Me=5

     

    Medidas de dispersión :

  • 1) Varianza.- Se define la varianza de una distribución de frecuencias al número obtenido de la siguiente expresión:

    A la raíz cuadrada de la varianza se la denomina desviación típica, o sea:

    Cuanto mayor sea la desviación típica, más alejados están los valores de la distribución de su valor medio, o sea, mayor es el error que se comete al sustituirlos todos por su media aritmética. Para nuestro ejemplo 1, calcularíamos la desviación típica así:

    xi

    Ni

    xi*ni

    (xi-x)^2

    (xi-x)^2*ni

    1

    2

    2

    17,9776

    35,9552

    2

    3

    6

    10,4976

    31,4928

    3

    3

    9

    5,0176

    15,0528

    4

    9

    36

    1,5376

    13,8384

    5

    12

    60

    0,0576

    0,6912

    6

    9

    54

    0,5776

    5,1984

    7

    6

    42

    3,0976

    18,5856

    8

    3

    24

    7,6176

    22,8528

    9

    1

    9

    14,1376

    14,1376

    10

    2

    20

    22,6576

    45,3152

    TOTALES

    50

    262

    83,176

    203,12

    Con lo que se tiene: y por lo tanto

    Otros estadísticos de dispersión que también se utilizan frecuentemente son:

    La desviación media que es el promedio de los valores absolutos de las diferencias entre cada observación y la mediana de éstas. En la fórmula anterior hemos de sustituir la media por la mediana.

    El coeficiente que mide la dispersión relativa( es diferente medir la dispersión en medidas dadas en cm que si lo estan en kilometros) es el coeficiente de Pearson.

    El recorrido(o RANGO) R de las observaciones en un conjunto de datos es la diferencia entre el valor más grande y el más pequeño del conjunto.

    La desviación media se calcula comparando los datos con la media aritmética de éstos. Pero para hacer esta comparación tomaremos el valor absoluto de las diferencias y posteriormente la media. Es decir:

  •  

    GráficasPágina inicialRegresión