Estadística
Una de las más bellas leyendas de las mil y una noches cuenta que el califa Harún al Rasid salía disfrazado de mercader de su palacio para conocer la opinión de los habitantes de Bagdad. También el escritor estadounidense Mark Twain, muchos años después, hace del príncipe Eduardo un mendigo, que de este modo llegará a conocer cómo vivían y pensaban sus súbditos. Hoy, a poco del siglo XXI, los métodos han cambiado de manera radical y en la actualidad la importancia de la estadística es enorme: los métodos estadísticos son fundamentales para estimar, planificar, predecir y decidir en problemas relacionados con la política, la sociología, la investigación, la industria, la economía y una larga lista de actividades.
Un poco de historia:
El estudio estadístico más antiguo que se conoce se realizó en China cuando el emperador Yao encargó la confección de un censo del imperio. Esto sucedía a finales del tercer milenio antes de Cristo. También se tienen noticias de que en el antiguo Egipto se realizaron estadísticas y trabajos censales de tipo agrícola. Otro censo famoso, según relataba el historiador Tácito, fue el que recogía las propiedades y los ejércitos del imperio de Roma en tiempos del emperador Octavio Augusto.
No obstante, hemos de esperar algún tiempo hasta que aparezcan los trabajos de John Graunt, un comerciante de mercería inglés, considerado como el precursor de la actual estadística. Graunt, entre los años 1604 y 1661, realizó un estudio sobre los nacimientos y defunciones de Londres y, a partir de los datos obtenidos, extrajo consecuencias formulando leyes demográficas y comportamientos sociológicos.
Treinta años más tarde publica el astrónomo Halley un estudio sobre las tasas de mortalidad, sentándose las bases de los estudios sobre esperanza de vida.
Presentación de datos en tablas
En un Instituto el Departamento de Orientación realiza una encuesta entre los estudiantes al comienzo del curso.
A instancias del seminario de E. F. se le preguntó a los alumnos que indicaran el deporte que más practicaban, obteniéndose los siguientes resultados :
El de Matemáticas sugirió que se les pasara una prueba de 10 preguntas, para evaluar la capacidad de intuición espacial, a los alumnos de 3º de E.S.O. Los resultados fueron:
El Seminario de Lengua propuso que se les preguntara a los alumnos de 4º de E.S.O. cuántos libros habían leído durante el curso anterior, los datos obtenidos fueron:
Si se observa con detalle, se comprueba que hay una variación grande en el número de libros leídos: desde 0 hasta 19. Si exponemos los datos en una tabla como la anterior, no conseguiremos que el lector los interprete sin realizar un esfuerzo.
En los primeros ejemplos hemos presentado las respuestas en una tabla sin ninguna dificultad. En el último se nos presenta el problema de que hay muchos valores distintos. En estos casos, es conveniente agrupar los datos en intervalos. Vamos a realizar algunas clasificaciones, en intervalos diferentes, del ejemplo considerado:
Normas, no necesariamente estrictas, para realizar esta operación:
- Es costumbre tomar los intervalos con la misma amplitud.
- La amplitud suele ser múltiplo de los números 2,3,5,10 y 20.
- El número de intervalos no ha de ser menor que 5 ni mayor que 15 (estos límites varían según los autores).
- No debe haber muchos intervalos con pocos individuos, ni con demasiados (relativamente hablando).
Discute en grupo cuál de las tres tablas te parece la más indicada.
Observarás que si damos a conocer los datos en una tabla, por ejemplo la 1, sólo informaremos de que hay 24 individuos que leyeron entre 9 y 11 libros anuales, pero se desconocerá el número de libros que, exactamente, leyó cada uno de ellos. Es decir, al agrupar se pierde información, aunque la lectura fácil de la tabla, su comprensión y la manipulación más cómoda de los datos, hace que dicha pérdida sea poco significativa.

Agrupa los datos en intervalos.
Terminología estadística
La estadística no siempre estudia a colectivos humanos. Puede ser interesante realizar trabajos estadísticos acerca de la producción de las fincas de una determinada comarca, de la resistencia de un tipo de vigas para la construcción o de la vida media de diferentes modelos de vehículos.
Por tradición se llama población al conjunto de personas, o de cosas, de que es objeto una estadística.
Hay que tener presente que una misma población puede ser sometida a distintas estadísticas: del conjunto de vehículos vendidos anualmente por un concesionario de una marca nos pueden interesar varias características como el color, los años de financiación o la edad del comprador.
A estas características las llamaremos caracteres o variables estadísticas.
Los años de financiación y la edad del comprador se describen mediante números, diremos que son variables cuantitativas.
El color es una cualidad que expresa sus modalidades mediante palabras como verde, rojo..., diremos que se trata de una variable cualitativa.
Conviene no confundir una variable cuantitativa (X) con la frecuencia (N) con que se dan sus valores o modalidades.
Número de horas perdidas por huelgas en las empresas de más de 50 trabajadores.
Número de tarjetas amarillas sacadas en cada partido de una jornada futbolística.
Estudio del turismo de un año por nacionalidades.Número de hermanos de los estudiantes de una clase.
Velocidad de saque de un jugador de tenis.Representación gráfica de datos estadísticos
Las gráficas tienen la ventaja de que dan una información visual que resulta más cómoda que la lectura de una tabla. Veamos a continuación cómo se realizan y las características que presentan.
Diagramas de sectores:
Se trata de asignar a cada modalidad un sector circular que sea directamente proporcional a su frecuencia.
Si 108 alumnos prefieren el Fútbol, de un total de 567, el sector asignado a este deporte vendrá dado por la proporción
x/360 = 108/567; x = 69º, aproximadamente,
De manera análoga se calculan los demás sectores.
Este tipo de representación es muy utilizada en variables cualitativas.
Pictogramas:
Es otra forma habitual de representación que anticipamos en el tema de proporcionalidad. Se trata de dibujar un objeto característico de la variable, de manera que los tamaños sean directamente proporcionales a las frecuencias: en el dibujo A la altura es proporcional a la frecuencia; en el B lo es el área.


Diagramas de barras:
La altura de las barras es directamente
proporcional
a la frecuencia.
Algunas distribuciones suelen clasificarse en virtud de la forma que adopta su representación por barras:

Son particularmente interesantes las distribuciones cuyo diagrama se asemeja a la campana normal, pues son numerosos los ejemplos en los que la mayoría de la población toma valores centrales, siendo pocos los valores extremos.
Número de suspensos.
Número de hijos por familia.Tamaño del pie de los estudiantes de la clase.
Altura de las mujeres de 3º de E.S.O.Duración de una pila o batería.
Polígonos de frecuencias:
Son similares en su fundamento a los
diagramas de barras y suelen utilizarse
para representar la evolución de un
fenómeno a lo largo del tiempo o de
una serie de etapas. También son muy
cómodos para realizar comparaciones
de dos poblaciones en un mismo
gráfico:

¡Ojo con los gráficos!
En el capítulo de funciones comprobamos que tomando una escala inadecuada se puede desvirtuar la imagen del crecimiento real de un fenómeno. Algunas gráficas estadísticas también pueden ser desvirtuadas como ocurría con las funciones si la elección de la escala es exagerada o disminuida. Para evitar el problema algunas personas adoptan la norma de que la altura máxima sea el 69% de la anchura de la gráfica.
Diagramas de tronco:
En algunos casos resulta conveniente emplear este tipo de representación de datos. Para ver en que consiste vamos a considerar los siguientes ejemplos:
A un tenista se le mide la velocidad de los primeros 50 saques válidos en un partido de competición. Las velocidades se muestran en la tabla siguiente (En Km/h):
Una primera inspección visual muestra que los datos
varían entre ciento veinte y ciento noventa
aproximadamente. Como es lógico, las velocidades
menores corresponden a un segundo servicio. Si miramos
con más detalle observamos que el saque menos veloz fue
de 127 Km/h y el más rápido de 193 Km/h.
El diagrama de tronco presenta los datos anteriores de manera más clara y legible y se realiza como se muestra a continuación:
El doce de la columna tronco señala los saques realizados a
una velocidad mayor o igual que 120 y menor que 130.
Mirando la columna correspondiente a hojas, vemos que sólo
se sacó una vez en esa banda y que la velocidad fue de 127
Km/h.
La siguiente fila indica que se realizaron tres saques con velocidades mayores o iguales a 130 y menores que 140. En concreto fueron un saque a 136 Km/h y dos a 138 Km/h.
El resto de la tabla se interpreta de igual manera.
Estos diagramas tienen la ventaja de que permiten conocer con detalle los valores registrados y presentan, además, el aspecto de un diagrama de barras.
A veces no interesa reseñar en el diagrama la totalidad de las
cifras, sólo se apuntan las más significativas con el objeto de
hacer más legible el diagrama:
6685, 5203, 4481, 8311, 3975, 4842, 11599, 6251, 4336,
3830, 4119, 5276, 11708, 8889, 9345, 6468.
Adoptaremos la norma de no escribir más de una cifra en la columna de hojas para hacer cómoda su lectura.
MEDIDAS DE POSICIÓN CENTRAL
La media
En un circuito se mide la rapidez con la que un determinado piloto negocia una de sus curvas. Después de contabilizar su paso las primeras 24 veces, se obtienen las siguientes velocidades (En Km/h):
La media o promedio, que notaremos por
, se calcula
sumando todos los valores obtenidos y dividiendo esta
cantidad entre el número total N de valores contabilizados:
S = 177 + 180 + 180 + 174 + ....... + 182 + 184 = 4321.
= S/N = 4321 / 24 = 180'04
La mayoría de las veces se presentan los datos en una tabla:
Esto supone una ventaja para su cálculo pues no será necesario sumar
un valor cada vez que aparezca: se multiplican los valores por sus
frecuencias (columna x*n) y al sumar los resultados obtenemos la
suma total S.
La media es la suma de la columna x·n, dividida por el total:
;
= 4321/24
La letra griega
(sigma
mayúscula) indica la suma de los valores x*n; N
representa el total de veces que medimos su paso por la curva.
Imaginemos que la información anterior nos la hubieran presentado agrupando los datos por intervalos:
Como decíamos al principio, si nos dan los datos en intervalos estamos
perdiendo información: sólo sabremos que realizó dos pases con una
velocidad comprendida entre 171 y 173, pero no conoceremos la
velocidad real a la que lo hizo. Lo que haremos en estos casos, es
suponer que dicha velocidad fue de 172, que es el centro o marca de
clase del intervalo. La misma operación se realiza con el resto de
intervalos.
Si la elección de intervalos ha sido buena, la media estimada tendrá una diferencia insignificante con la media real.
En este caso,
=
4328/24 = 180'33
Concretando:
Dicho parámetro resume de alguna manera el comportamiento de la población puesto que cuanto más altos (bajos) son los valores observados, mas alta (baja) es la media.
Otras características de la media:
a) Es fácil de calcular.
b) A partir de ella, conociendo el tamaño de la población, se puede calcular el total:c) Cualquier variación en un dato influye en la media, es decir, la media depende de todas las observaciones y utiliza toda la información recogida. Lo anterior suele ser una ventaja, aunque algunas veces se presenta el inconveniente de que un valor raro, muy grande o pequeño, influye mucho en ella y desvirtúa el comportamiento general:
d) Cuando los valores de una distribución están concentrados en los extremos, la media no da, por sí sola, una imagen real del comportamiento de la población.
0,10,10,0,10,0,0,0,10 y 10.
La media, 5, por sí sola, no informa de los comportamientos radicales de estos jugadores.
e) Dos poblaciones con igual media no tienen por que tener un comportamiento similar:f) La media no tiene por que ser un valor observable:
Medias compensadas
En un Instituto, el curso de 2º de Bachillerato se ha dividido en dos grupos : A y B.
En la clase de 2º A, con 30 alumnos, se ha obtenido una nota media en Lengua de 6'3. En 2º B, con 19 alumnos, la media fue 5'9. ¿Cuál es la nota media de la asignatura en el curso de 2º?
En total hay 49 alumnos, la media vendrá dada por la suma de todas sus notas, dividida entre 49.
Como la media de 2º A es 6'3, la suma de las notas correspondientes a ese curso es 6'3 x 30 = 189. De manera análoga, la suma de las notas de 2º B vale 5'9 x 19 = 112'1.
La suma total de notas es 189 + 112'1 = 301'1
La nota media es 301'1 : 49 = 6'14, aproximadamente.
Hemos visto que, en determinados casos, la media no resume muy bien el comportamiento de una población. A continuación vamos a ver otra forma de describirla mediante un número al que no le afecta la presencia de algún valor grande o pequeño.
La mediana
Al primer ejercicio de una oposición, para optar a seis puestos de trabajo en una
empresa, se presentan cuarenta y seis aspirantes. El tribunal decide eliminar al
50% en el primer ejercicio para que su labor de selección resulte más cómoda en
las siguientes pruebas.
Si las notas obtenidas, puntuadas de 0 a 20, fueron las que se indican en el recuadro, ¿a partir de que puntuación se superaría el ejercicio?.
Si contamos los 23 opositores que tienen peor nota, vemos que el listón del 50% lo marca la nota 13'4. Como es obvio, el tribunal no podrá promocionar al 50% exacto y tendrá que decidir si aprueba a partir de 13'4 o de 13'6.¿Se aprueba sacando una nota superior a la media?
Diremos que 13'4 es la mediana, que notaremos por Me, de la distribución de notas.
Consideremos a continuación la distribución de las tallas de 30 alumnos de un curso de 1º que, una vez ordenadas, son las que siguen: 160, 162, 162, 166, 167, 168, 168, 170, 171, 175, 175, 177,177, 178, 178 // 179, 179, 179, 180, 181, 182, 182, 183, 183, 183, 184, 185, 185, 187, 189.
En este caso, el corte del 50% se da entre los valores 178 y 179. Diremos, cuando así ocurra, que la mediana es el valor intermedio entre ambos: 178'5: por debajo de esta talla encontramos a quince alumnos que corresponden al 50% de la población, y por encima de él al otro 50%.
Estimación gráfica de la mediana:
Supongamos que los datos anteriores nos los hubiesen dado a conocer en una tabla:
N representa la frecuencia acumulada, es decir, el número de individuos cuya altura es menor o igual que el extremo superior del intervalo.
Realizamos el histograma correspondiente a la tabla anterior y procedemos como se sugiere en el gráfico:
Observa que la Me se obtiene mediante una estimación visual, pero la diferencia en cm con la mediana real es poco significativa. Se puede obtener mayor precisión si trabajamos con papel milimetrado.

Otra forma de estimar la mediana sin tener que dibujar el histograma es la siguiente:
a) Se localizan los intervalos cuya frecuencia acumulada es más próxima a 15 y se establece la siguiente proporción:

Debajo de 175 hay 9 individuos
Debajo de la Me hay 15 individuos
Debajo de 180 hay 18 individuos:
![]()
b) Despejando obtenemos una estimación de 178'3 aproximadamente.
En realidad, lo que hemos hecho ha sido interpolar: hallar el valor de x correspondiente a y =15, de la recta que pasa por los puntos (175,9) y (180,18)

Los datos escritos fueron:
¿Se puede calcular la altura mediana sabiendo que en la clase hay 28 personas?
Características de la mediana:
a) No es necesario para su cálculo conocer el valor de todas las observaciones. No se utiliza toda la información recogida.b) No se calcula mediante una expresión matemática.(Conociendo las medianas de dos grupos no se puede determinar la conjunta).
c) Es independiente de los valores raros o extremos:337, 330, 345, 340, 335, 321, 329, 360, 333, 346, 331, 375, 335, 332, 339 y 339.
Determina el peso asignado a la substancia.
Cuartiles
Otro investigador utiliza el método consistente en ordenar las pesadas, despreciar el 25% de las más bajas y el 25% de las más altas, evitando de éste modo el problema de las pesadas mal hechas. Con el 50% central calcula la media.
Llamaremos primer cuartil, C1, al valor que deja por debajo al 25% por ciento de la población. Al número que deja por encima el 25% de la misma, le llamaremos tercer cuartil y lo escribiremos como C3. El cálculo gráfico de los cuartiles se realiza igual que el de la mediana con sólo cambiar el porcentaje de referencia.
A la diferencia C3 - C1 le llamaremos rango intercuartílico.
Percentiles
En algunas ocasiones el rango de valores que toma una variable es muy amplio y el hecho de que un valor se aleje de la mediana no supone ninguna anormalidad. Otro tipo de medidas, como son los percentiles, están más indicados para comparar el comportamiento de un individuo frente al del colectivo.
En el siguiente gráfico tienes los pesos significativos de las niñas hasta los dos años de edad:

A dichos limites se les conoce como percentil 3 y percentil 97 respectivamente.
La moda
En el ejemplo de los deportes más practicados la moda es el Fútbol, en el test de intuición espacial la moda sería obtener una puntuación de 6.
Cuando trabajemos con intervalos hablaremos de intervalo modal: en el ejemplo de los libros leídos, si nos dan la información mediante la tabla 1, la moda es leer entre 6 y 8 libros al año.
MEDIDAS DE DISPERSIÓN
Las marcas obtenidas por dos atletas de decathlon se dan en la siguiente tabla:

Es obvio que el atleta A es más regular que el B, que compensa las malas actuaciones en las pruebas de lanzamientos con su mayor velocidad. La cuestión que surge es cómo medir las irregularidades, o en otros términos, cómo expresar mediante un número la variabilidad o dispersión de unos datos.
La puntuación media obtenida por el atleta A fue de 801.8 puntos y la del B de 801.6
Observemos los datos siguientes:

Los números que señalan la variación de los datos son las diferencias respecto a la media: independientemente del signo, cuanto mayores sean más irregularidad indican.
Interesa resumir todas las variaciones en un sólo número. Si calculamos la media de las mismas, obtendremos que, al sumar, las que tienen signo + se compensan con las de signo - y la suma se anula perdiéndose toda la información (compruébalo).
Caben dos opciones:
a) Considerar positivas todas las diferencias, que llamaremos desviaciones, calculando a continuación el promedio de las mismas:

Al número así obtenido se le llama Desviación media y presenta los inconvenientes de la media.
b) Elevar al cuadrado todas las diferencias, calcular el promedio de los cuadrados y, para compensar de alguna manera, extraer la raíz cuadrada del valor obtenido. Obsérvese que al elevar al cuadrado potenciamos las desviaciones mayores, que proceden de los valores extremos, y damos menos relevancia a las pequeñas. La desviación media otorgaba la misma importancia a todas las desviaciones resaltando menos la presencia de valores alejados del promedio.

Al valor promedio, así obtenido, se le llama Varianza de
la distribución y se representa por V. A la raíz de la
varianza se la llama Desviación típica y se nota como
(la
letra griega sigma en minúscula).
Veamos la forma de proceder para calcular al desviación típica cuando los datos vienen presentados en una tabla. Consideremos la estadística de los libros leídos durante el curso y añadamos a la tabla inicial los cálculos puestos en rojo:

Varianza: 2279'88/122=18.68
Desviación típica: 4'32
Podemos resumir la fórmula de la varianza mediante la expresión:
.
Se puede demostrar que la varianza también se calcula mediante esta otra expresión:![]()
Es menos pesado utilizar la segunda fórmula, para ello la tabla se confecciona añadiendo la siguiente columna:
Varianza: =9866/122 - 62'09=19'76
Desviación típica: 4'44
Observarás que los valores no coinciden con los anteriores. Este hecho se debe a que hemos truncado, en el primer caso, los números a dos decimales y se ha producido un pequeño error como consecuencia del truncamiento.

¿Son muy diferentes las notas medias de las evaluaciones?
¿Dónde hubo mayor desviación típica?
Cálculos estadísticos con ayuda de la calculadora
Comenzaremos borrando los números de la memoria pulsando la tecla
, a
continuación ponemos la calculadora en modo estadístico pulsando las teclas
![]()
.
Ahora sólo tenemos que escribir los datos en la calculadora pulsando la tecla
cada
vez que se introduzca uno.
Una vez realizado lo anterior obtendremos los cálculos al pulsar la función estadística deseada:
Cálculo de la media.
Cálculo de la desviación típica.
![]()
Suma de los datos.![]()
Suma de los cuadrados de los datos.![]()
Coeficiente de variación
Juan mide el perímetro del instituto, de 420 m de longitud, equivocándose en 2'2 m. Antonio mide el largo de la clase, de 830 cm, equivocándose en 5 cm. A la hora de comparar las habilidades midiendo, se ha de tener en cuenta el error cometido en relación al tamaño de lo medido. Para ello se utiliza el llamado error relativo: Juan se equivocó 2'2 m sobre 420 m y Antonio en 5 cm sobre 830 cm.
![]()
Si multiplicamos el error relativo por cien tendremos, en %, el grado de equivocación de cada uno: Juan se equivocó en torno al 5'23% y Antonio en el 2'4%.
Algo parecido ocurre cuando queremos comparar la dispersión de los datos de dos poblaciones diferentes. Recordemos a nuestro atleta B que tenía una media de 801.6 puntos por prueba y una desviación típica de 75.8; estaba claro que su comportamiento era más irregular que el del atleta A, que presentaba una media similar con una desviación típica notablemente menor.
Deseamos comparar de nuevo la regularidad de B con la de otro atleta C
de menor categoría, cuya media por prueba es de 750 puntos y su desviación
típica de 60.3. Para esto utilizamos el coeficiente de variación que se define
como ![]()
En el caso de B vale
y en el de C
B
presenta una irregularidad del 9.45% y C de 8.04%
a) Las diferencias entre sueldos en la factoría americana y las diferencias entre sueldos en la portuguesa son, proporcionalmente, similares.
b) Las diferencias en USA son casi el triple que en Portugal.c) Las diferencias en USA son, prácticamente, el doble que en Portugal.
Teorema de Chevichev
Con anterioridad hablamos de la importancia de las distribuciones en forma de campana, en particular de las que no presentaban una asimetría destacable: las distribuciones normales, que suelen ser las más frecuentes. La desviación típica tiene el inconveniente de que es menos intuitiva que la desviación media, a pesar de ello es más utilizada. Existen algunas razones que lo justifican, este teorema es una de ellas porque permite, sabiendo la media y la desviación típica, conocer a cierta escala el comportamiento de sus individuos:
Las estadísticas relativas al número de libros leídos y la prueba de razonamiento espacial se distribuían en forma normal.
En la primera, la media vale 7'885 y la desviación típica 4'324, si consideramos el intervalo
=(3'561,12'209), observamos que contiene a 79 alumnos, el 66%, cuya lectura de libros se halla
entre los dos valores.
En el segundo caso, la media es 5'591 y la desviación típica 2'014.
=(3'577,7'606). El número
de alumnos cuya capacidad de razonamiento espacial se encuentra entre los valores del intervalo es 81,
aproximadamente el 67%.
El hecho de que ambos porcentajes sean parecidos no es casualidad, tal y como afirma el conocido Teorema de Chevichev:
En una distribución normal:
Aproximadamente el 68% de la población está dentro de los valores del intervaloAproximadamente el 95% se halla en
![]()
Muestreo
a) Un periódico encarga un trabajo sobre la valoración que hacen las personas en edad electoral de los principales líderes políticos. La población que comprende la estadística es de enorme tamaño y ello hace imposible, por razones de tiempo, personal y costo, que se pueda realizar una encuesta a cada uno de los electores.
b) Unos laboratorios ensayan una nueva vacuna. El director de producto desea realizar un estudio con las primeras unidades elaboradas, para comprobar a que temperatura de almacenamiento comienzan a perder sus propiedades. En este caso, cada prueba realizada supone la destrucción del producto, con su correspondiente coste.
En situaciones como las anteriores se selecciona una parte de la población, que sea representativa de la misma, a la que llamaremos MUESTRA, y se realiza el estudio sobre ella, generalizando los resultados a la totalidad de la población.
La importancia que tiene el tomar una muestra adecuada se pone de manifiesto en este conocido caso:
En 1936, con motivo de las elecciones presidenciales americanas, la revista Literary Digest realizó entre sus lectores 2500000 encuestas y de ellas se desprendía la victoria, por clara mayoría, del candidato Landon. Por otro lado, Gallup, Crossley y Roper, realizando tan sólo 5000 entrevistas, acertaban al pronosticar la reelección de Roosvelt.
¿Te parece correcta la afirmación?
La pregunta inmediata es: ¿Cómo elegir una muestra adecuada sin caer en errores subjetivos o de otro tipo?La respuesta no es sencilla, pues depende de cada caso y se suelen utilizar técnicas que rebasan los conocimientos de este curso. No obstante, vamos a comentar dos formas de realizar un muestreo:
Muestra aleatoria
La tabla adjunta es una tabla de números aleatorios obtenida por
ordenador. Veamos cómo utilizarla para obtener una muestra de los
propietarios de una urbanización de 15 bloques, con cinco plantas por
bloque y cuatro pisos por planta.
En total hay 300 viviendas que podemos numerar de 0 a 299, comenzando por la letra A de la primera planta del primer bloque y terminando por la letra D de la quinta planta del bloque nº 15.
Si queremos seleccionar 40 propietarios al azar, procederemos como sigue:
Si el primer número comienza por cero, uno o dos, los tres primeros dígitos del número indicarán el propietario elegido.
Si no ocurre así, miramos si el segundo dígito cumple esa condición y en ese caso se elige el piso que corresponde a los dígitos segundo, tercero y cuarto. Si el segundo dígito fuese mayor que dos, miramos el tercero y vemos si la cumple, siendo en tal caso los tres últimos dígitos los que señalan el propietario. De fallar el tercero, se pasa al número siguiente.
También se puede hacer comenzando por la primera columna y señalando los primeros 40 números menores que 300.Los propietarios elegidos se ordenan y se comprueba si alguno está repetido.
Muestras
estratificadas
En sondeos de carácter político, la adhesión a un determinado partido depende en cierta manera de la categoría social y cultural en la que se enmarca cada individuo. Los censos recogen datos como la profesión, nivel de estudios etc, que permiten establecer la proporción, dentro de determinada población, de tales categorías. La muestra ha de ser tal que cada categoría mantenga dentro de ella el mismo porcentaje que en el total de la población.
Comparar los cuestionarios elaborados y los resultados obtenidos por los distintos grupos.