jueves, 7 de noviembre de 2013

El chino cudeiro

PISA es una evaluación internacional de una complejidad enorme, pero que tiene la ventaja de ser extremadamente transparente, ya que publica prácticamente todo: buena parte de las preguntas, estudios muy extensos y detallados, los métodos utilizados y las bases de datos completas que utilizan. Todo ello se puede encontrar aquí. La evaluación se pasa cada tres años desde su primera edición en 2000, y estamos a la espera de que se publiquen los datos de su cuarta entrega, la correspondiente a 2012 (saldrá a principios de diciembre de 2013).
Desde hace unos cuantos años, trabajo con los datos de PISA. La primera edición de la cual descargué las bases de datos fue la de 2003, y desde entonces he ido manejando los datos tanto de la anterior (2000) como de las siguientes, según han ido saliendo. Como algunas tablas son bastante grandes, las suelo cargar en una base de datos (habitualmente MySQL) para comenzar a utilizarlas. Cuando estuvieron disponibles las bases de datos de 2009, ya tenía creadas todas las anteriores, e intenté aprovechar el diseño previo para la nueva base de datos de 2009, ya que los campos no varían mucho.
La tabla grande de 2009 (la que tiene los datos principales de los alumnos) tiene casi medio millón de registros y más de 400 campos, unas dimensiones considerables, y tarda bastante en migrar. Pueden imaginar mi cabreo cuando, pasados cerca del 80% de los datos, el programa da un error: un valor es demasiado alto para el rango reservado en la base de datos. Después de investigar un rato, el error venía de que un alumno había obtenido en la escala de matemáticas más de 1000 puntos PISA, mientras que en mi base de datos tenía reservado sólo espacio para números de tres cifras (entre 0 y 999). Eso me obligó a modificar el tamaño de más de treinta campos en la base de datos y otras modificaciones menores en el programa de migración, y comenzar de nuevo el proceso. Y, como el alumno en cuestión vivía en Shanghai, pues se quedó con el mote de chino cudeiro.
Además de su rendimiento en Matemáticas, podemos saber por los datos de PISA que el chino cudeiro es un chaval que va a una escuela de Secundaria básica en Shanghai, China, que cursa noveno grado (el equivalente a nuestro 3º de ESO: sí, va un curso retrasado, probablemente porque en China ingresen en el curso por la edad que tienen al comenzarlo, y no por el año natural, como en España), que nació en octubre de 1993, que cursó más de un año de educación infantil, comenzó la Primaria con seis años, que vive en casa con sus padres y, al menos, un abuelo, pero que -muy probablemente- no tiene hermanos. Su madre estudió hasta el Bachillerato y trabaja a tiempo completo en una oficina, mientras que el padre obtuvo una licenciatura y tiene un alto cargo en una gran empresa. Ambos nacieron en China (en la propia Shanghai), y hablan chino en casa. En su hogar dispone de los recursos educativos y los electrodomésticos típicos de cualquier hogar de clase media occidental (libros de literatura, poesía, de referencia técnica, diccionario, y algunas obras de arte; también un ordenador, habitación propia,lavaplatos, DVD, aspiradora, cámara digital y exprimidora) salvo internet. Además, en casa hay dos móviles, un televisor, un coche, y sólo tienen un baño. No hay demasiados libros (entre 25 y 100), pero el chino cudeiro lee al menos dos horas diarias, pues es uno de sus pasatiempos favoritos. Lee sobre todo libros de no ficción, literatura, poesía y periódicos, pero casi nunca cómics o revistas. No se concecta a internet, ni en casa (que no tiene) ni fuera de casa, por lo que no chatea ni usa el correo electrónico: sólo lo utiliza en la biblioteca del colegio para cuestiones relacionadas con el estudio. Tiene estrategias de estudio razonables, pero no especialmente buenas y, como cualquier chaval, a veces no entiende las cosas y se atasca en el estudio. Tiene seis clases semanales de matemáticas en el colegio, con una duración de 40 minutos cada una. En una semana tiene en total 38 clases (unas 25 horas semanales), y no tiene clases de refuerzo ni dentro ni fuera de la escuela. Se pasa, eso sí, todos los días por la biblioteca, para estudiar y hacer los deberes, y alguna vez simplemente para leer. Para estudiar, suele hacer resúmenes y leerlos varias veces, pero no copia, ni subraya, ni lee en voz alta. Estudia matemáticas cuatro horas a la semana, pero no sabemos cuánto dedica al resto de asignaturas. Sus resultados son excepcionales en Matemáticas, pero distan mucho de ser brillantes en Lectura. Aparentemente, un chaval como otro buen estudiante cualquiera.
Las escalas de rendimiento en PISA tienen una media de 500 y una desviación típica de 100, por lo que para que un alumno obtuviese más de 1000 puntos en PISA tendría que obtener un rendimiento cinco desviaciones típicas por encima de la media. Asumiendo que los resultados de PISA se distribuyen normalmente, la probabilidad de encontrar un alumno por encima de los 1000 puntos es de 2,87e-07 (0,000000287). Para que me entienda todo el mundo, uno de cada 3,5 millones de alumnos. Tenía cierta razón en suponer que ningún alumno pasaría de los 1000 puntos. Para que os hagáis una idea de la distancia que media entre el chino cudeiro y la media de los países desarrollados, aquí os dejo el siguiente gráfico:
Las barras azules representan la distribución real de los alumnos de países de la OCDE en Matemáticas (PV1MATH) en 2009, la línea en forma de campana de Gauss es la distribución teórica que utiliza PISA (media 500 y desviación típica 100, asumiendo normalidad), y la línea amarilla de la derecha es la puntuación del chino cudeiro en la escala. En realidad, PISA no obtiene las puntuaciones reales de los alumnos -no es un examen-, sino las "puntuaciones poblacionales", es decir, no está hecha para valorar la capacidad del individuo sino para conocer los resultados de una población, por lo que no sabemos la puntuación real de nuestro chino cudeiro, sino que es una aproximación algo inexacta. Pero, para este blog y para el juego que nos traemos entre manos, podemos darla por válida. El resto de distribuciones y datos empleados en esta anotación sí que son válidos incluso siguiendo criterios académicos, salvo que, por simplificar, se usa sólo la primera escala de Matemáticas (PV1MATH), y no las cinco que usa PISA.
Por tanto, tendríamos una posibilidad entre 3,5 millones de encontrar un estudiante de este nivel de excelencia en los países de la OCDE. Pero es que nuestro chino cudeiro no estudia en un país de la OCDE, sino que estudia en Shanghai, que tiene un sistema educativo algo particular y donde se hace especial hincapié en el aprendizaje de las Matemáticas. En el siguiente gráfico, que mantiene la misma escala que el anterior, podemos ver la distribución real de los alumnos españoles (barras azules) y de los chinos (barras amarillas) en Matemáticas en PISA 2009, además de la distribución teórica media de PISA y la situación del chino cudeiro (las frecuencias de los gráficos han sido calculadas simulando poblaciones iguales para poder establecer comparaciones).
El rendimiento del chino cudeiro sigue siendo excepcional, pero ya parece más probable encontrar un alumno así. De hecho, para los parámetros teóricos de la distribución de Shanghai, la probabilidad de encontrar un alumno por encima de los 1000 puntos en Matemáticas es de 4.95e-05 (0,0000495), que puede parecer todavía muy pequeña, pero ya es razonable: más o menos, uno de cada 20.000 alumnos. Para que se hagan una idea, la probabilidad de encontrar un alumno que estudie en el sistema educativo español por encima de los 1000 puntos en Matemáticas es de 2,36e-08 (0,0000000236), uno de cada 42 millones. Creo que no existe tanto español como para tener una sola posibilidad de que eso ocurra.
Pero no acaba aqui la cosa. El chino cudeiro no estudia sólo en un sistema educativo, sino en un centro concreto. Uno bastante bueno, pero ni siquiera es el que mejores resultados obtiene en Shanghai, donde hay un puñado de escuelas con niveles similares. En el siguiente gráfico se pueden ver las distribuciones teóricas -las reales, al haber muy pocos alumnos, están bastante dispersas- del centro típico de la OCDE, del mejor centro que tenemos en España y del centro donde estudia el chino cudeiro.
En el gráfico se ve que el chino cudeiro sigue siendo excepcional, pero se entiende mejor que en un centro con una media en Matemáticas por encima de 700 puntos exista la posibilidad de encontrar a un alumno así. De hecho, la probabilidad de encontrar un alumno por encima de los 1000 puntos en un centro con la distribución teórica del suyo es ya de sólo 0,00123, poco más o menos de uno cada 800 alumnos. Si además tenemos en cuenta que nada menos que 14 de los 152 centros (un 9%) evaluados en Shanghai tenían una media por encima de los 700 puntos, es fácil colegir que esta ciudad china tenía bastantes posibilidades de tener un alumno así. Los que no tenemos ninguna oportunidad somos nosotros: la probabilidad de que aparezca un alumno de ese nivel en el centro español con mejores resultados es de 6.23e-07 (0,000000623), una entre 1,6 millones de alumnos.
Hay quien todavía piensa que las grandes cabezas nacen, y que por tanto es una cuestión de suerte. Sin embargo, hoy sabemos que las grandes cabezas nacen en muchos sitios, pero que sólo en algunos se les da la oportunidad de aprovechar de verdad su potencial.