miércoles, 2 de noviembre de 2011

Paro, fracaso y PISA

El pasado día salieron los datos de la Encuesta de Población Activa que nos dejaban al borde de los cinco millones de parados o, dicho de otra manera, un 21,5% de las personas que quiere trabajar no encuentra quien lo contrate. Es una burrada sin parangón en el mundo al que queremos pertenecer, tanto en evolución como en números brutos. Algo estamos haciendo muy mal para estar así, pero como no sé demasiado del tema, me abstendré de comentarlo.
Lo que sí sé es que, tal y como se puede ver en esta tabla, la edad y el nivel de estudios son dos factores importantes de protección frente al paro.

Paro por edad y nivel de estudios (2011T3)
BajosMediosAltosTotal
Todos23,415,311,821,5
De 16 a 19 años57,317,7--56,0
De 20 a 24 años41,233,837,239,6
De 25 A 29 años26,819,421,424,2
De 30 a 34 años24,714,712,819,4
De 35 a 39 años22,513,111,117,6
De 40 a 44 años21,412,98,816,7
De 45 a 49 años18,412,36,514,6
De 50 a 54 años15,810,96,312,7
De 55 a 59 años14,811,27,112,3
De 60 a 64 años15,312,84,611,4
Fuente: Elaboración propia sobre datos de la EPA (2011T3).

Según avanzamos en edad el paro disminuye, muy rápidamente al principio, poco a poco más tarde. Probablemente no es la edad/experiencia la protectora, sino la duración del contrato y la indemnización aneja. Pero el nivel de estudios es evidente: a los 30-34 años el paro es el doble entre los que tienen estudios bajos (sin Secundaria superior, es decir, Bachillerato y FP media) que entre los que tienen estudios medios (Secundaria superior) o altos (universitarios o FP Superior); a los 40-45 años, los que tienen estudios medios tienen el doble de paro que los que tienen un nivel alto de estudios, y los que tienen estudios bajos tienen el triple de paro que estos últimos.
En general, uno de cada cuatro personas con nivel bajo de estudios está en paro, frente a una de cada siete con estudios medios y una de cada nueve con estudios altos. No es difícil ver que con una proporción menor de población con sin Secundaria superior no tendríamos el paro que tenemos.
Con los jóvenes (por debajo de los 30) el nivel de estudios no está funcionando tan bien. Aunque antes de los 25 hay una población de estudiantes que altera los resultados (el paro se calcula sobre población activa, y los estudiantes se consideran en general inactivos), en el tramo 25-29 apenas hay diferencias entre unos y otros. Puede ser porque no hay trabajo para ninguno de los que empiezan o por una perversión de los contratos temporales, no lo sé.
Quizás sea ilustrativo recordar cómo estábamos hace cinco años, cuando había quienes decían que estudiar en España no compensaba:

Paro por edad y nivel de estudios (2006T3)
BajosMediosAltosTodos
Todos10,07,75,88,1
De 16 a 19 años26,419,7--24,9
De 20 a 24 años14,414,414,814,5
De 25 a 29 años11,38,38,99,5
De 30 a 34 años10,96,95,77,8
De 35 a 39 años8,86,65,17,0
De 40 a 44 años8,75,84,06,5
De 45 a 49 años7,84,02,95,6
De 50 a 54 años7,55,92,45,9
De 55 a 59 años7,15,23,15,9
De 60 a 64 años5,54,52,44,8
Fuente: Elaboración propia sobre datos de la EPA (2006T3).

Para los que tienen cierta edad, el paro se ha duplicado para los que tienen un nivel alto de estudios, pero se ha multiplicado por 2,5 o por tres para los que tienen un nivel bajo de estudios. Uno de los datos evidentes de la comparación entre ambas tablas es que cada vez menos gente está protegida por contratos largos, especialmente entre los que tienen un bajo nivel de estudios. No sé si los sindicatos habrán tomado nota de esto.
Como el fracaso escolar en España es el responsable del nivel bajo de estudios de los jóvenes, me puse a cruzar datos de paro y fracaso por comunidades autónomas. Para empezar, una tabla de correlaciones:

Correlaciones entre los valores medios de las 17 CCAA (sin Ceuta y Melilla)
ParoParo joven (16-24 años)Fracaso escolarMatemáticas (PISA 2009)Media años estudio
Paro1,0000,8050,719-0,821-0,745
Paro joven (16-24 años)0,8051,0000,702-0,537-0,481
Fracaso escolar0,7190,7021,000-0,694-0,588
Matemáticas (PISA 2009)-0,821-0,537-0,6941,0000,607
Media años estudio-0,745-0,481-0.5880,6071,000
FUENTE: Elaboración propia sobre la EPA (2011T3) y PISA 2009.
Notas: El paro está calculado sobre la población activa, pero el paro juvenil sobre la población total. El fracaso es la media de los diez últimos años. La media de años de estudio está calculado sobre la población entre 25 y 64 años.

[Para el que no lo sepa, una correlación es un número entre -1 y 1 que indica el grado de asociación entre dos variables: si se acerca a cero, no están relacionadas; si se acerca a uno, están relacionadas de manera que a medida que crece una, crece la otra; y si se acerca a -1 están también relacionadas, pero de manera que si crece una la otra decrece].
Comencemos con una serie de notas técnicas para saber qué significa cada denominación. Para empezar, se han correlacionado los valores medios de cada variable en cada una de las comunidades autónomas, salvo Ceuta y Melilla, no tanto por su tamaño como por los valores extremos que suelen tener (lo que distorsiona no poco las correlaciones), y sin ponderación de ninguna clase. El paro es el porcentaje de población activa que no tiene trabajo, la definición habitual, pero para el paro juvenil se ha empleado el porcentaje de parados sobre la población general, ya que entre los 16 y los 24 la definición anterior deja fuera a los estudiantes, lo que baja todas las correlaciones y puede confundir. El fracaso escolar es la tasa bruta de población que no ha obtenido el título de ESO en los diez últimos años disponibles (2000-2009). Matemáticas es la puntuación media de las comunidades en PISA 2009 en la escala de Matemáticas: la utilizo porque es la más fiable y estable (por cierto, está la puntuación de las 17, aunque en las tres que se presentaron sin muestra ampliada la media es menos fiable). Por fin, la media de años de estudio es un indicador del nivel de estudios de la población adulta (30-64 años), y se ha calculado tras otorgar a cada nivel de estudios unos años estimados de escolarización (como aquí) y calculando posteriormente la media.
Pero vamos con la tabla. Lo primero que sorprende es que la correlación más alta (0,821) se de entre dos variables que no pueden estar relacionadas directamente: el paro de toda la población y los resultados de PISA en Matemáticas (que se miden en chavales que hoy tienen 17 años). La segunda se da entre el paro general y el paro juvenil (0,805, esperable, conociendo España) y la tercera entre la media de años de estudio (que es el nivel educativo medio de la población mayor de 30 años) y el paro (-0,745, también esperable, pues hemos visto en la primera tabla que a menor nivel de estudios, más paro) y a continuación una serie de correlaciones muy parecidas, entorno a 0,7, que son las del fracaso escolar con el paro, el paro joven y Matemáticas en PISA.
Vamos a analizar con cuidado la primera correlación (resultados en PISA, tasa de paro). En el siguiente gráfico se puede ver cómo se relacionan ambas variables por CCAA (no se incluyen en los cálculos Ceuta y Melilla, aunque sí están representadas en un color más claro):


Lo que el gráfico nos estaría diciendo es que el 67% de la tasa de paro podría explicarse por el nivel en PISA de sus jóvenes. Como tal explicación es un absurdo, habría que colegir que hay es una variable latente que explicaría ambas cosas: nivel de estudios de los jóvenes y tasa de paro. Una candidata podría ser el nivel de estudios general de la población en las CCAA, pero ya la incluimos en la tabla de correlaciones, y no parece dar la talla. Por tanto, habría otra variable latente, que probablemente incluría el nivel de estudios, el poder adquisitivo, valoración de la cultura, inclinación hacia el progreso a través del estudio, y un largo etcétera.
Probablemente algo de esto haya, lo que la gente tiene en la cabeza explica mucho de lo que pasa (porque está detrás de las decisiones que toma), y lo que la gente tiene en la cabeza tiene detrás una larga tradición histórica, a veces de siglos (creo que, en este sentido, hay una entidad geográfica, la comarca, que se desprecia sistemáticamente). Pero ¿tanto?
Evidentemente, aquí hay gato encerrado. Demasiadas veces los analistas nos quedamos en el nivel de análisis que nos dice lo que buscamos, y demasiadas veces los que estudian la educación desde una perspectiva sociológica se quedan aquí y no profundizan más porque han llegado donde esperaban. Unas veces puede estar justificado, otras no. Veamos el siguiente gráfico, una versión corregida del anterior:


Lo que hemos hecho ha sido dividir las comunidades españolas en dos, norte y sur, para ver cómo funciona el análisis. Lo que ocurre es que las CCAA del norte de España lo hacen mejor en PISA y tienen menos paro (en este caso, junto con Baleares: allí el verano sí ha funcionado, pero en el cuarto trimestre la cosa cambiará), y las del sur tienen más paro y lo hacen peor en PISA. En el círculo naranja están agrupadas las del norte de España, muy juntitas, y en ese grupo el nivel explicativo apenas supera el 20% y deja de ser significativo. Más sueltas están las del sur de España, cuya recta tiene una pendiente similar, pero su correlación es ridícula. Esto pasa con todas las variables educativas expuestas anteriormente. 
Por tanto, lo que tenemos son dos españas que explican un porcentaje muy alto de la correlación. Este fenómenos es muy habitual en las correlaciones de grupos: cuando separas varones y mujeres, escuela pública y privada, u otras tantas dualidades la supuesta relación entre variables se debilita o llega a desaparecer. En el caso analizado, si se introduce la variable norte-sur en la ecuación, la influencia de los datos de PISA se queda en la mitad y deja de ser significativa.
Por supuesto, en la diferencia entre las dos españas influye esa variable latente en la que incluimos todos los factores que citábamos antes, es algo que ya sabemos. Pero al incluirlo en una regresión podemos achacar a las comunidades lo que es un efecto que actúa a un nivel superior (y justificar con una regresión con muchos puntos lo que en realidad es básicamente una diferencia entre dos puntos, que se trata técnicamente de otra forma).
Nos encontramos otra vez con algo de lo que he hablado muy a menudo y que en el libro repito continuamente: muchas de las creencias que sostenemos en educación son fruto de análisis insuficientes, cuando no análisis de medio pelo o interesados. He visto papers íntegros basados en este fenómeno, donde se incluyen 15 o 20 regresiones de este tipo (que, como hemos visto, hablan siempre de lo mismo) y se permiten sacar conclusiones. El mismo Instituto de Evaluación cae continuamente en este tipo de análisis.
Nos queda el problema norte-sur, algo persistente en España, aunque se ha reducido mucho en las últimas décadas (eso es algo que se tiende a olvidar: aunque sigue habiendo diferencias, la magnitud de éstas no tiene nada que ver). Diferencias que no son fáciles de reducir por medio de políticas públicas (aunque sí de ampliar, que también se olvida), y que yo sepa la mejora se ha basado en una escuela fuerte (que ya no tenemos) y en la redistribución del gasto público.

Nota de disculpa: Entiendo que mucha gente no acabe de entender las regresiones (por favor, que alguien las incluya en el currículo común del Bachillerato), pero muchos de los argumentos y justificaciones que uno oye todos los días tienen a esta técnica detrás, aunque no de forma transparente. Es decir, es algo que nos afecta, lo queramos o no, en nuestra vida diaria, y es una carencia importante (y no soy el único que la nota) bastante generalizada en España, incluso entre los que tienen poder de decisión. Pero es que hay cosas que no se pueden explicar de otra forma.

15 comentarios:

  1. ¡Hola! Una pregunta técnica: en la última gráfica, para las comunidades del sur, ¿has probado a excluir Andalucía (que ese punto canta mucho)? Apuesto que el "nivel explicativo" del nivel de estudios con respecto al paro crecería mucho y tu conclusión sería un poco débil. Eso querría decir además que Andalucía es "especial". Quizás pase algo parecido con Baleares.

    Un saludo.

    Paco.

    ResponderEliminar
  2. Valorar en upnews.es : El pasado día salieron los datos de la Encuesta de Población Activa que nos dejaban al borde de los cinco millones de parado...

    ResponderEliminar
  3. No puede ser más sublime esta noticia de tu bitácora. Has dado en el clavo con argumentos sólidos. Enhorabuena.

    ResponderEliminar
  4. Estoy con Alejandro, enhorabuena por un artículo claro, y sobre todo, muy útil. Mañana se lo pondré a mis alumnos.

    Un saludo.

    ResponderEliminar
  5. Estupendo y esclarecedor análisis. Te cito en mi blog, si no hay inconveniente.
    Un abrazo.

    ResponderEliminar
  6. Interesante artículo. Sobre tu nota final: Ahora no sé si se dan las correlaciones. En mi época, por supuesto, sí se daban, pero también te tengo que decir que la mayoría de mis amigos con títulos universitarios han olvidado esas enseñanzas. Está muy bien que hayas incluido un repaso de los conceptos, a mí no me ha ido nada mal.

    ResponderEliminar
  7. El problema es que no puedes seleccionar la muestra, tal y como haces, porque al restringir el rango (limitar la variabilidad de las variables) estás disminuyendo artifactualmente las correlaciones. Consulta "range restriction" o similar. ¿Es igual la desviación típica en el grupo que has seleccionado (el norte de españa) que en la población de referencia? Si no es así, es el efecto de la restricción en el rango el que está provocando una reducción de las correlaciones.

    ResponderEliminar
  8. que la tasa de paro entre los que tenemos 25-29 años sea mayor con estudios superiores a con estudios medios es bien facil de explicar. Simplemente es que la gente que ha terminado sus licenciaturas en los ultimos 3 años tienen dicha edad y se encuentran en el mercado laboral sin ningún tipo de experiencia, por tanto es muy dificil de encontrar empleo.
    Sin embargo los que están en la misma situación pero con estudios medios terminaron en muchos casos los ciclos formativos hace 5 o 6 años y les ha dado tiempo de entrar en el mercado de trabajo.

    ResponderEliminar
  9. Buf, qué avalancha. Acostumbrado a mis pocas visitas, no esperaba que una anotación tan técnica llamara tanto la atención. Quizás no le dí mucha importancia a los primeros datos porque básicamente son los mismos que publiqué en 2009, y que entonces llamaron mucho la atención. Ahí tenéis, para los que lo demandan en menéame, los datos separados de FPGS y universidad. Poco después de ese artículo me despidieron, y le tengo algo de cariño.
    En fin, los datos del principio eran sólo para ilustrar lo que viene a continuación, sobre errores en los análisis y esas cosas, pero no viene mal recordar que sin el problema educativo en la última década quizás el paro no sería tan alto.

    Paco, no es lo mismo quitar Ceuta y Melilla (0,7% de la población) que Andalucía, que son más de un quinto. Aún así, si la quitas, lo único que cambia es que pierdes aún más significatividad. El nivel de estudios explica mucho del paro, por supuesto, no tienes más que ver la primera tabla: si afecta individualmente, más afectará en las agrupaciones.

    Gracias a upnews, Alejandro, Elías, Juan Antonio y Daniel por los elogios y/o las citas. No hay inconvenientes, por supuesto.

    Ovejas_Eléctricas, si te fijas la cuestión del gráfico es para explicarla de manera más clara, pero:

    "En el caso analizado, si se introduce la variable norte-sur en la ecuación, la influencia de los datos de PISA se queda en la mitad y deja de ser significativa."

    Creo que así se evita el problema que citas. De todas formas, las pendientes son muy similares, como puedes ver, y creo que es claro lo de la pendiente intergrupos.

    ResponderEliminar
  10. Bufy, que te me escapas. Tienes razón: los que tienen FP, además, pudieron conseguir trabajo cuando lo había (2008), mientras que los universitarios estaban estudiando. Pero también puede influir el veto a los universitarios en puestos inferiores.

    ResponderEliminar
  11. Un análisis muy interesante y sobre todo útil. Con tu permiso, lo comparto en Facebook y Twitter

    ResponderEliminar
  12. Espectacular tu publicación. Las diferencias regionales existen en todos los países, sin embargo una tasa de paro que supere el 20% no habría sido siquiera imaginable por los economistas años atrás, sin embargo es una situación que amenaza convertirse en el común denominador en todo el mundo y tirar por la borda los esfuerzos que muchos hemos hecho al cursar una carrera universitaria que hoy no sirve de mucho.

    ResponderEliminar
  13. Gracias a ambos. Leopoldo, es cierto que hay diferencias regionales amplias en los países, pero como en todo, hay grados. En mi libro analizo las diferencias entre regiones en algunos países de Europa, y lo que sale es que hay tres países -España, Italia y Grecia- con más diferencias entre sus regiones que entre los propios países europeos. Ninguno de los países analizados en Europa las tiene tan grandes. Ayer miré las diferencias entre los estados de México, y también son más pequeñas que las españolas.
    Y la carrera sí que sirve. Mi abuelo, que era maestro y había vivido dos guerras, decía que era la única tierra que no te podían quitar, viniera quien viniera. Estudiar es algo más (debe ser algo más) que prepararse para un puesto de trabajo. España es uno de los países donde más tarda en servir y menos sirve, pero aún así, ya lo creo que sirve.

    ResponderEliminar
  14. Interesante análisis. Con tu permiso lo pondré como un ejemplo de una interpretación estadística hecho con sentido común en Twitter, donde muchas veces comento casos de mala praxis estadística, como las tan frecuentes conclusiones precipitadas, por ejemplo deducir de una correlación una relación casa-efecto totalmente absurda, como lo hubiera sido terminar tu estudio con la conclusión "67% de la tasa de paro de las CC.AA. se explica por el nivel de matemáticas PISA de sus jóvenes".

    Solamente un matiz. Cuando dices "No es difícil ver que con una proporción menor de población con Secundaria superior no tendríamos el paro que tenemos", ¿no es una errata y quieres decir justo lo contrario, es decir que tendríamos menos paro con una menor proporción con estudios bajos, es decir con una mayor proporción con educación secundaria? ¿Pero no es eso también una conclusión precipitada, teniendo en cuenta que ahora mismo en todos los grupos, también de estudios medios y altos hay un exceso de demanda de empleo? Es decir, simplemente partiendo de los datos, no se puede descartar que con una mayor proporción con educación secundaria bajaría el exceso de demanda de empleo en el grupo de estudios bajos pero que subiría en la misma medida en el grupo de estudios medios y altos. Es decir, más educación es necesaria pero no suficiente: Para bajar el paro esta mayor educación debería centrarse además en los pocos áreas que quedan con un déficit de profesionales cualificados, y/o incluir el fomento del espirito emprendedor, para así crear empleo.

    ResponderEliminar
  15. Sí, creo que debería ser "sin Secundaria superior". Ahora lo corrijo. Gracias, Ansgar.

    Quizás la conclusión que dices sea algo precipitada, aunque la empleabilidad con FP es mayor que sin ella, pero el paro no se reduce sólo consiguiendo trabajo, sino no perdiéndolo (y a mayor formación, menos se pierde) o no entrando en la población activa (es decir, si siguieran estudiando, sobre todo los de 16-19 años). Otro dato a tener en cuenta es que la movilidad es mayor con más estudios, por lo que es más fácil que puedan buscar otros nichos de empleo.

    ResponderEliminar