Factores socioeconómicos y contextuales asociados al bajo rendimiento académico de alumnos peruanos en PISA 20151

LUIS MUELLE

Consultor en educación

luismuelle@yahoo.com

Resumen. El estudio utiliza el análisis logístico multinivel aplicado a los resultados de los alumnos peruanos en las pruebas de rendimiento en Ciencia, Matemática y Lectura en la ronda PISA 2015. Se centra en dimensionar el impacto de los factores socioeconómicos y contextuales en el bajo desempeño académico. La condición social del alumno y la composición social de su escuela destacan como los factores que afectan mayormente el bajo rendimiento, asociados a factores contextuales como la repetición, la lengua materna, la matrícula oportuna, la dimensión de la escuela, el ausentismo y el género. Asimismo, destaca la presencia de factores emocionales no contextuales que afectan la mayor probabilidad de riesgo académico, tales como el sentido de pertenencia a la escuela, la motivación al logro y la ansiedad frente a las pruebas.

Palabras clave: Programa Internacional de Evaluación de Estudiantes; rendimiento académico; estudiantes; condiciones sociales; Perú.

Socioeconomic and contextual factors associated with low academic performance of Peruvian students in PISA 2015

Abstract. This study applies a logistic multilevel analysis to the test results of Peruvian students in science, mathematics, and reading in the PISA 2015 round. It focuses on measuring the impact of student socioeconomic and contextual factors on low academic performance. The socioeconomic status of the students and the socioeconomic composition of the school appear to be the main factors that affect the poor performance. Other contextual factors, such as repetition, mother tongue, school size, grade, non-truancy and gender, are associated with low achievement. It is also worth highlighting the presence of non-contextual emotional factors that affect academic risk such as sense of belonging to a school, achievement motivation, and test anxiety.

Keywords: Programme for International Student Assessment; academic achievement; students; social conditions; Peru.

Siglas y abreviaturas usadas

BID Banco Interamericano de Desarrollo

ESCS Estatus socioeconómico y cultural de los estudiantes (por sus siglas en inglés)

IRT Teoría de respuesta al ítem (por sus siglas en inglés)

Minedu Ministerio de Educación del Perú

OCDE Organización para la Cooperación y el Desarrollo Económicos

Odds ratio Razón de probabilidades

PISA Programa Internacional de Evaluación de Estudiantes (por las siglas en inglés de item response theory)

UMC Oficina de Medición de la Calidad de los Aprendizajes – Ministerio de Educación del Perú

UMC-ISE Índice socioeconómico

Unesco Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura

Introduccion

Los estudios de la influencia de la condición social del alumno sobre su rendimiento tienen una larga tradición en las evaluaciones aplicadas en diferentes disciplinas y grados. Las evaluaciones nacionales tanto muestrales como censales en diferentes grados de primaria y secundaria, así como la mayor participación del país en las evaluaciones internacionales, en particular las pruebas PISA, han permitido incrementar y acumular valiosa información sobre la eficacia y equidad del sistema educativo. Muchas de estas evaluaciones señalan que, a pesar de algunos progresos en la expansión en la cobertura de la educación de las últimas décadas, en primaria y secundaria, los resultados de los rendimientos son modestos y subsisten todavía las desigualdades sociales (Cuenca et al., 2017; Miranda, 2008).

En el terreno de las evaluaciones internacionales PISA (Programme for International Student Assessment), el Perú participa desde el año 2000 y por cuarta vez en esta encuesta que tiene como propósito evaluar los conocimientos y competencias que poseen los jóvenes de 15 años de edad, es decir, al final de su educación obligatoria, en pruebas que abarcan tres competencias consideradas básicas: Ciencia, Lectura y Matemática2. Esta prueba se realiza por ciclos de tres años y enfatiza las pruebas, de manera alternada, en solo una de estas competencias. Para PISA 2015, el énfasis recae sobre la competencia científica.

Los objetivos de PISA se dirigen a orientar las políticas educativas, relacionando los resultados de los alumnos en las pruebas cognitivas con su contexto socioeconómico y cultural, además de considerar sus actitudes y motivaciones. De esta manera, se intenta apoyar las políticas educativas hacia la mejora de los aprendizajes a través de la identificación de las mejores estrategias y prácticas observadas en los países participantes.

Para el Perú y demás países participantes de la región latinoamericana, los resultados en PISA 2015 son modestos sin excepción. Así, por ejemplo, en Ciencia, esta se ubicó en el tercio más bajo del ranking general de países (BID-CIMA, 2016), mostrando diferencias de rendimiento muy pronunciadas equivalentes a un rezago de hasta más de 2,5 años de escolaridad, según el criterio de la OCDE que establece la diferencia de 30 puntos en el puntaje de Ciencia como el equivalente a un año de escolaridad entre países. Como criterio de comparación se agrega también la proporción de alumnos que llegan hasta el llamado nivel 2 de logros, que es considerada como la línea de base de competencias mínimas que debe alcanzar el alumno.

La tabla 1 presenta los puntajes por competencias y la distribución porcentual del nivel 2 en los países latinoamericanos, donde es notorio el elevado porcentaje de alumnos por debajo del nivel básico de competencia en las tres materias. Estas cifras son ciertamente bajas en comparación con el promedio internacional de la OCDE, que es del 21% en Ciencia, del 46% en Lectura y del 63% en Matemática.

Tabla 1
Latinoamérica en PISA 2015: promedios de rendimiento y porcentaje de alumnos respecto al nivel mínimo de competencias en Ciencia, Matemática y Lectura

Puntaje por competencia y % <= nivel 2

Ciencia

%

Matemática

%

Lectura

%

Chile

447

35

423

49

459

28

Uruguay

435

41

418

52

437

39

Costa Rica

420

46

400

62

420

40

Colombia

416

49

390

66

425

43

México

416

48

408

57

423

42

Brasil

401

57

377

70

407

51

Perú

397

58

387

66

398

54

Rep. Dominicana

332

86

328

91

358

72

Fuente: elaboración propia a partir de OECD (2016). Los países figuran en orden descendente según sus puntajes en Ciencia.

En este trabajo, la base de datos PISA 2015, disponible públicamente, será ampliamente utilizada gracias a la información sobre los factores que pueden ejercer una influencia sobre el logro académico. Por eso, su propósito es, por una parte, dimensionar el efecto de los factores contextuales y la variabilidad existente entre escuelas y alumnos en cada competencia y, por otra parte, analizar los factores no contextuales, o de proceso, recurriendo a la vasta colección de índices sintéticos elaborados a partir de las respuestas a los cuestionarios. Ambos propósitos son explorados con métodos analíticos propios del análisis jerárquico multinivel y con técnicas de regresión logística binaria, que identifican la significatividad de los factores de mayor relación con el rendimiento y que presentan un mayor poder explicativo3.

Existen, evidentemente, diversos reportes oficiales e investigaciones que abordan los llamados factores asociados al rendimiento, y se han acumulado conocimientos valiosos sobre el tema. A nivel de país, sin embargo, es escaso, y acaso inexistente, el análisis de factores que se asocian a los logros de la subpoblación de alumnos que obtiene un bajo rendimiento en contraste con aquella que obtiene un alto rendimiento. Es más, aparece como un interrogante conocer qué relación existe entre estas mismas subpoblaciones según su posición social favorecida y desfavorecida. Ciertamente, esta perspectiva de análisis supone delimitar las nociones de alto/bajo rendimiento y de posición social favorecida/desfavorecida, que serán propuestas más adelante.

En cuanto a la literatura académica sobre los factores asociados al rendimiento, cabe recordar que, desde la época de Coleman (1966), siempre se ha relievado la importancia de la condición social de la familia del alumno para explicar los logros.

A nivel internacional, algunas recensiones (Hanushek & Woessmann, 2008) han explorado de manera directa e indirecta algunos de estos factores familiares sin identificar un factor universal para explicar las diferencias en el rendimiento y concluyen en la existencia de múltiples interacciones de estos factores durante los aprendizajes del alumno a lo largo de su escolaridad. Sirin (2005), en su metaanálisis de 74 estudios sobre los factores más influyentes sobre el logro, afirma que la condición social es uno de los correlatos más fuertes del conjunto y que los alumnos con índices sociales altos típicamente alcanzan también mayores puntajes en las pruebas, tienen más probabilidades de completar la escuela secundaria y acceden más a la universidad respecto de sus compañeros con origen modesto.

En la literatura hispanófona, Cordero, Crespo y Pedraja (2013), al revisar los resultados de PISA desde su inicio hasta 2009 en España, concluyen que la mayoría de los trabajos coinciden en identificar la variable socioeconómica del alumno y la repetición como los principales determinantes del logro, mientras que los factores asociados con los recursos escolares tienen un poder explicativo muy bajo. Más recientemente, Gamazo et al. (2018), con datos de PISA 2015, reportan que los factores contextuales con mayor efecto en el rendimiento son el género, la matricula oportuna, el nivel socioeconómico de la escuela y del alumno, y la repetición de curso. Los factores no contextuales no registran relaciones significativas con las variables de la escuela.

A nivel de evaluación nacional, Agüero y Cueto (2004) explican que parte de los bajos niveles de rendimiento procedería de la presencia de efectos asociados de los pares en el interior del aula de clases. Los autores anotan la importancia de este efecto para diseñar políticas con objetivos de equidad y calidad y proponen la asignación de recursos destinados a mejorar el rendimiento. Cabe destacar el estudio de Cueto (2007), quien realiza un balance y perspectivas de las evaluaciones realizadas hasta aquella fecha en el país y que incluye los antecedentes, características y resultados principales de cuatro evaluaciones nacionales y dos internacionales que abordan los factores asociados al rendimiento en Lenguaje y Matemática y una discusión sobre los retos y las oportunidades del sistema de evaluación del rendimiento estudiantil en el Perú.

Carrasco (2007), en su investigación sobre las escuelas con datos de PISA 2000, encuentra que el nivel socioeconómico de la escuela tiene un mayor efecto sobre el rendimiento de los alumnos que el efecto a nivel individual. Encuentra que la gestión educativa (estatal / no estatal) no explica el rendimiento una vez que se controla por la composición social de la escuela y que tampoco muestran significatividad los recursos y el grado de equipamiento de las escuelas. En general, la gran mayoría de las variables de la escuela no son estadísticamente significativas para explicar las variaciones de los puntajes.

Guadalupe y Villanueva (2013), que abordan la evolución del desempeño lector de los países latinoamericanos participantes en las pruebas PISA 2000 y 2009, se interrogan sobre en qué medida los cambios que se observan en estas evaluaciones pueden explicarse por la transformación de las características en las condiciones socioeconómicas de los alumnos. Por eso, proponen un procedimiento diferente para medir la condición social, que resultaría finalmente más sensible al nuevo contexto social.

Benavides, León y Etesse (2014) analizan los datos de las evaluaciones PISA 2000 y 2009 en comprensión lectora y señalan que las brechas de rendimiento respecto a las diferencias socioeconómicas se han incrementado en el transcurso del tiempo, agravando así el nivel de segregación escolar en las instituciones. Este efecto estaría mayormente marcado por diversos factores sociodemográficos y podría reflejar que las escuelas devienen también espacios de segregación socioeconómica. Por su parte, León y Youn (2016), analizando los resultados de Matemática en PISA 2012, resaltan el efecto significativo del clima disciplinario en clase, del clima de la escuela y del sentido de pertenencia, los cuales tienen un efecto producido por las diferencias sociales.

León y Collahua (2016), quienes hacen un balance del efecto del nivel socioeconómico en el rendimiento de los alumnos durante los últimos 15 años, constatan que las evaluaciones de aprendizajes actuales tienden a usar índices sintéticos que incluyen combinaciones de diferentes indicadores sobre dimensiones económicas, sociales y culturales de las familias. Su metaanálisis abarca desde el año 2000 hasta 2014, e identifican 28 estudios en educación que relacionan el nivel socioeconómico de las familias con el rendimiento académico. El efecto de la composición socioeconómica de la escuela es mayor que el efecto socioeconómico del alumno, e incluso el primero llega a ser siete veces más alto, lo que evidencia su importancia clave. Sin embargo, advierten que estas medidas se basan en un solo grado/aula de cada institución educativa y que sería necesario desarrollar indicadores en el ámbito de la escuela para precisar mejor los niveles de segregación; para estimar estos efectos, destacan la importancia de usar modelos jerárquicos multinivel.

Estos antecedentes de investigación académica constituyen referentes valiosos para abordar de manera analítica los factores que influyen sobre el rendimiento. En este sentido, Murillo (2007) distingue entre factores de entrada (género, nivel socioeconómico, lengua materna, recursos pedagógicos y docentes de la escuela); factores de proceso (hábitos de estudio, expectativas académicas, apoyo familiar, clima de la escuela, metodología docente); y, como factor de producto, el logro alcanzado por el alumno en la prueba. Es más, este esquema se complementa con el marco teórico propuesto por la OCDE (OECD, 2016, p. 41) para seleccionar variables según un modelo que relaciona, entre otros, alumnos (índice social, lengua, género, escolaridad, localización, gestión, actitudes y conductas) con escuelas (composición social, liderazgo, clima, recursos educativos y docentes).

Para cubrir los propósitos de este estudio, se ha seleccionado, a nivel de alumnos: estatus socioeconómico; género; idioma en el hogar; localización geográfica; matrícula oportuna; repetición; asistencia a preescolar; y actitudes y comportamientos hacia y en la escuela. A nivel de escuelas: composición socioeconómica de la escuela; recursos de la escuela; recursos docentes; clima escolar; y prácticas pedagógicas. A nivel de sistema educativo: liderazgo; tamaño de la escuela; autonomía; gestión de la escuela; y selección y orientación escolar.

Ciertas advertencias son necesarias. En primer lugar, es claro que PISA recoge solo parte de los múltiples factores considerados como importantes en relación con los resultados en las competencias. En segundo lugar, no se trata de una evaluación curricular, sino que evalúa únicamente las tres competencias seleccionadas de común acuerdo entre los países participantes en el proyecto. En tercer lugar, las pruebas cognitivas se acompañan de cuestionarios de contexto que abarcan solo una parte del complejo entorno familiar, cultural y social del alumno, así como de la escuela.

Cabe advertir en la interpretación de resultados que el diseño de PISA no incluye asignaciones aleatorias ni experimentales y, por lo tanto, no permite afirmaciones de causalidad. Sin embargo, las asociaciones estadísticas pueden indicar relaciones causales potenciales, Asimismo, el promedio obtenido en las pruebas se refiere al nivel nacional y puede diferir grandemente según la configuración administrativa y geoespacial del sistema de educación del país.

En fin, es claro que el resultado que se evalúa en las pruebas es un producto de toda la trayectoria de la escolaridad del alumno y tiene un sentido transversal; esta escolaridad es, entonces, producto histórico de las políticas educativas precedentes y actuales.

1.Datos y métodos

Para cumplir con los propósitos ya señalados, la base de datos está constituida por la muestra PISA representativa a nivel nacional de alumnos de 15 años matriculados en secundaria provenientes de instituciones educativas de gestión estatal y no estatal, ubicadas en el área urbana y rural. En cada institución educativa se seleccionó a 35 estudiantes con las características de edad y grado escolar mencionadas. La muestra estuvo conformada por 6.971 estudiantes pertenecientes a 281 instituciones educativas de todo el país. Los puntajes obtenidos en las pruebas fueron estandarizados con un valor promedio de 500 puntos y desviación estándar de 100 puntos. Para estimar la habilidad de los alumnos, se utilizó el modelo psicométrico de dos parámetros proveniente de la teoría de respuesta al ítem (IRT). Además, se aplicaron cuestionarios dirigidos a alumnos, docentes y director de las escuelas seleccionadas.

Por la concepción del marco de referencia en PISA, los alumnos responden a diferentes subconjuntos de ítems en cada una de las competencias medidas, lo que hace necesario utilizar la metodología de valores plausibles, que permite obtener estimaciones consistentes con las características de la población de alumnos a quienes se aplican las pruebas. Estos valores, estimados a través de un proceso de imputación, buscan representar una medida de la competencia del alumno. En PISA 2015, se asigna a todos los alumnos 10 valores plausibles en cada una de sus competencias. En consecuencia, todo análisis sobre los puntajes debe tener en cuenta obligatoriamente estos 10 puntajes de manera simultánea. Su omisión provoca serios sesgos en los errores estándar y tests de significatividad, que pueden conducir a conclusiones erróneas. Se puede encontrar una discusión in extenso sobre estos valores en Von Davier, Gonzales y Mislevy (2009). Es importante señalar que, en este trabajo, todos los cálculos referentes a puntajes obtenidos por los alumnos en cada una de las disciplinas, toman en cuenta simultáneamente estos 10 valores.

En este trabajo se utilizan los modelos multinivel para el análisis de datos. En efecto, estos son modelos mixtos porque contienen efectos fijos y aleatorios. Los efectos fijos se asemejan a los coeficientes de regresión estándar y se estiman directamente. Los efectos aleatorios se obtienen a través de sus varianzas y covarianzas estimadas. Estos efectos aleatorios pueden tomar la forma de interceptos aleatorios o coeficientes aleatorios en una estructura de agrupamiento de datos que puede consistir en niveles múltiples de grupos anidados. Como tales, estos modelos mixtos son también conocidos en la literatura como modelos multinivel y modelos jerárquicos.

Específicamente, existen dos razones principales para el uso de la opción multinivel. En primer lugar, los alumnos asisten a sus clases en la misma escuela y constituyen así un «conglomerado» propio (cluster, en inglés), en donde coexisten relaciones entre los mismos compañeros que comparten el mismo ambiente físico y los mismos profesores. En este sentido, utilizar la regresión estándar tiende a sesgar los errores estándar por asumir erróneamente que las observaciones son independientes, principio básico de la regresión lineal. Por eso se utilizan los modelos multinivel en el campo educativo, debido a su capacidad para incorporar la naturaleza jerárquica de los datos (Raudenbush & Bryk, 2002). En segundo lugar, los modelos multinivel proporcionan una estimación de los patrones de las variaciones que ocurren dentro y entre las instituciones simultáneamente. Estos modelos miden en qué medida los rendimientos reflejan las diferencias de los efectos del contexto en el que funcionan los establecimientos escolares, y las diferencias que ocurren por las variaciones en las características personales y familiares de los alumnos. En los modelos, para el caso de una variable dependiente continua, se aplica la regresión lineal multinivel de efectos mixtos, y cuando se trata de una variable binaria se emplea la regresión logística multinivel de efectos mixtos.

En este trabajo, los parámetros del modelo multinivel son estimados en todos los casos utilizando los pesos de los alumnos y de las escuelas que figuran en la base de datos. Como es usual, en los modelos mixtos los pesos de alumnos son redimensionados dividiéndolos por los promedios de su correspondiente conglomerado, que en este caso es su propia escuela (Rabe-Hesketh & Skrondal, 2012).

La estimación de relaciones, en particular las causales, constituye un desafío fundamental de la investigación pues implicaría efectuar experiencias controladas. Sin embargo, este tipo de experiencias es generalmente imposible en ciencias sociales y en educación. En ausencia de la posibilidad de manipular datos experimentales, se construyen y proponen modelos que pretenden capturar las conexiones probables de covariables cuyas características se supone van asociadas a la variable dependiente. Estos modelos tienen éxito si las covariables permiten explicar las asociaciones con un cierto nivel de significatividad.

Se debe señalar que sobre el rendimiento del logro actúan algunas características de las escuelas que no son observables y que se asocian positivamente con las pendientes de los errores residuales de las variables aleatorias. Estas covariables, que se correlacionan con los términos del error, se llaman «endogeneidad» en econometría y producen resultados cuyas relaciones no se pueden interpretar. En un marco de regresión binaria mixta multinivel, como es el presente trabajo, es evidente que un modelo único universal no existe. Tanto en la construcción del índice socioeconómico como en la selección de variables de cualquier modelo de asociación al rendimiento de alumnos existe un grado de endogeneidad entre algunas covariables, en particular si se comparan logros entre escuelas4. Admitir esta probabilidad de sesgo por endogeneidad previene de plantear causalidad entre las variables y abre cuestiones de investigación importantes.

2.La condicion socioeconomica y el bajo rendimiento

En el Perú, el bajo rendimiento alcanza un 46,7% en todas las competencias reunidas, y cuando este promedio se deslinda por cada competencia separadamente, la situación es más preocupante: 66,1% en Matemática, 53,7% en Lectura y 58,7% en Ciencia. La tabla siguiente presenta también las diferencias entre los grupos de alto y bajo rendimiento. Los puntajes son menores que el promedio internacional de 500 puntos y las diferencias son importantes. Es en Lectura donde los alumnos se encuentran en posición más precaria, con una diferencia entre los grupos alto y bajo que llega hasta 145,7 puntos.

Tabla 2
Puntajes promedio y porcentajes según niveles de rendimiento general y alto/bajo en PISA 2015, por competencia

Matemática

Lectura

Ciencia

Rendimiento

Promedio

%

Promedio

%

Promedio

%

General

386,6 (2,71)

100

397,5 (2,89)

100

396,7 (2,35)

100

Alto

477,2

33,9

475,8

46,3

470,4

41,5

(2,04)

(1,41)

(2,10)

(1,49)

(0,83)

(1,40)

Bajo

340,1

66,1

330,1

53,7

344,7

58,5

(1,42)

(1,41)

(1,70)

(1,49)

(1,26)

(1,40)

Diferencia

137,1

145,7

125,7

Nota: errores estándar entre paréntesis. Los cálculos se aplican a los 10 valores plausibles de cada competencia. Todos los valores son significativamente diferentes.
Fuente: elaboración propia a partir de la base de datos OECD/PISA 2015.

Otra forma de visualizar los bajos resultados es considerar la proporción de alumnos vulnerables en las tres disciplinas simultáneamente. Considerando las disciplinas de manera conjunta, con la ayuda del diagrama de Venn, se pueden visualizar las intersecciones que permiten la lectura simple y combinada del rendimiento. Por ejemplo, solamente el 27,6% de los alumnos alcanzan alto rendimiento en las tres disciplinas y el 46,7%, un bajo rendimiento en las tres disciplinas5.

Figura 1
Diagrama de Venn: traslape de porcentajes de bajo rendimiento en las tres competencias de PISA 2015

Todo

alto

Solo Lectura

Solo Ciencia

Solo

Matemática

Lectura y

Matemática

Lectura y Ciencia

Ciencia y Matemática

Todo

bajo

27,6

(1,39)

1,9

(0,31)

2,1

(0,32)

8,9

(0,68)

2,9

(0,37)

2,2

(0,26)

7,7

(063)

46,7

(1,42)

Nota: errores estándar entre paréntesis. Todos los valores son significativamente diferentes. Los cálculos se aplican a los 10 valores plausibles de cada competencia.
Fuente: elaboración propia a partir de la base de datos OECD/PISA 2015.

En suma, el 47% de los alumnos se encuentran en posición de riesgo académico, cifra elevada que inquieta por su volumen y que amerita una atención urgente.

El índice socioeconómico como viga maestra para relacionar la condición social con el rendimiento del alumno

El informe nacional sobre los resultados de PISA 2015 (Ministerio de Educación del Perú – Unidad de Medición de la Calidad Educativa, 2017, p. 53) presenta como novedad muy importante el uso del índice socioeconómico (UMC-ISE) elaborado por la oficina responsable de PISA en el país, y que en el caso peruano remplaza aquel utilizado por la OCDE. En efecto, el índice ESCS de la OCDE (llamado índice de estatus socioeconómico y cultural) es ampliamente difundido en los reportes PISA y aspira a tener carácter universal, pero es criticado por no reflejar fielmente la estructura socioeconómica propia de cada país en donde se aplica la prueba. Por eso, el UMC-ISE es un índice alternativo adaptado al contexto nacional y elaborado con una metodología propia (Ministerio de Educación del Perú – Unidad de Medición de la Calidad Educativa, 2017, p. 54). Este índice incorpora ítems que cubren el nivel educativo de los padres, bienes activos y servicios disponibles en el hogar, material de lectura y los recursos educativos a disposición del alumno. Los componentes de este nuevo índice toman como base de referencia el modelo utilizado en la Evaluación Censal de Estudiantes (ECE) 2015 aplicada en el país.

Además, el índice toma en cuenta el estatus ocupacional de los padres y las características del mercado laboral nacional y su informalidad y corrige igualmente la variable posesiones en el hogar, que incluye ítems poco comunes como obras de arte y lectores de libros digitales. También, el UMC-ISE considera ítems presentes en los sectores económicos desfavorecidos, tal como el material de la vivienda y el acceso a servicios básicos (Ministerio de Educación del Perú – Unidad de Medición de la Calidad Educativa, 2017, p. 183). Asimismo, equipara los índices socioeconómicos de las evaluaciones anteriores de PISA, permitiendo así realizar comparaciones en el tiempo de resultados desde 2009 hasta 20156.

Conviene asimismo indicar que este índice aplicado a las instituciones educativas permite generar el índice de composición social de la escuela, que correspondería teóricamente a cada escuela y que resulta simplemente de la adición del valor del índice socioeconómico del alumno por escuela, dividido entre el número de alumnos de esta misma escuela. Como se ha señalado anteriormente, varios estudios destacan que la composición social de la escuela resalta como el factor de mayor efecto sobre el rendimiento (Caro & Lenkeit, 2012; Sirin, 2005).

Para comprender los perfiles de los índices sociales del alumno y de la escuela, conviene presentar visualmente las distribuciones de sus propias densidades de probabilidad.

Figura 2
Densidad de probabilidades del índice socioeconómico por alumnos y por escuelas

Fuente: elaboración propia a partir de la base de datos OECD/PISA 2015.

Respetando la misma escala en ambos ejes, se presentan las densidades de la curva de distribución correspondientes a cada índice7. Ambos índices se distribuyen aproximadamente alrededor de una distribución normal. El índice de las escuelas tiene una distribución más concentrada próxima de la mediana8. La posición cercana de los tres percentiles de la figura tienen una gran similitud en el valor de las dispersiones. La comparación detallada de los valores de estos índices permite apreciar mejor sus distribuciones respectivas.

Tabla 3
Valores promedio y percentiles de los índices socioeconómicos según alumnos y escuelas

Promedio

Mínimo

P25

P50

P75

Máximo

Varianza

UMC-ISE Alumno

-0,019

(0,03)

-3,31

-0,76

(0,03)

0,10

(0,05)

0,82

(0,03)

2,06

1,02

(0,03)

Índice socioeconómico Escuela

-0,025

(0,03)

-2,46

-0,64

(0,08)

0,03

(0,04)

0,60

(0,04)

1,32

0,06

(0,03)

Notas:
- La correlación general entre los dos índices es de 0,74 (0,01).
- Errores estándar entre paréntesis.
- Todos los valores son significativamente diferentes.
Fuente: elaboración propia a partir de la base de datos OECD/PISA 2015.

Por construcción, los índices aumentan a medida que cada percentil aumenta. Los gráficos permiten comparar así el perfil de las distribuciones de los cuartiles P25 (un cuarto de la distribución), P50 (la mediana) y P75 (tres cuartos de la distribución). Los alumnos poseen una mayor varianza que el índice de la escuela. Esta relativa mayor concentración de alumnos en ciertas escuelas anuncia precisamente parte de la explicación del alto y bajo rendimiento de estas, tema que se abordará más adelante.

Las gradientes socioeconómicas del rendimiento según competencias

Se considera que un índice social elaborado a partir de una encuesta de evaluación educacional puede facilitar los análisis sobre el rendimiento si se acepta convencionalmente que los alumnos desfavorecidos socioeconómicamente son aquellos que se encuentran en el cuartil inferior de la distribución estadística de este índice, y, en contrapartida, son favorecidos aquellos situados en el cuartil superior o en el resto de la distribución. Esta noción, de uso común con datos PISA, es utilizada en el presente trabajo para diferenciar socialmente la categoría socioeconómica del alumno.

La manera clásica de medir el impacto de la condición socioeconómica es a través una regresión simple entre dos variables y cuyos parámetros indican la pendiente y la fuerza de esta relación. El término «gradiente socioeconómica» se refiere a la relación lineal entre el rendimiento alcanzado en una de las competencias medidas y el índice UMC-ISE. Los valores más elevados de la pendiente están relacionados con una mayor inclusión, mientras que las pendientes más lisas y las relaciones débiles se asocian a una mayor equidad. La figura siguiente presenta el perfil de la relación para cada una de las tres competencias.

Figura 3
Rendimiento de alumnos según índice socioeconómico y competencias

Ciencia

Matemática

Lectura

Pendiente del índice UMC-ISE

33,9 (1,575)

34,9 (1,775)

44,4 (1,869)

% de varianza explicada UMC-ISE

20,3 (0,015)

18,7 (0,016)

25,9 (0169)

Constante

398,6 (1,799)

388,6279 (2,249)

399,9(2,212)

Nota: errores estándar entre paréntesis. Los cálculos se aplican a los 10 valores plausibles de cada competencia. Todos los valores son significativamente diferentes.
Fuente: elaboración propia a partir de la base de datos OECD/PISA 2015.

Cabe notar las diferentes alturas en las coordenadas de las rectas de regresión para cada competencia entre el inicio y el fin de los valores del índice. El caso de la Lectura es ejemplar: partiendo de una leve influencia social, esta va creciendo hasta destacar nítidamente la diferencia de la posición social más favorecida. El gráfico también destaca el paralelismo entre Ciencia y Matemática, que avanzan sostenidamente a medida que la posición social se eleva sin tener ninguna intersección sobre un punto en común.

Es visible que la recta representa solo una indicación promedio de la asociación entre rendimiento y origen social, pues si todos los alumnos estuvieran situados sobre la recta se podría imaginar que el rendimiento se puede predecir conociendo únicamente su índice social. Ciertamente, este no es el caso, ya que existen una diversidad de rangos en los resultados alrededor de la recta, en la medida en que existen alumnos desfavorecidos socialmente con altos resultados y, al contrario, alumnos favorecidos con bajos resultados.

En este sentido:

a)La fuerza de la relación entre logro y origen socioeconómico permite predecir el rendimiento, en el sentido de precisar cuán cerca y cuán dispersos están los resultados de la recta de mejor ajuste. Mientras más cerca se sitúen los puntos sobre la línea de mejor ajuste, mayor será la fuerza de la relación. Este aspecto de la gradiente está representado por el porcentaje de la varianza explicada por el índice social. Un porcentaje alto significa que el rendimiento esta mayormente determinado por él. Esta fuerza de la relación varía entre el 18,7% en Matemática, el 20,3% en Ciencia y el 25,9% en Lectura, que significa una muy alta varianza explicada. Como referencia, los países de la OCDE tienen en promedio una varianza del 13% en sus resultados de Ciencia,

b)La pendiente de la gradiente registra el impacto del estatus socioeconómico en el rendimiento. Una pendiente aguda muestra un mayor impacto del índice en el rendimiento, para manifestar la mayor diferencia entre alumnos según su condición social desfavorecida o favorecida. Una mayor equidad se traduce, entonces, en una pendiente más plana. En el Perú, los valores positivos de las pendientes observadas en el gráfico confirman las ventajas de la posición social, pero esta ventaja es diferente según la competencia. Así, por cada unidad que aumenta el valor del índice UMC-ISE, el alumno se beneficia con un aumento de 33,9 puntos en Ciencia, 34,9 en Matemática y, generosamente, 44,4 puntos más en Lectura.

Para referencia, en el conjunto de los países de la OCDE, un incremento de un punto en el índice ISEC9 produciría un aumento de 38 puntos en el puntaje promedio de Ciencia, ligeramente mayor que el índice del país (33,9 puntos).

Se debe destacar que la pendiente y la fuerza de la gradiente miden aspectos diferentes de la relación. Si la pendiente de la gradiente es aguda y la fuerza de la relación es alta, los desafíos son mayores pues significa que los alumnos tienen más probabilidades de que sus logros sean mayormente determinados por su origen social, lo que provoca en el sistema educativo un mayor diferencial del rendimiento entre alumnos socialmente favorecidos y desfavorecidos. Las ecuaciones mostrarían que este es el caso del Perú.

La variabilidad de las escuelas en el rendimiento

Es de consenso actual que la composición social de la escuela es un factor que predice de manera significativa el rendimiento académico y sirve para orientar las políticas educativas. En efecto, el conocido estudio de Perry y McConney (2010) advertía que se conoce muy poco de la relación del estatus alumno-escuela considerados simultáneamente; y, con los resultados de PISA 2003 en Lectura y Matemática, los autores resaltan la preeminencia de la situación social de la escuela para explicar el rendimiento y abogan por la implementación de políticas de educación favorables a una composición escolar social balanceada, planteando como prioridad la reducción de la segregación social en la escuela.

Los datos disponibles en PISA 2015 permiten apreciar la variabilidad de los logros entre escuelas y alumnos, a través del uso de la llamada correlación intraclase. Este artificio estadístico plantea un modelo llamado nulo o modelo incondicional, según el cual es posible conocer esta variabilidad si se supone que no hay intervención de ningún factor que pueda influenciarla. Este índice de correlación ICC (por sus siglas en inglés) es interpretable y útil para los modelos multinivel, pues representa la correlación entre dos observaciones dentro del mismo conglomerado. Cuanto mayor sea la correlación dentro del conglomerado, es decir, cuanto más grande es el ICC, menor es la variabilidad dentro del conglomerado y, en consecuencia, mayor la variabilidad entre los conglomerados10.

Cuando se plantea un modelo nulo a través de una regresión que pone en relación los puntajes obtenidos en cada competencia, sin intervención de ningún factor externo, las regresiones estadísticas permiten obtener la correlación intraclase. En la tabla siguiente, se aprecia que la varianza interescuelas es relativamente elevada y difiere según cada competencia pues explica el 44% en Ciencia, el 40,1% en Matemática y el 53,8% en Lectura. Estos porcentajes son atribuibles a las diferencias/homogeneidades existentes según las características de cada escuela11. Por complemento, la diferencia se explica por las propias características del alumno y sus contextos sociales y familiares. Estas cifras indican una alta variabilidad del rendimiento explicada por las escuelas, sin tener en cuenta la influencia de ningún factor.

Tabla 4
Correlación intraclase: porcentaje de variabilidad escuelas/alumnos según competencias (%)

Ciencia

Matemática

Lectura

ICC Total

44,1

(0,005)

40,1

(0,005)

53,8

(0,005)

Nota: errores estándar entre paréntesis. Los cálculos se aplican a los 10 valores plausibles de cada competencia. Todos los valores son significativamente diferentes.
Fuente: elaboración propia a partir de la base de datos OECD/PISA 2015.

Los índices sociales como factores asociados al rendimiento

Aunque las variaciones del perfil social de los alumnos dentro de las escuelas, así como su grado de influencia en los logros, siguen siendo moderadamente conocidas, la combinación entre estos perfiles permite identificar información útil para orientar la política de mejoramiento educativo (Muelle, 2016; Monseur & Crahey, 2008).

Como se ha anotado, los coeficientes de regresión, a través de las pendientes de las rectas, permiten identificar el impacto de una covariable sobre un resultado. Con este propósito, se puede poner en relación dos índices socioeconómicos, del alumno y de la escuela, y medir sus respectivos efectos sobre el rendimiento.

El índice UMC-ISE puede ser representado por sus cuatro cuantiles, donde cada segmento contiene el 25% de los datos. De este modo, cuatro grupos corresponden a los alumnos (nombrados Q1 a Q4 alumnos) y cuatro grupos a las escuelas (nombrados Q1 a Q4 escuela). Estas particiones según una escala ascendente pueden representar categorías de posición social muy baja, baja, media y alta.

La figura siguiente permite visualizar cómodamente las 16 coordenadas que se obtienen por la interrelación entre escuelas y alumnos, y los puntajes asociados a estas coordenadas. La tendencia es neta: conforme el estatus socioeconómico del alumno crece, también crece el rendimiento, pero lo hace en proporciones diferentes según cada competencia y según cada valor del índice social de la escuela.

Figura 4
Rendimientos según competencias y por cuantiles socioeconómicos de alumnos y escuelas

Notas:
- Errores estándar entre paréntesis. Los cálculos se aplican a los 10 valores plausibles.
- Véase la tabla detallada de los valores de la figura en el anexo 2.
Fuente: elaboración propia a partir de la base de datos OECD/PISA 2015.

Así, sea cual fuere su origen social, el alumno mejora su rendimiento conforme se asocia a escuelas con índices sociales mayores y socialmente más favorecidas. El ritmo de crecimiento es mayor para los alumnos más favorecidos (Q4) que poseen desde el inicio puntajes más altos que los demás y presentan pendientes de crecimiento más empinadas. No todos los alumnos desfavorecidos frecuentan escuelas desfavorecidas, pero esta aserción debe ser matizada. En efecto, un alumno desfavorecido (Q1-alumno) obtiene en todos los casos siempre menores resultados que el resto de sus compañeros en todas las competencias. En contraste, para un alumno favorecido (Q4-alumno) no importa qué tipo de escuela frecuente, incluyendo una escuela desfavorecida (Q1-escuela): obtendrá siempre mejores resultados que el resto de sus compañeros.

Este hecho se traduce en la figura por el paralelismo de las pendientes de las rectas que representan los orígenes sociales de los alumnos respecto al rendimiento académico. Sobrepasar la línea de base del nivel 2, que delimita la obtención de mejores resultados, ocurre solo para todos los alumnos que van a escuelas cuya composición social corresponde a los niveles medio y alto (Q3 y Q4 escuelas).

En consecuencia, la composición social favorable de la escuela efectivamente puede mejorar los logros de un alumno socialmente desfavorecido, pero nunca igualaría los resultados de los alumnos favorecidos. Ciertamente, esto no constituye un determinismo social, y puede ocurrir que, por el contrario, los alumnos desfavorecidos que tienen buen rendimiento sean matriculados por sus padres en escuelas de mejor estatus social; sin embargo, los datos disponibles no permiten explorar esta posibilidad.

Para analizar la situación descrita según el alto/bajo rendimiento del alumno, y tratándose de una variable dependiente binaria, es necesaria una regresión logística, que permita obtener la comparación de probabilidad entre categorías. Con este propósito, se utiliza la razón de probabilidad (odds ratio), que tomará como referencia de base el primer cuartil Q1 del índice UMC-ISE, correspondiente a la categoría socialmente muy baja de alumnos. Junto con la distribución de cuartiles se presenta la razón de probabilidades de todas las categorías sociales juntas (cuartiles Q2, Q3 y Q4) respecto a la categoría más desfavorecida (Q1).

Tabla 5
Alto y bajo rendimiento del alumno según competencias y cuantiles socioeconómicos, en porcentajes y odds ratio

Rendimiento

Cuantiles socioeconómicos del alumno

Q1

Q2

Q3

Q4

Odds 1

Alto Ciencia

15,6***

32,9***

52,8***

66,1***

Q1 vs. Q2/Q4

(1,13)

(1,78)

(1,87)

(2,01)

5,4

Bajo Ciencia

84,4***

67,1***

47,2***

33,9***

(0,47)

(1,13)

(1,78)

(1,87)

(2,01)

100

100

100

100

Alto Matemática

11,4***

25,0***

41,9***

58,7***

Odss

(1,22)

(1,74)

(2,04)

(2,40)

Q1 vs. Q2/Q4

Bajo Matemática

88,6***

75,0***

58,1***

41,3***

7,8

(1,22)

(1,74)

(2,04)

(2,40)

(0,99)

100

100

100

100

Alto Lectura

15,7***

37,2***

60,1***

74,2***

Odds

(1,39)

(2,01)

(1,84)

(1,78)

Q1 vs. Q2/Q4

Bajo Lectura

84,3***

62,8***

39,9***

25,8***

5,4

(1,39)

(2,01)

(1,84)

(1,78)

(0,57)

100

100

100

100

Notas:
- Regresiones logísticas según cada competencia.
- Errores estándar entre paréntesis. Los cálculos se aplican a los 10 valores plausibles de cada competencia.
- p<0,05, p<0,01, p<0,001.
Elaboración propia.

Según los porcentajes, los alumnos socialmente muy favorecidos (Q4) representan el 66% con altos rendimientos en Ciencias, el 58% en Matemáticas y el 74% en Lectura. Al contrario, los alumnos socialmente desfavorecidos (Q1) son más numerosos, pero esta vez en la categoría de bajos rendimientos: 84%, 88% y 84%, respectivamente, en las mismas disciplinas. Estos valores se alinean con el perfil de resultados anteriores.

En cuanto a la razón de probabilidad (odds ratio) que compara las probabilidades de pertenencia respecto a la categoría social desfavorecida, ella permite afirmar que un alumno con origen social muy modesto (Q1) tiene una probabilidad 5,2 veces más alta de tener un bajo rendimiento en Ciencia, 7,8 veces más alta en Matemática y 5,4 veces más alta en Lectura, respecto de un alumno cuyo origen social es pertenecer a la categoría muy favorecida socialmente (Q4). Nuevamente, los altos rendimiento parecen estar reservados a las categorías sociales más favorecidas y, en contraste, los bajos rendimientos caracterizan mayoritariamente a los alumnos de orígenes sociales modestos.

Luego de constatar las diferencias entre categorías, se proponen tres modelos de regresión logística12 que consideran la distinción de alto y bajo rendimiento haciendo intervenir secuencialmente, primero, el índice social del alumno; luego, el índice social de la escuela; y, por último, la interacción entre ambos índices.

Tabla 6
Razón de probabilidades de los índices socioeconómicos según competencias de alto y bajo rendimiento, y coeficiente de correlación intraclase en % (ICC)

Modelo 1: Alumno

Modelo 2: Escuela

Modelo 3: Alumnos y escuelas

Odds ratio

C

M

L

C

M

L

C

M

L

Alumno

0,39

(0,02)

0,39

(0,02

0,34

(0,02)

0,70

(0,03)

0,67

(0,04)

0,66

(0,04)

Escuela

0,22

(0,02)

0,22

(0,02)

0,16

(0,02)

0,31

(0,03)

0,34

(0,04)

0,25

(0,03)

Alumno y escuela

0,94

(0,07)

0,86

(0,07)

0,94

50,08)

Constante

ICC

1,48

(0,08)

2,18

(0,13)

1,19

(0,07)

1,54

(0,08)

2,29

(0,14)

1,22

(0,07)

1,56

(0,09)

11,8

(0,02)

2,42

(0,16)

11,8

(0,02)

1,24

(0,08)

18,1

(0,05)

Notas:
- Las siglas corresponden a C=Ciencia; M=Matemática y L=Lectura.
- Errores estándar entre paréntesis. Los cálculos se aplican a los 10 valores plausibles de cada competencia. Todos los valores son significativamente diferentes.
Fuente: elaboración propia a partir de la base de datos OECD/PISA 2015.

Las razones de probabilidad confirman nuevamente resultados anteriores en el sentido de relievar la composición de la escuela como el más poderoso determinante del rendimiento, y de mayor importancia que el origen social del alumno.

Así, la tabla muestra que un incremento en el índice social de la escuela disminuye fuertemente las probabilidades de que un alumno se encuentre en la categoría de bajos resultados de 1 a 0,22 en Ciencia y Matemáticas y a 0,16 en Lectura. Esta aptitud protectora directa de la escuela es mayor que aquella brindada por la influencia directa del origen social del alumno, que va 0,39 a 0,34 probabilidades para las mismas competencias respectivamente.

La regresión con interacciones, que es un artificio analítico que toma en cuenta el carácter anidado de los dos índices (alumno y escuela)13, señala que ambos se conjugan para disminuir las probabilidades de que el alumno se encuentre en la categoría del bajo rendimiento, pero esta probabilidad depende mayormente de la escuela, de modo que el beneficio sería mayor cuando el alumno proviene de un origen favorable y asiste a una escuela socialmente más favorable.

En cuanto a la correlación intraclase, esta disminuye sensiblemente respecto al modelo «nulo o vacío». En efecto, recuérdese que la variabilidad de este coeficiente es del 44,1% en Ciencia, el 40,1% en Matemática y el 53,8% en Lectura (véase la tabla 4), pero una vez que interviene la situación social, la variabilidad entre escuelas se reduce al 11,8% en Ciencia y Matemática y al 18,1% en Lectura. Se confirma in extenso la supremacía de la escuela cuando se trata de explicar el bajo rendimiento de los alumnos.

3.Un modelo multinivel del bajo rendimiento

Los resultados anteriores y los propósitos de este estudio permiten ahora proponer un modelo que pretende explicar el bajo rendimiento a través la intervención de un conjunto de variables seleccionadas que se supone actúan de manera significativa sobre este.

En las relaciones econométricas que se plantean aquí, se asume que las variables independientes inscritas en el modelo están asociadas a la variable dependiente que intentan explicar, pero no constituyen necesariamente canales de causalidad que la determinan ni tampoco son determinadas por ella. En este sentido, se trata de evitar el sesgo que puede ocurrir en la selección de las variables de control y en la inferencia de los resultados (Angrist & Pischke, 2008).

Las respuestas devienen variables contextuales ponderadas de manera probabilística (WLE, siglas en inglés de weighted likelihood estimates) con una métrica estándar cuyo promedio vale 0 y su desviación estándar, 1, mediante el uso de la teoría de respuesta al ítem (IRT).

Se ha identificado la disponibilidad de 48 índices sintéticos que, bajo la forma de variables, intentan cubrir todas las opciones de respuestas a los cuestionarios: 26 índices corresponden a los alumnos; 9, a la escuela; 9, a los docentes; y 4, a los padres.

Como es usual en econometría, para la selección de variables se recurre a algoritmos que se basan en criterios estadísticos como los criterios de Akaike (AIC) y Bayes (BIC), que permiten elaborar modelos que equilibran un buen ajuste estadístico con la parsimonia. Tratándose de una muestra, y como es el caso en todo cuestionario, en su aplicación muchas preguntas no tuvieron respuesta o fueron inaplicables; en consecuencia, algunos índices sintéticos contienen valores perdidos, a veces en proporción importante, y su inclusión en modelos múltiples afecta sensiblemente la muestra disminuyendo el número de observaciones14. Por eso, para este estudio se seleccionan solamente aquellas variables con menos del 10% de valores perdidos.

El uso del algoritmo de selección SELECT (Lindsey, 2014) permitió identificar un conjunto de índices cuyo número es el máximo razonable por seleccionar según los criterios de ajuste AIC y BIC. Agregar otras variables sintéticas no aportaría ninguna ventaja explicativa al modelo. Con ello, se evita la inflación de variables que penalizaría el porcentaje de valores ausentes15. De todo el conjunto, sobre 6.971 observaciones originales, se pierde por ausencia de respuesta solamente el 9,1% del total. El modelo final retiene 11 variables significativas que muestran asociación con el bajo rendimiento. Se recuerda que este trabajo trata de explicar el alto/bajo rendimiento y no el rendimiento general. Por eso, es importante señalar que hay 14 variables que no muestran significatividad en este modelo, pero no por eso son menos importante para otros modelos. Aquí la lista:

RESPRES: Responsabilidad de los recursos.

CREACTIV: Actividades creativas extracurriculares (Suma).

SCIERES: Índice de recursos en Ciencia (Suma).

TEACHPART: Participación docente (Suma).

EDUSHORT: Escasez de material educativo (WLE).

STUBEHA: Conducta del alumno que afecta el aprendizaje (WLE).

TEACHBEHA: Conducta del docente que afecta el aprendizaje.

RATCMP_SCH: Número de computadoras por escuela (WLE).

STAFFSHORT: Escasez de personal docente (WLE).

PROACE: Índice proporción de docentes calificados.

RESPCUR: Responsabilidad curricular.

SCHAUT: Autonomía promedio de la escuela.

STRATIO: Ratio alumno/docente.

DISCLISCI: Clima disciplinario en aula Ciencia (WLE).

A esta lista de indicadores sintéticos se agregan las variables de contexto, que tampoco son significativas para explicar el bajo rendimiento:

La dicotomía escuela urbana/rural, que tradicionalmente otorga ventaja a la primera. Esta diferenciación desaparece cuando se trata de explicar rendimientos modestos. La ubicación geográfica de la escuela no influye en el bajo rendimiento, al menos en su definición actual.

La distinción no estatal / estatal tradicionalmente aventaja a la primera categoría, pero esta vez la diferencia no es significativa cuando se trata de bajos rendimientos. Queda por demostrar si esta situación es efecto de una nueva configuración administrativa y social de la escuela que mejora el rendimiento de las escuelas públicas, o de que las escuelas privadas adoptan otra configuración distinta de la tradicional.

Asistir al pregrado no procura las ventajas que se le ha atribuido en el pasado. El progreso alcanzado en la atención y cobertura a una importante población de niños en edad prescolar parece haber favorecido la homogeneidad de los alumnos.

Para referencia, los valores de estas variables no significativas en el modelo figuran en el anexo 1. En cuanto al modelo, por tratarse de variables binarias dependientes (alto/bajo rendimiento), en modelos logísticos multinivel, los coeficientes son expresados en razón de probabilidad (odds ratio, en inglés).

Para describir la fuerza de las relaciones, el coeficiente de correlación intraclase (ICC) señala la correlación entre las variables de datos estructurados en grupos y presenta valores que son aún más bajos que aquellos constatados precedentemente en la tabla 6, que solo consideraba los índices alumno y escuela. Estos valores son del 7,3% en Ciencia, el 6,3% en Matemática y el 11,1% en Lectura.

Si se considera que los alumnos dentro de un conglomerado (escuela) no son independientes entre ellos y, por tanto, comparten efectos aleatorios de su conglomerado, estos resultados abren vías para seguir explorando otros factores sociales asociados al rendimiento, pero también abren un cierto espacio para incorporar otras variables que probablemente han sido omitidas o que ameritan mejor medición. Se reitera el riesgo de endogeneidad que puede ocurrir dentro de la batería densa de las variables presentadas. Serían necesarios otros análisis y otras técnicas y tests estadísticos para limitar y corregir este riesgo. En otros términos, este conjunto de variables explica la modesta variabilidad entre las escuelas una vez que ejercen su influencia sobre el rendimiento.

Tabla 7
Modelo del efecto de variables significativas sobre el bajo rendimiento de alumnos en las competencias PISA 2015 (en valores de razón de probabilidades)

Código de la variable y etiqueta

Ciencia

Matemática

Lectura

BELONG: Sentido de pertenencia a la escuela

0,719

(0,035)

0,775

(0,037)

0,669

(0,029)

ANXTEST: Test de ansiedad

1,328

(0,054)

1,406

(0,076)

1,241

(0,049)

MOTIVAT: Motivación al logro

0,682

(0,022)

0,667

(0,042)

0,786

(0,040)

UMC-ISE: Índice socioeconómico del alumno

0,801

(0,032)

0,774

(0,049)

0,729

(0,054)

UMC-ISE-SCH: Índice socioeconómico de la escuela

0,409

(0,032)

0,414

(0,051)

0,348

(0,048)

ST004D01T: Género alumno:

Masculino

Femenino

1

1,624

(0,132)

1

1,625

(0,084)

1

1,005

(0,065)

NOTRUANCY: No ausentismo en la escuela

0,993

(0,002)

0,985

(0,002)

0,996

(0,003)

REPEAT: Repitió grado

Repitió grado

No

1

1,982

(0,206)

1

1,888

(0,175)

1

1,854

(0,121)

ST022Q01TA: Idioma en hogar:

Castellano

Otro

1

2,558

(0,534)

1

2,671

(0,431)

1

3,258

(0,543)

SCHSIZE: Tamaño de la escuela:

Grande

Mediana

Pequeña

1

1,400

(0,125)

1,707

(0,169)

1

1,427

(0,109)

1,743

(0,329)

1

1,583

(0,113)

1,774

(0,250)

GRADE: Matrícula

En atraso

Oportuna

1

0,416

(0,054)

1

0,411

(0,051)

1

0,366

(0,029)

Constante

Coeficiente de correlación intraclase (ICC) (%)

0,758

(0,404)

7,3

(0,002)

2,091

(0,012)

6,3

(0,002)

1,498

(0,093)

11,1

(0,03)

Número de observaciones

6.425

6.425

6.425

Nota: errores estándar entre paréntesis. Los cálculos se aplican a los 10 valores plausibles de cada competencia. Todos los valores son significativamente diferentes.
Fuente: elaboración propia a partir de la base de datos OECD/PISA 2015.

4.Discusión de resultados

A la vista de los resultados del modelo, los coeficientes estimados confirman la influencia de la doble protección del estatus socioeconómico del alumno y de la escuela. La posición social favorecida en todos los casos es un importante factor de protección contra el bajo rendimiento. Esta es mayor cuando la escuela es socialmente favorecida.

Para facilitar la lectura de las estadísticas, se resumen las categorías nominales del modelo final que han mostrado ser significativas.

Género

Es recurrente señalar la diferencia de género existente en Matemática siempre a favor de los varones y en Lectura a favor de las mujeres. En el caso del bajo rendimiento, se confirma esta diferencia, pues las mujeres tienen un 62% más de probabilidades que los varones de obtener bajos rendimientos en Ciencia y Matemática. Pero no es el caso de la Lectura, donde no hay diferencias significativas entre los géneros cuando obtienen bajos resultados en esta competencia.

Repetición

Los alumnos repitentes en presencia de otros factores tienen dos veces más probabilidades de tener bajos rendimiento respecto a aquellos que no repiten. Sin embargo, cuando se establece su asociación directa sin intervención de otras variables, esta probabilidad aumenta fuertemente hasta cinco veces más, lo que la convierte en una de las fuentes más severas, que sin duda causa perjuicio moral, sicológico y hasta económico por su costo.

Matrícula oportuna

La matrícula oportuna indica la pertenencia al grado modal de la prueba PISA en la escolaridad del alumno según su edad. En términos de influencia directa, la probabilidad es negativamente tan severa como aquella de la repetición, pues un alumno en atraso tiene 7,3 veces más probabilidades de tener bajos rendimiento respecto a aquel que cumple una escolaridad regular16. Ciertamente, la oportunidad va asociada a la repetición, pero también es posible que se pueda estar en atraso simplemente por entrada tardía, voluntaria o no, al sistema, sin haber repetido el grado.

Lengua

El país se caracteriza por poseer una original riqueza multilingüe y multicultural, que plantea al mismo tiempo mayores desafíos educativos para brindar cobertura y calidad a la población de alumnos en cuyo hogar se habla otro idioma distinto del castellano, que es el de la prueba. Hablar castellano en el hogar (92% de los alumnos) produce mayores ventajas en todas las pruebas. Esta ventaja, como es de esperar, es más nítida en Lectura. Las diferencias por idioma son sustanciales: un alumno no hispanohablante tiene 12,9 veces más probabilidades de encontrarse con bajos rendimiento en Lectura respecto a un alumno que habla castellano en su hogar. Esta probabilidad es 9 veces mayor en Ciencia y 8 veces mayor en Matemática.

Tamaño de la escuela

La escuela grande es aquella que atiende 575 alumnos y más; la escuela mediana atiende entre 150 y 574 alumnos; y la pequeña atiende a menos de 150 estudiantes (Ministerio de Educación del Perú – Unidad de Medición de la Calidad Educativa, 2017, p. 59). Los porcentajes que atienden estas escuelas son el 51%, el 34% y el 15% de alumnos, respectivamente.

Según el modelo, cuando se asiste a una escuela pequeña se puede tener casi el doble de probabilidades de obtener bajos rendimientos. Esta dimensión espacial ciertamente no es la determinante mayor, pero muestra vías de exploración.

Ausentismo

Los alumnos que nunca faltan a sus clases obtienen mejor rendimiento que sus compañeros que se ausentan. Las ventajas parecen ser similares en las tres competencias en términos de probabilidad. Se trata de un fenómeno ciertamente complejo que apela a otros enfoques sociales, culturales, económicos y motivacionales.

Los índices motivacionales

A partir de la vasta colección de índices sintéticos disponibles, la modelización efectuada ha permitido detectar tres índices motivacionales como asociados significativamente a los rendimientos y cuyos valores alcanzan a ser tan importantes como aquellos de los índices socioeconómicos. Salvo error, las investigaciones sobre estos factores empiezan a cobrar relevancia en el contexto de la aplicación de pruebas de aprendizajes a escala nacional.

Estos índices son construidos a partir de una batería de preguntas bajo la forma de escala Likert que registra las categorías de respuesta de los alumnos como «muy de acuerdo», «de acuerdo», «en desacuerdo» y «muy en desacuerdo». Una presentación completa se encuentra en el reporte técnico de la OCDE (OECD, 2016).

a)Sentido de pertenencia: el índice (BELONG) fue construido a partir de las afirmaciones siguientes:

Me siento como un extraño en la escuela.

Hago amigos fácilmente en la escuela.

Siento que pertenezco a la escuela.

Me siento incómodo y fuera de lugar en mi escuela.

A otros alumnos parece que les caigo bien.

Me siento solo en la escuela.

Tal como señalan los valores de la razón de probabilidad del modelo precedente, un índice con mayor valor indica un mayor sentido de pertenencia. Un aumento de este índice disminuye la probabilidad desde 1 hasta alrededor de 0,7, es decir, un 30% menos, de obtener bajo rendimiento en todas las competencias. Esta disminución es respetando la condición ceteris paribus del resto de las variables en el modelo.

b)Motivación al logro: el índice de motivación de logro (MOTIVAT) fue construido usando las respuestas de los alumnos a:

Quiero las mejores notas en la mayoría o la totalidad de mis cursos.

Quiero ser capaz de seleccionar las mejores oportunidades disponibles cuando me gradúe.

Quiero ser el mejor en todo lo que hago.

Me considero una persona ambiciosa.

Quiero ser uno de los mejores estudiantes de mi clase.

De manera similar al índice de pertenencia, la mayor motivación de logro favorece sensiblemente la disminución de la probabilidad de tener bajo rendimientos de 1 a 0,7 en las competencias, y, en particular, la Lectura (0,8).

c)Índice de ansiedad: la escala Likert de ansiedad (ANXTEST) mide las respuestas a:

Me preocupa a menudo pensar que será difícil pasar un test.

Me preocupa saber si obtendré buenas notas en la escuela.

Aunque esté bien preparado para un test, me siento muy ansioso.

Me siento nervioso cuando no sé cómo resolver una tarea en la escuela.

Por el contrario, la influencia del índice de ansiedad es nefasta sobre las competencias pues, cuando este aumenta, las probabilidades de obtener bajos rendimientos también crecen un 32,8% en Ciencia, un 40,6% en Matemática y un 24,1% en Lectura.

La figura 5 permite apreciar los efectos de los índices.

Figura 5
Probabilidades de efecto en el alto/bajo rendimiento de los índices motivacionales, según competencias

Nota: error estándar entre paréntesis.
Fuente: elaboración propia a partir de la base de datos Perú – PISA 2015.

Es clara la influencia favorable de los índices motivacionales para prevenir la obtención de bajos rendimientos. El efecto del sentido de pertenencia manifiesta mayor influencia, salvo en Matemática, donde las pendientes son paralelas con la motivación al logro. Por el contrario, en todas las competencias, a medida que el índice de ansiedad aumenta, también aumenta la probabilidad de bajo rendimiento, y con mayor incidencia en Matemática.

Es obvio que otros índices motivacionales y de comportamiento están presentes. Por ejemplo, para explicar el bajo rendimiento desde una perspectiva meritocrática, Wiederkehr et al. (2015) plantean que la percepción de la autoeficacia del alumno es un factor sicológico que explicaría el bajo rendimiento de los alumnos socialmente desfavorecidos.

El interés creciente por estos factores conductuales que suelen asociarse con el rendimiento, invita a abrir nuevas agendas que incorporen en las evaluaciones la medición y el desarrollo de otras habilidades socioemocionales.

5.Conclusiones

Dos décadas de evaluaciones en educación registran ciertamente progresos realizados en la calidad y equidad de los sistemas educativos, pero también constatan que la fractura social marca todavía brechas importantes en el rendimiento de alumnos.

Por eso, analizar los efectos de las condiciones sociales de alumnos y escuelas sobre el rendimiento, ha devenido fundamental para entender los mecanismos que determinan el nivel de los aprendizajes. En este sentido, la aparición oficial del índice UMC-ISE, creado por el organismo responsable de monitorear PISA en el país, es valiosa porque, según sus creadores, se adaptaría precisamente a las características nacionales.

Este índice permite usar regresiones cuyas gradientes muestran sistemáticamente que, conforme este crece hacia posiciones sociales más favorables, también crecen los puntajes. Así, una unidad de aumento en el valor del índice, beneficia al alumno con un incremento de 33,9 puntos en Ciencia, 34,9 puntos en Matemática y, generosamente, 44,4 puntos más en Lectura. Las varianzas de las regresiones también permiten apreciar la fuerza de la relación con el rendimiento. El índice explicaría así el 18,7% de la varianza en Matemática, el 20,3% en Ciencia y el 27,9% en Lectura, valores considerados altos y que indican un fuerte impacto del perfil social, incluso mayores que en los países de la OCDE, donde, por ejemplo, el índice explica el 13% de la varianza en los resultados de Ciencia.

Para medir la variabilidad de logros, la correlación intraclase (ICC) permite medir la importancia del índice social dentro del conglomerado que es la escuela. Cuanto mayor es su valor, menor es la variabilidad dentro del conglomerado y, en consecuencia, mayor es la variabilidad entre los conglomerados Así, la variabilidad entre escuelas es relativamente elevada, de manera que el 44,1% en Ciencia, el 40,1% en Matemática y el 54,8% en Lectura son atribuibles a las diferencias de las características entre escuelas. Por complemento, la otra parte se explicaría por las características del alumno y sus contextos sociales y familiares.

Cuando interviene el índice socioeconómico, el panorama es claro. Los mayores resultados muestran una distinción social elocuente. Según las competencias, entre el 66 y el 72% de alumnos con origen social alto alcanzan también altos rendimientos En contraste, los alumnos de condición social muy baja alcanzan solamente entre el 11 y el 16%. Como es de esperar, cuando se trata de bajos resultados, los alumnos desfavorecidos representan entre el 84 y el 89% y los favorecidos solamente entre el 26 y el 34%.

Asimismo, sea cual fuere su origen social, un alumno mejora su rendimiento si frecuenta escuelas socialmente más favorecidas en donde el ritmo de crecimiento es mayor para los alumnos más favorecidos. Este alumno favorecido, aun si frecuenta una escuela desfavorecida, obtiene siempre mejores resultados que sus compañeros con otro origen social distinto del suyo. En consecuencia, la composición social favorable de la escuela efectivamente mejora los logros de los desfavorecidos, pero nunca será la igualadora de resultados entre alumnos con distinto origen social.

Haciendo intervenir la razón de probabilidades (odds ratios), esta muestra que un alumno desfavorecido tiene siempre mayor probabilidad que un alumno favorecido de pertenecer al grupo de bajos rendimientos: 5,4 veces más probable en Ciencia y Lectura, y 7,8 veces más probable en Matemática. Cuando se hacen intervenir los dos indicadores socioeconómicos juntos, la composición social de la escuela a la que asiste el alumno es el factor dominante de esta relación.

Este trabajo aprovecha la vasta colección de indicadores sintéticos provenientes de los cuestionarios para construir un modelo con un conjunto de variables que se asocian al bajo rendimiento. Se utiliza la regresión logística multinivel de efectos mixtos para explicar la variable binaria alto/bajo rendimiento.

Los criterios de selección AIC y BIC muestran la significatividad de solo 11 variables para explicar el bajo rendimiento. Las variables repetición de grado e idioma del hogar son aquellas que muestran las mayores probabilidades de influencia. Estos dos factores aparecen reiteradamente en los informes e investigaciones y su persistencia reclama la revisión de las políticas educativas que se han implementado para corregir estas desigualdades.

El modelo también indica que, en el bajo rendimiento en Lectura, el género no marca diferencias entre varones y mujeres, como es tradicional en las evaluaciones que no hacen la distinción por nivel. Sin embargo, esta diferencia es siempre favorable a los varones en Ciencia y Matemática. El tamaño de la escuela parece jugar en contra de las pequeñas escuelas, en donde las probabilidades de bajos rendimientos son mayores que en escuelas grandes. Como era de esperar, no ausentarse de clase protege de obtener bajos rendimientos.

Una característica importante en el modelo es la presencia de factores emocionales y motivacionales, como son la pertenencia a la escuela, la ansiedad y la motivación. La emergencia de estos factores motivacionales podría indicar la necesidad de implementar actividades de mejoramiento de un clima escolar favorable, entre otras.

Es insoslayable mencionar aquellos factores que no mostraron efectos significativos asociados al bajo rendimiento. Los recursos y material educativo, la disponibilidad de computadoras por escuela, la ratio alumno/docente, la escasez de personal docente, la proporción de docentes calificados y la participación docente parecen no afectar los bajos rendimientos. A estos factores también se agregan la gestión de los recursos educativos, la autonomía de la escuela y el clima disciplinario en el aula.

Es notable la ausencia de la tradicional diferencia entre escuela pública y privada porque probablemente se asiste a la aparición de nuevas formas y mecanismos de coexistencia entre estas categorías (Balarín, 2015). Asimismo, no se constatan efectos de la educación temprana, tal vez como resultado de la expansión de la educación inicial desde hace algún tiempo.

La ausencia de significatividad de estos y otros factores no entraña una ausencia de políticas educativas respecto de ellos. En particular, las características personales y profesionales de los docentes, los métodos de enseñanza, sus actitudes y compromisos, la participación y compromiso parental, entre otros, que aquí no se han abordado.

Este trabajo pretende contribuir a identificar los efectos de las condiciones sociales de alumnos y escuelas sobre el bajo rendimiento. La atención se ha centrado en distinguir de manera analítica la categoría académica de alto/bajo rendimiento mediante regresiones logísticas mixtas multinivel y el uso simultáneo de valores plausibles como variable criterio, en las tres competencias de la prueba PISA 2015.

La composición socioeconómica de las escuelas demuestra la fuerza de mayor influencia para explicar el bajo rendimiento académico; por eso, la búsqueda de una composición social equilibrada en la cual el origen social no sea factor de discriminación, puede ser un objetivo urgente y primordial de política educativa. Los análisis subrayan que el rendimiento es diferencial según cada competencia y según factores adscritos al alumno y a la escuela; estos resultados respaldan la idea de implementar políticas educativas específicas diferenciadas para unos y otras.

Este trabajo ha centrado su interés en el bajo rendimiento de alumnos en PISA 2015, cuyos resultados modestos muestran nuevamente la necesidad de intervenir con políticas educativas particulares urgentes. Sin plantear relaciones de causa y efecto entre los factores asociados al bajo rendimiento, reconoce que pueden existir mecanismos que generan aspectos de endogeneidad y de interacción entre las variables, que otros análisis deben explorar, y aspira a despertar nuevas interrogantes que sean útiles para sustentar el mejoramiento de los aprendizajes.

Anexos

Anexo 1

Compendio de variables no significativas del modelo final en el bajo rendimiento de alumnos, por competencias PISA 2015. Razón de probabilidad (odds ratio)

Código de la variable y etiqueta

Ciencia

Matemática

Lectura

RESPRES: Responsabilidad de los recursos

0,932

0,912

0,917

(0,103)

(0,666)

(0,077)

CREACTIV: Actividades creativas extracurriculares (Suma)

1,038

(0,048)

0,992

(0,051)

1,020

(0,049)

SCIERES: Índice de recursos en Ciencia (Suma)

0,991

(0,022)

1,010

(0,025)

0,952

(0,024)

TEACHPART: Participación docente (Suma)

1,041

(0,021)

1,015

(0,025)

1,054

(0,024)

EDUSHORT: Escasez de material educativo (WLE)

1,008

(0,025)

1,015

(0,036)

1,032

(0,075)

STUBEHA: Conducta del alumno que afecta el aprendizaje (WLE)

1,074

(0,036)

1,065

(0,047)

1,073

(0,051)

TEACHBEHA: Conducta del docente que afecta el aprendizaje (WLE)

0,957

(0,020)

0,931

(0,032)

0,944

(0,046)

RATCMP_SCH: Número de computadoras por escuela grado modal

0,977

(0,108)

0,911

(0,092)

0,965

(0,068)

STAFFSHORT: Escasez de personal docente (WLE)

0,956

(0,025)

0,995

(0,050)

0,976

(0,036)

PROATCE: Índice proporción de docentes calificados

1,007

(0,134)

1,056

(0,166)

0,653

(0,096)

RESPCUR: Responsabilidad del curricular

0,944

(0,048)

1,026

(0,072)

0,943

(0,054)

SCHAUT: Autonomía promedio de la escuela

0,666

(0,109)

0,963

(0,249)

0,576

(0,240)

STRATIO: Ratio alumno/docente

1,007

(0,004)

1,006

(0,005)

1,010

(0,003)

DISCLISCI: Clima disciplinario en aula Ciencia (WLE)

0,869

(0,081)

0,868

(0,196)

1,080

(0,118)

STRATUM/ Gestión: Estatal

No estatal

1

1,317

(0,556)

1

1,159

(0,412)

1

1,421

(0,466)

ST125Q01NA/ Asistió a preprimaria: No

1

1

1

1,209

(0,330)

1,356

(0,200)

1,115

(0,226)

STRATUM/ Ubicación: Urbano

1

1

1

Rural

1,675

(0,571)

1,490

(0,555)

1,624

(0,578)

Anexo 2

Distribución de puntajes promedios según competencias y cuantiles socioeconómicos de alumnos y escuelas

Ciencia

Matemática

Lectura

Escuelas

Alumnos

Q1

Q1

Q3

Q4

Q1

Q2

Q3

Q4

Q1

Q2

Q3

Q4

Q1

337,4

362,8

398,3

431,7

335,3

347,5

384,3

423,6

326,4

352,2

401,9

443,1

(4,66)

(4,50)

(4,73)

(4,36)

(4,19)

4,827

(5,18)

(5,50)

(4,51)

(5,49)

(4,69)

(6,32)

Q2

345,8

377,9

410,3

453,4

335,9

367,9

400,1

445,5

325,7

378,6

420,5

466,4

(4,26)

(4,27)

(4,29)

(7,00)

(5,02)

(6,07)

(5,65)

(5,59)

(4,44)

(6,38)

(5,92)

(6,04)

Q3

346,7

386,3

420,2

453,4

336,6

368,9

408,5

450,8

330,7

379,6

429,9

477,5

(4,55)

(4,71)

(4,66)

(5,64)

(5,56)

(5,80)

(5,08)

(7,51)

(5,57)

(5,33)

(5,37)

(6,58)

Q4

355,0

392,4

426,0

467,8

345,3

379,8

416,7

458,8

339,1

393,9

437,5

479,8

(4,77)

(4,43)

(4,79)

(7,62)

(5,55)

(5,80)

(5,66)

(6,60)

(5,88)

(5,86)

(5,58)

(7,76)

Nota: error estándar entre paréntesis.
Fuente: elaboracion propia a partir de la base de datos Perú – PISA 2015.

Referencias

Agüero, J., & Cueto, S. (2004). Dime con quién estudias y te diré cómo rindes: peer-effects como determinantes del rendimiento escolar. Lima: CIES – Consorcio de Investigación Económica y Social.

Angrist, J., & Pischke, S. (2008). Mostly harmless econometrics: An empiricist’s companion. Princeton University Press.

Balarín, M. (2015). Las múltiples formas y efectos de la participación del sector privado en la educación. Lima: Proyecto Forge – Grupo de Análisis para el Desarrollo (Grade).

Benavides M., León, J., & Etesse, M. (2014). Desigualdades educativas y segregación en el sistema educativo peruano. Una mirada comparativa en las pruebas PISA 2000 y 2009. Lima: Grade.

BID-CIMA. (2016). PISA 2015: ¿cómo le fue a la región? Washington D. C.

Caro, D., & Lenkeit, J. (2012). An analytical approach to study educational inequalities: 10 hypothesis tests in PIRLS 2006. International Journal of Research & Method in Education, 35(1), 3-30.

Carraso, G. (2007). Calidad y equidad en las escuelas peruanas: un estudio del efecto escuela en la prueba de Matemática – PISA 2000. Lima: CIES (Consorcio de Investigación Económica y Social) – Desco (Centro de Estudios y Promoción del Desarrollo).

Coleman, J. S. (1966). Equality and educational opportunity. Washington D. C.: US Congressional Printing Office.

Cordero, J., Crespo, E., & Pedraja, F. (2013). Rendimiento educativo y determinantes según PISA: una revisión de la literatura en España. Revista de Educación, 362, septiembre-diciembre.

Cuenca, R., Carrillo, S., de los Ríos, C., Reátegui, C., & Ortiz, G. (2017). La calidad y equidad de la educación secundaria en el Perú. Documento de Trabajo 237. Instituto de Estudios Peruanos.

Cueto, S. (2007). Las evaluaciones nacionales e internacionales de rendimiento escolar en el Perú: balance y perspectivas. En Grupo de Análisis para el Desarrollo (Ed.), Investigación, políticas y desarrollo en el Perú (pp. 405-455). Lima.

Gamazo, A., Martínez, F., Olmos, S., & Rodríguez, M. (2018). Evaluación de factores relacionados con la eficacia escolar en PISA 2015. Un análisis multinivel. Revista de Educación (España), 379, enero-marzo.

Greene, W. (2018). Econometric Analysis. 8.ª ed. Pearson Education Ltd.

Guadalupe, C., & Villanueva, A. (2013). PISA 2009/2000 en América Latina: una relectura de los cambios en el desempeño lector y su relación con las condiciones sociales. Apuntes: Revista de Ciencias Sociales, 40(72), 157-192.

Hanushek, E., & Woessmann, L. (2008). The role of cognitive skills in economic development. Journal of Economic Literature, 46(3), 607-668.

León, J., & Collahua, Y. (2016). El efecto del nivel socioeconómico en el rendimiento de los estudiantes peruanos: un balance de su efecto en los últimos quince años. Lima: Grade (Grupo de Análisis para el Desarrollo).

León, J., & Youn, M.-J. (2016). El efecto de los procesos escolares en el rendimiento en matemática y las brechas de rendimiento debido a diferencias socioeconómicas de los estudiantes peruanos. Revista Peruana de Investigación Educativa, 8, 149-180.

Lindsay, C. (2014). VSELECT: Stata module to perform linear regression variable selection. Boston College Department of Economics.

Ministerio de Educación del Perú – Unidad de Medición de la Calidad Educativa. (2006). Evaluación nacional del rendimiento estudiantil 2004. ¿Cómo disminuir la inequidad del sistema educativo peruano y mejorar el rendimiento de sus estudiantes? Factores explicativos más relevantes en la Evaluación Nacional 2004. Lima: Autor.

Ministerio de Educación del Perú – Unidad de Medición de la Calidad Educativa. (2017). El Perú en PISA 2015. Informe nacional de resultados.

Miranda, L. (2008). Factores asociados al rendimiento escolar y sus implicancias para la política educativa del Perú. En Análisis de programas, procesos y resultados educativos en el Perú: contribuciones empíricas para el debate (pp. 11-39). Lima: Grade (Grupo de Análisis para el Desarrollo).

Monseur, C., & Crahey, M. (2008). Composition académique et sociale des établissements, efficacité et inegalité scolaires. Une comparaison internationale. Revue Française de Pédagogie, RFP, 164, 55-65.

Muelle, L. (2016). Factores de riesgo en el bajo desempeño académico y desigualdad social en el Perú según PISA 2012. Apuntes, XLIII(79), 10-45.

Murillo, J. (2007). Investigación iberoamericana sobre eficacia escolar. Bogotá: Convenio Andrés Bello.

OECD (Organisation for Economic Co-operation and Development, París). (2011). Against the odds: Disadvantaged students who succeed in school.

OECD (Organisation for Economic Co-operation and Development, París). (2016). PISA 2015 results: Excellence and equity in education, vol. I.

OECD (Organisation for Economic Co-operation and Development, París). (2017). How do schools compensate for socio-economic disadvantage? PISA In Focus, 76.

Perry, L., & McConney, A. (2010). School socio-economic composition and student outcomes in Australia: Implications for educational policy. Australian Journal of Education, 54(1), 72-85.

Rabe-Hesketh, S., & Skrondal, A. (2012). Multilevel and longitudinal modeling using Stata. 3.ª ed. College Station, TX: Stata Press.

Raudenbush, S., & Bryk, A. S. (2002). Hierarchical linear models: Applications and data analysis methods. 2.ª ed. Thousand Oaks, CA: Sage.

Sirin, S. (2005). Socioeconomic status and academic achievement: A meta-analytic review of research. Review of Educational Research, 75(3), 417-453.

von Davier, M., Gonzales, E., & Mislevy, R. (2009). What are plausible values and why are they useful? IERI Monograph Series: Issues and Methodologies in Large-Scale Assessments, 2, 9-36.

Wiederkehr, V., Damon, C., Chazal, S., Guimond, S., & Martinot, D. (2015). From social class to self-efficacy: Internalization of low social status pupils’ school performance. Social Psychology of Education, 18(4), 1-16.


1 Luis Muelle es doctor en Economía de la Educación por la Université de Bourgogne (Francia). Fue investigador del Inide (Instituto Nacional de Investigación y Desarrollo Educativo – Perú), director de Investigaciones Sociales del Concytec (Consejo Nacional de Ciencia y Tecnología – Perú), docente en el CIEP (Centre International d’Études Pédagogiques – Francia) y consultor para la Unión Europea. Actualmente es consultor en educación y trabaja en temas de economía de la educación, evaluación de logros y desigualdad social. El autor agradece a los revisores por sus comentarios pertinentes.

2 Además, en la región latinoamericana, el país participó también en las evaluaciones del Laboratorio Latinoamericano de Calidad Educativa (Llece-Unesco) que se realizaron en 1997, 2006 y 2013.

3 Muchas de las variables de contexto y no contextuales del alumno y de la escuela disponibles en la base de datos son resumidas a partir de técnicas de análisis factorial y de respuesta a los ítems (IRT) derivados de las respuestas a los cuestionarios.

4 Los econometristas suelen atribuir las diferencias en el logro a la «endogeneidad de nivel 2» de las covariables referidas a los alumnos con las características no observadas de la escuela, mientras que los educadores prefieren interpretar estas diferencias como efectos contextuales y efectos de pares sobre el logro (Rabe-Hesketh & Skondral, 2012).

5 Se anota que los cálculos toman en cuenta los respectivos 10 valores plausibles de la variable binaria alto/bajo rendimiento para cada disciplina.

6 También se debe destacar que este índice permite establecer los niveles socioeconómicos de los alumnos, llamados NSE, a partir de sus percentiles 35, 60 y 85 (Ministerio de Educación del Perú –
Unidad de Medición de la Calidad Educativa, 2017, p57).

7 Las unidades de escala en el eje de densidades se expresan en probabilidades por unidad de medida de los respectivos índices socioeconómicos. En este sentido, el área bajo la curva representa una integral de valor 1, es decir, la probabilidad total de la distribución.

8 Se anota que, en ambos casos, alumnos y escuelas, el índice UMC-ISE es más favorable que el índice ESCS de la OCDE, hecho que se debe considerar cuando se trata de comparar la asociación de estos índices y el rendimiento escolar.

9 Aunque ambos índices buscan medir la condición socioeconómica del alumno, se recuerda que el índice ISEC de PISA es diferente del índice UMC-ISE del país.

10 Alternativamente, también es una medida de cuánta variación existe en cada nivel, y por esta razón también se le llama coeficiente de partición de la varianza (VPC por sus siglas en inglés).

11 Para el conjunto de países participantes en PISA 2015, por ejemplo, esta correlación intraclase en Ciencia es del 30,1% (OECD, 2017, p. 227).

12 La regresión logística es en realidad una regresión lineal ordinaria que usa como variable de respuesta el valor logit. La transformación del logit permite una transformación lineal de esta relación entre la variable respuesta (dependiente) y los coeficientes. El valor de la constante es el valor esperado de los log-odds del rendimiento cuando todas las variables valen cero.

13 Este principio está presente con los procedimientos de análisis jerárquicos multinivel.

14 Muchas de las 48 variables poseen valores perdidos con más del 10%. Sus efectos de eliminación multiplicativa de las demás variables y de multicolinealidad son altamente arriesgados.

15 Es más, el valor del factor de inflación de la varianza VIF (variance inflation factor, en inglés) es de tan solo un 1,6%, menor que el límite usualmente aceptado del 5% para deslindar la colinearidad entre variables.

16 En el momento de establecer el muestreo en el país, el 75,3% de los alumnos cursan el grado que deberían (4.º y 5.º de secundaria).