José Luis GaviriaSalto de línea Covadonga Ruiz de MiguelSalto de línea Universidad Complutense de Madrid.
Importance of Specific ‘Psychometric’ Assumptions in the Calibration and Comparison of the Tests Used for the Assessment of Education Systems. Mexico's ‘National Standards’ CaseSalto de línea Salto de línea The study of the evolution of students' performance through time seems to be especially significant in the assessment of national education systems. In order to make comparisons, tests of different years or different forms of the same year should be put on the same level, using for this purpose suitable ‘psychometric’ models. These models assume certain assumptions, and in the case of not being taking into account, they may introduce variations in the results which do not correspond to the variation of students' performances, but they turn to be a kind of design's artful devise. In this article we explain how the design and estimate procedures of individual scores, as well as variations in the dimensional complexity of the tests, may affect comparisons, both horizontally and vertically, thus giving rise to relevant inconsistencies in the results. As an example, this article analyses the specific case of the Mexican programme on ‘National Standards’.
Education system assessment, item response theory, comparison assumptions, factorial structure, ‘one-dimensionality’ assumption.
En las evaluaciones de los sistemas educativos nacionales es muy importante el estudio de la evolución de los rendimientos de los alumnos a lo largo del tiempo. Para que sea posible realizar comparaciones, las pruebas de distintos años o de distintos grados en el mismo año deben ser equiparados, utilizando para ello, modelos «psicométricos» adecuados. Estos modelos «psicométricos» asumen ciertos supuestos, que en el caso de no ser tenidos en cuenta, pueden introducir variaciones en los resultados que no corresponden a variaciones de los conocimientos de los alumnos, sino que son un artificio del diseño. En este artículo se explica cómo el diseño de las pruebas y los procedimientos de estimación de las puntuaciones de los sujetos, así como las variaciones en la complejidad dimensional de las pruebas pueden afectar a la equiparación, tanto horizontal como vertical, dando lugar a inconsistencias importantes en los datos de años distintos. Como ejemplo se analiza el caso concreto del programa «Estándares Nacionales» de México.
Evaluación de sistemas educativos, Teoría de respuesta al ítem, Supuestos en la Equiparación, Estructura factorial, Supuesto de unidimensionalidad.