Evaluación de la Inteligencia y de las Aptitudes desde el Enfoque Factorial

Introducción

En este capítulo veremos algunos de los instrumentos de evaluación de la inteligencia y aptitudes, desarrollados en relación con distintas teorías sobre la organización y naturaleza de la inteligencia, puestas a prueba mediante el método del análisis factorial.

Contexto teórico: posibilidades y límites del análisis factorial

Si tenemos seis tests de, por ejemplo, vocabulario, comprensión de frases, analogías verbales, rotación de figuras, cubos y completamiento de figuras y hallamos las correlaciones entre las puntuaciones obtenidas por un grupo de sujetos en estas seis pruebas, veremos que todas las pruebas correlacionan positivamente y que las tres primeras correlacionan más entre ellas que con las tres últimas, ocurriendo lo mismo si comparamos las correlaciones de las tres últimas con las primeras.
Esto nos lleva a plantearnos si se puede hablar de la inteligencia como capacidad general o, por el contrario, lo que existen son diferentes aptitudes o capacidades específicas. Estas preguntas se intentan responder utilizando el análisis factorial. Su uso pone de manifiesto dos cosas:
En primer lugar que la inteligencia no es un rasgo unitario. A partir de las correlaciones obtenidas se han identificado ciertas habilidades entre las que se encuentran los factores verbal, numérico, etc.
En segundo lugar se ha puesto de manifiesto que la inteligencia no es un conjunto de rasgos inconexos. Los datos obtenidos sugieren la existencia de un factor general conocido como factor G.

La inteligencia como capacidad general

El factor G

Desde un punto de vista matemático, el factor G es lo que un amplio conjunto de test tienen en común. Es un constructo hipotético que hace referencia a una dimensión lineal en la que se ordenan las puntuaciones que se obtienen en unos determinados tests.
En principio no cabe considerar G como un factor único, por lo que hay que definir cuál es el dominio en el que queremos estudiar las variables y cómo saturan éstas en el factor G.
Spearman (1927) llegó a la conclusión de que el proceso psicológico que subyace a los resultados que reflejan la existencia del factor G es un proceso "neogenético" y de abstracción. Haciendo referencia el término neogénesis a tres aspectos: capacidad de introspección, capacidad de deducir las relaciones esenciales y capacidad de deducir correlatos.
Basándose en esto, Spearman propuso sustituir los elementos heterogéneos que incluían los tests de inteligencia por tests muy saturados en G.

Entre las tareas que más saturan G están: Matrices progresivas (Raven), analogías verbales, continuación de series, razonamiento sobre problemas aritméticos, comprensión de párrafos y analogías figurales y clasificaciones de figuras.
Los tests de clausura constituyen también una buena medida de G, ya que se trata de la integración en un todo de partes que parecen ser inconexas.
En otros casos se ha comprobado que la saturación en G se incrementa a medida que una tarea se hace más compleja. Parece pues, que la complejidad de la tarea y la cantidad de actividad o manipulación mental consciente que requiere su solución, son los principales determinantes del grado en que la tarea satura en G. Destacándose la importancia de que el proceso sea consciente y de la novedad, que elicita este proceso mental consciente.

Catell (1963) dedujo la existencia de dos factores generales en lugar de un único factor G, aunque los dos factores obtenidos correlacionan entre sí en un alto grado.
Catell distinguió entre "inteligencia general fluida" (Gf) e "inteligencia general cristalizada" (Gc).

La inteligencia fluida (Gf) se caracteriza por:
  • Se mide por tests de material nuevo en los que es importante la rapidez en hallar la solución, tienen poco material informativo y exigen capacidad de percibir relaciones complejas entre elementos simples.
  • Aumenta de modo constante pero rápido, alcanzando un máximo a los 18 ó 20 años, disminuyendo más rápidamente a partir de los 55 ó 60.
  • Parece estar determinada por factores hereditarios y por influencias fisiológicas, lo que le hace presentar cierta fluctuación diaria.
  • Correlaciona de modo elevado con la rapidez en el aprendizaje de áreas nuevas.
La inteligencia cristalizada (Gc) se caracteriza por:
  • Se mide mediante test de poder mental, no cronometrados, en los que lo importante es la ausencia de errores y se requiere la utilización de conocimientos y habilidades previamente adquiridos.
  • Aumenta de modo más gradual de la infancia a la madurez que Gf y, aunque la tasa de crecimiento es negativamente acelerada entre los 13 y los 20 años, no parece declinar hasta los 60 ó 70 años.
  • Parece estar parcialmente determinada por las influencias culturales y presenta poca fluctuación diaria, al parecer por estar constituida por sistemas de hábitos adquiridos.
  • Correlaciona poco con la rapidez en el aprendizaje de tareas nuevas.
Debido a que las personas con elevado Gf pueden adquirir información más rápidamente, la correlación entre Gf y Gc es elevada y hace que ambos aspectos de G no se puedan distinguir en un análisis factorial.
Se ha intentado resolver el problema recurriendo a las bases fisiológicas de la conducta cognitiva. Se han estudiado los potenciales evocados que correlacionan positivamente con G, en especial con Gf. Pero los potenciales evocados correlacionan positivamente con todo los tests y no sólo con algunos, por lo que hay que continuar los estudios en esa dirección.

Principales tests de factor G

Tests de Matrices progresivas (Raven)

Se refiere a un conjunto de tests de estructura análoga. Los elementos de estas pruebas son de dos tipos. Los más sencillos son de completamiento gestáltico. La mayoría son de razonamiento analógico siendo necesario considerar dos dimensiones para su solución. Las figuras cambian de izquierda a derecha y de arriba a abajo según dos principios que el sujeto tiene que identificar y elegir una respuesta entre las que se proponen.
Son útiles para una estimación rápida del funcionamiento intelectual. Pero en el contexto clínico la utilidad es limitada.

Tests de dominós

Son medidas casi puras de G. Los índices de fiabilidad están por lo general por encima de 0,85. Pero apenas hay estudios sistemáticos sobre validez predictiva.

Tests de factor G, escalas 1, 2 y 3 (Catell, 1959)

Pretenden evaluar el funcionamiento intelectual, estando libres de condicionamientos culturales.
Escala 1: Integrada por las siguientes pruebas: Sustitución, identificación, semejanzas, clasificación, errores y adivinanzas. Esta escala es aplicable a niños de 4 a 8 años y a adultos con deficiencia mental.
Escalas 2 y 3: Formadas por cuatro subtests perceptivos: Series, Clasificación, Matrices y Condiciones. La forma 2 se aplica entre los 8 y los 13 años y la forma 3 desde los 14 en adelante.
En las tres escalas, las puntuaciones obtenidas en los subtests se combinan para tener una puntuación directa que luego se pasa a centil o a CI de desviación. La saturación de G hallada varía en torno a 0,90 pero la validez predictiva no supera el valor de 0,27.

Las aptitudes intelectuales

Teorías sobre la organización de las aptitudes

Se pretende conocer en profundidad áreas y factores aptitudinales específicos que permitan una predicción del rendimiento de las personas en función de sus talentos y debilidades específicas, para aprovechar al máximo las diferencias de aptitud y colocar a las personas en aquello que saben hacer mejor. El trabajo se ha orientado por teorías concretas, que pueden clasificarse en dos grupos:
  1. Teorías jerárquicas. Suponen que las diferencias individuales se pueden explicar en base a un factor general y a una serie de factores de grupo. El hecho de que unos tests saturen en gran medida un factor y poco en los demás sería la base para reconocer la existencia de aptitudes o factores de grupo.
  2. Teorías multifactoriales: Se sustentan en el uso de métodos de análisis factorial que minimizan la posibilidad de obtener un factor general y maximizan la posibilidad de obtener factores independientes. Las dos más importantes son la "Teoría de los factores múltiples" de Thurstone y la teoría de Guilford que postula un modelo de "Estructura del Intelecto". Este modelo clasifica las aptitudes intelectuales en base a la interacción de tres dimensiones: Operaciones, contenidos y productos.

Aptitud verbal

Thurstone consideró que existen tres factores verbales: (V) comprensión verbal, (W) fluidez verbal y (F) fluencia ideacional. Según Carrol (1941), V puede descomponerse en (C) manejo de respuestas verbales convencionales y (J) razonamiento verbal. Y W puede descomponerse en (A) facilidad para manejar respuestas según ciertas reglas y (E) velocidad en la producción de un discurso coherente.
Según Yela (1969) V puede descomponerse en tres factores: a) semántico, b) lingüístico y c) ideativo.
Se ha señalado que V es útil para cursar estudios de lengua, historia, etc., y que W es útil para estudios de periodismo o arte dramático. Pero los índices de validez predictiva no son demasiado altos, por lo que la predicción es compleja, igual que la identificación de los factores responsables de que un sujeto presente un bajo nivel de aptitud verbal en el contexto educativo.

Aptitud espacial

La mayoría de los estudios de aptitudes identifican un factor que se califica con el adjetivo de espacial.
El modelo que mejor resume los resultados de los análisis factoriales de los tests espaciales es un modelo jerárquico. Hay varios factores espaciales, por lo que evaluar esta aptitud utilizando un único test puede llevar a conclusiones erróneas.
  • Factor de visualización espacial (Vz), es el más general. Los test que lo miden son pruebas complejas en las que no es importante la velocidad. Unos requieren la rotación, flexión, etc., otros la combinación de diferentes figuras.
  • Factor de orientación espacial (So), exigen imaginar como se vería el objeto desde otra perspectiva. Sus puntuaciones correlacionan en gran medida con las de Vz.
  • Factor de relaciones espaciales o velocidad de rotación. Exigen procesos rápidos y precisos de rotación mental, para juzgar si dos estímulos son iguales o no. Cuando los elementos a rotar aumentan en complejidad los test saturan en Vz y no en Sr.
Según Lohman (1988) las medidas de aptitud espacial no sirven para predecir el éxito en las materias escolares tradicionales, aunque sí es estudios de ingeniería, delineación, dibujo...
La actitud espacial no es una aptitud unitaria y para evaluarla nos hemos de plantear qué tipos de actitudes están implicadas en las tareas criterio.
Las puntuaciones en aptitud espacial mejoran tras cursos de delineación y dibujo, lo que puede hacer pensar que la falta de experiencia con problemas espaciales puede ser la causa de las bajas puntuaciones.

Razonamiento

Las tareas que más saturan en los factores de razonamiento son las que más saturan en G, sin embargo hay muchas baterías que incluyen tests de razonamiento como algo distinto de G.
Los factores que han aparecido con más frecuencia son:
  • Inducción. Fundamentalmente en los tests de series, clasificación de figuras y analogías.
  • Deducción. Test de tipo silogístico que implican extraer unas consecuencias de unas premisas dadas.
  • Razonamiento. Implican resolver problemas que tienen una solución única.
Estos factores parecen corresponder a las operaciones de la lógica clásica, pero no son los únicos. Guilford separó los factores anteriores, que entran dentro de lo que él consideró Cognición y Pensamiento Convergente, de los factores encontrados en las tareas que requieren el empleo del Pensamiento Divergente (dar todas las soluciones que pueda a un problema).
Así tenemos unas tareas que unas veces saturan unos factores y otras veces otros, sin que podamos determinar claramente las causas de variabilidad de los sujetos, por lo que el empleo de estos test es dudoso que optimicen decisiones de selección o intervención.

Otras áreas aptitudinales

Estas pruebas presentan problemas semejantes a las anteriores, es decir, varían en su saturación en los distintos factores, por lo que es difícil determinar el origen de las diferencias individuales.
  1. Memoria: Parece que existen distintos factores de memoria dependiendo del material a recordar, de la forma de recepción de la información, de su complejidad, etc. No obstante agrupamos los factores en dos generales:
    1. Memoria repetitiva, en la que se recuerda literalmente un material concreto.
    2. Memoria significativa, en la que el sujeto debe reconstruir y reestructurar la información al tratar de recordarla. Este factor aparece menos claramente ya que los test que lo incluyen suelen saturar G.
  2. Cálculo numérico: Menos estudiado. Son pruebas que requieren rapidez y exactitud en cálculos aritméticos sencillos. Es un factor estable y contribuye a predecir el éxito en tareas de aritmética, estadística, etc., pero no presenta relación con la aptitud para la matemáticas.
  3. Aptitud perceptiva: Hay numerosos factores, el más claramente identificado es el de Rapidez y Precisión perceptiva, que aparece cuando hay que localizar rápidamente una figura en función de unos detalle visuales. Contribuye a predecir el éxito en tareas administrativas, trabajos de taller, etc.
  4. Aptitudes psicomotoras: Estudiados principalmente por Fleishman (1954, 1956). Sus trabajos indican que a la hora de seleccionar pruebas de evaluación hay que tener en cuenta que:
    • Las tareas psicomotoras implican aptitudes intelectuales (espacial, rapidez, precisión perceptiva...).
    • Incluyen además factores de tipo motor (tiempo de reacción, firmeza brazo-mano, rapidez del movimiento del brazo...).
    • Los test psicomotores que miden factores diferentes presentan correlaciones muy bajas entre sí, lo que descarta la idea de una aptitud psicomotora de tipo general.
    • Las aptitudes psicomotoras varían con la práctica. Hay que tenerlo en cuenta pues si no, las conclusiones sobre el rendimiento de los sujetos pueden ser erróneas.
  5. Aptitudes mecánicas: Estas aptitudes son el resultado de la combinación de la capacidad de visualización espacial, velocidad y exactitud perceptivas y de la información mecánica. En algunos casos también entran factores de tipo motor.

Principales baterías para la evaluación de las aptitudes

Como consecuencia de todo lo anterior, también se han desarrollado baterías para la evaluación de otras aptitudes que pueden ser aplicadas a la obtención de un perfil.

Entre otras, tenemos las siguientes:

"Test de habilidades mentales primarias" (PMA)

Desarrollada por Thurstone y Thurstone en 1941, hay una versión adaptada por TEA para la población española de 11 a 18 años. Permite el estudio de diferencias individuales en cinco factores:
  • V: Comprensión verbal. 50 elementos. Se presenta al sujeto una palabra y tiene que elegir en una lista de cuatro cuál tiene el mismo significado.
  • E: Concepción espacial. 20 elementos. Hay que identificar entre seis figuras cuál es igual a la dada.
  • R: Razonamiento. 30 elementos. Hay que elegir qué letra, entre seis, completa la serie dada.
  • N: Cálculo numérico. 70 elementos. Se presentan sumas que hay que verificar.
  • W: Fluidez verbal. Hay que escribir en cinco minutos el mayor número posible de palabras que empiezan por una letra dada.
Es fundamental la velocidad de ejecución, se disponen de 4 a 6 minutos según la prueba. Y el manual presenta los datos necesarios para el tratamiento de los resultados.

Batería de aptitudes diferenciales (DAT)

Se publica en 1947 para servir de orientación a los alumnos de secundaria americanos. No se pretende medir actitudes primarias aisladas factorialmente, como el PMA, sino habilidades complejas relacionadas con diferentes criterios de rendimiento.
En la adaptación a nuestro país se excluye la prueba de Ortografía y Sintaxis, ya que habría que elaborar una prueba nueva para nuestro idioma. Así que la adaptación española tiene los siguientes tests.
  • VR: Razonamiento verbal. 50 elementos. Hay que completar una analogía verbal a la que le faltan la primera y la última palabra.
  • NA: Aptitud numérica. 40 elementos. Hay que escoger la respuesta correcta a diferentes operaciones aritméticas, sumas, restas, multiplicaciones, divisiones, raíces cuadradas, cúbicas, porcentajes y proporciones.
  • AR: Razonamiento abstracto. 50 elementos. Hay que completar series de figuras geométricas tras descubrir la regla de formación.
  • SR: Relaciones espaciales. 60 elementos. Hay que elegir entre las alternativas dadas qué dibujo tridimensional corresponde al que se formaría plegando el modelo.
  • MR: Razonamiento mecánico. 68 elementos. Son dibujos de situaciones y objetos de la vida diaria. En relación con ellos se plantean problemas para cuya solución se necesita el conocimiento de algún principio mecánico.
  • CSA: Rapidez y precisión perceptivas. Hay que elegir el grupo de cifras y/o letras que ha sido subrayado en el cuadernillo de problemas y señalarlo en la hoja de respuestas.
Con excepción del CSA, en el resto de las pruebas la velocidad no es importante y se dispone de 15 a 30 minutos para completarlas.
Además de las puntuaciones correspondientes a cada uno de los tests, el manual presenta baremos para la puntuación combinada de (VR+NA), índice que sirve para los mismos propósitos que los tests colectivos de inteligencia general o aptitudes escolares.

La fiabilidad de las pruebas es muy aceptable. En cuanto al éxito académico, lo que subyace es un factor general, por lo que se creó la combinación (VR+AR) que correlaciona entre 0,70 y 0,80 con los criterios combinados de rendimiento académico.

Criterios para la utilización e interpretación de las pruebas de inteligencia y aptitudes

Los tests de aptitudes en selección de personal

Para que la decisión de selección de personal sea adecuada es necesario conseguir dos cosas: a) conocer qué aptitudes son las adecuadas, y b) conocer si son estables y permiten predecir eficazmente el rendimiento. Pero esto encierra varias dificultades:
  1. La situación ideal sería contar con uno o varios tests de aptitudes, pero esta situación no es la habitual. Ningún procedimiento ha demostrado ser totalmente válido al respecto, por lo que la consideración de unas aptitudes u otras como responsables del rendimiento debe formularse con carácter hipotético.
  2. Hay que ver el grado en el que el sujeto reúne las aptitudes adecuadas. Podría verse cómo se desenvuelve el sujeto realizando el trabajo en cuestión. Esto tiene la mayor validez ecológica, pero requiere un nuevo examen para cada puesto, lo que puede ser muy costoso. La alternativa es evaluar a los sujetos con una batería de pruebas sobre aptitudes básicas. Esto a veces es problemático porque hay tests factoriales que miden cosas distintas y llevan el mismo nombre, y viceversa, pudiendo no ser equivalentes. Por otra parte, a veces no está claro qué es lo que determina las diferencias individuales. Así que antes de seleccionar las pruebas hay que hacer un análisis de las mismas para ver cuál es su contenido y cuál la evidencia en que se apoyan.
  3. Realizar una selección sin validar la prueba puede tener consecuencias negativas.
  4. Los autores de un test presentan datos sobre la validez predictiva, pero hay que considerar en qué medida estos datos son aceptables en cada nueva situación. Las correlaciones suelen variar de una muestra a otra. Se requiere la realización periódica de estudios de validez cruzada, destinados a comprobar se los datos sobre la validez continúan manteniéndose.
  5. Aún cuando tengamos información sobre la validez cruzada de un tests de aptitudes, hay que considerar cuando los coeficientes de validez son aceptables y si utilizar el test para facilitar la toma de decisiones justifica el tiempo y el costo que le dedicamos.
  6. Tenemos que ver si el test se utilizará solo (hay que elegir el que tenga correlación con el criterio más alta) o en combinación con otros. En este caso hay que ver qué tests empleamos y si merece la pena introducir alguna prueba más (añadiendo un test a los tres o cuatro primero rara vez se consigue un incremento aceptable en los coeficientes de correlación múltiple).
La conclusión general es que la utilización de los tests de aptitudes en selección de personal implica tanto un conocimiento de las fuentes de diferencias individuales en el test concreto, como un proceso de validación al que no se debe renunciar.

Los tests de aptitudes en orientación profesional y vocacional: interpretación de los perfiles de aptitudes

Nunca deben tomarse los datos como algo absoluto, dado que la interpretación de los perfiles de aptitudes tropieza con varias dificultades.
  • En primer lugar hay que tener en cuenta que el perfil es función de las características del grupo en base al que se han construido los baremos con los que se compara al sujeto para obtener sus puntuaciones. Es importante comparar al sujeto con el grupo de personas con la que va a competir y no con la gente en general.
  • En segundo lugar, hay que considerar que la precisión de la medida de las aptitudes que hacemos con unos tests concretos no siempre es la deseable. La precisión depende de la fiabilidad, pero ésta puede variar del test al retest. Por ello es necesario tomar precauciones:
    • Comparar los resultados de los tests con los antecedentes del sujeto.
    • Hacer un retest, si es posible.
    • Calcular el rango probable de las puntuaciones.
  • Es importante no sólo considerar la fiabilidad de cada puntuación, sino también la fiabilidad del perfil, es decir la de las diferencias obtenidas entre las puntuaciones en el mismo. Es frecuente que el orientador haya de basar su consejo en estas diferencias, pero estas diferencias son menos fiable que las propias puntuaciones.
  • Por último hay que considerar que las actitudes pueden no ser estables y sin embargo el consejo del orientador se basa en las actitudes actuales y en el supuesto de que el perfil de las mismas será estable durante un largo período de tiempo.

Compartir