Don Ramón, psicología laboral

Publicado el ramon_chaux

Hacia una medición eficiente de competencias (o desempeño)

checklist-1622517_960_720

El sueño de los primeros científicos sociales (positivistas) fue crear instrumentos para medir los procesos mentales de una manera tan confiable como lo hace un termómetro, una báscula o una cinta métrica. Poder decir con absoluta confianza, entre 1 a 10, usted tiene 7 de inteligencia, 6 de integridad y 4 de adaptabilidad social, por ejemplo.

Todos esos esfuerzos se vieron truncados por la naturaleza insondable del alma y mente humana, que no se puede medir con los mismos principios de los fenómenos físicos (temperatura, peso, distancia).

Con el deseo ferviente de obtener medidas lo más precisas posibles, los científicos usaron escalas continuas para medir las actitudes y competencias (asumiendo que los procesos internos o mentales, también son un continuo).

Con este objetivo en mente surgieron las escalas. De las más conocidas y usadas está la escala tipo Likert y sus diversas variaciones. Ejemplo

“Mi líder es una persona íntegra, que cumple lo que dice”:

escala-lickert

Otra variación de una escala similar puede ser:

En una escala de 1 a 5 donde 5 es completamente íntegro y 1 nada íntegro, como calificaría usted a su líder:

escala-dos

Esta forma de evaluación tiene, al menos, dos problemas, ambos graves como para alterar severamente los resultados de nuestra evaluación:

Problema Uno:

Con este tipo de medición es muy frecuente que se obtengan respuestas que yo llamo “comodín”. Para graficarlo mejor, se ven demasiados casos donde una persona inicia calificando con 3 y termina con 3. Es decir, hay un momento en el que la persona que responde nota que la escala no varía, se define por un número de la escala y sigue usándolo invariablemente. Califica a la persona con un solo número no importa si la pregunta cambia, inicia con 3 y finaliza con 3, alternando algunos 4 para no dejarlo tan evidente. Usualmente las personas se decantan por los números del medio (3 o 4). Casi que podría actuar como adivino y decir que cualquier evaluación que se haga con esta técnica va a obtener un promedio de 3,5 o 3,7. Por la ley del menor esfuerzo (detenerse a pensar en cada pregunta) y además por no comprometerse demasiado al emitir juicios sobre personas (o sobre si mismo), se elige un punto de la escala “medio” y con ese se responde toda la evaluación.

Problema dos:

El segundo problema tiene que ver precisamente con asumir la variable psicológica como un continuo. Matemáticamente, al ser una escala continua permite un promedio, ¿Pero que significa exactamente un promedio de 3.5? La respuesta parece sencilla pero no lo es. Imaginemos un instrumento de solo dos preguntas, donde en una se obtiene una calificación de 5 y en la otra una puntuación de uno. El promedio resultante es 3.

¿Qué significado tiene ese 3 en la competencia? Técnicamente un 3 significa la calificación del medio pero la real nos dice que fueron dos opuestos (un 1 y un 5), es decir que el promedio pierde su capacidad de discriminación. Aunque pareciera que al aumentar el número de preguntas el asunto se resuelve, resulta que no. La tendencia central no refleja para nada, o casi nada, la dimensión de la competencia evaluada.

¿Por qué persiste el error? Porque la naturaleza del constructo que intentamos medir no es un continuo, no es un fenómeno físico. Con la temperatura, con el peso, con las distancias el promedio adquiere un significado valioso.

Con las variables psicológicas el promedio no tiene sentido, estrictamente hablando.

Cómo abordar mejor la medición

Luego de años de enfrentar este problema voy a revelar como he solucionado yo este dilema en las ya numerosas evaluaciones que he realizado para diversas empresas.

Lo primero es decir que medir en psicología no es lo mismo que en la física y que es más apropiado decir “discriminar” en lugar que “medir”. Quitar la necesidad de un guarismo, una cifra que “mida” ayuda a realizar mejor la evaluación, así parezca una contradicción verbal.

Luego de esa aclaración, mi propuesta es hacer las preguntas en modo descriptivo y en relación a conductas, así:

“En relación a la integridad, es decir la coherencia entre el decir y el cumplir, la frase que mejor describe a mi líder es:”

A-Siempre que dice algo uno puede esperar que lo cumpla. Es un ejemplo de integridad

B-Aunque no siempre cumple lo que dice, es una persona en la cual se puede confiar

C-Cumple lo que dice en algunas ocasiones. Unas veces se puede confiar en otras no. Me deja algo confundido(a)

D-Nunca confío en lo que dice, pues no suele cumplir lo que promete.

Esta manera de “medir” está más acorde con la necesidad de la medición y la naturaleza de los rasgos humanos: lo que nos interesa es DISCRIMINAR y no el prurito de colocar un numero bajo la supuesta premisa de ser precisos.

La medida así propuesta, no permite el uso de promedios (esa es la razón por la cual es poco usada) y tampoco permite colocar a el evaluado en una cifra.

Lo que si permite es discriminar a quienes reflejan integridad a sus colaboradores, de quienes no. Los resultados de esta manera de medir deben presentarse a manera de agrupaciones de respuestas.

Como se agruparían las respuestas de un buen líder (asumiendo un ejemplo de 100 encuestados):

escala-4

Como se agruparían las respuestas de un líder con áreas de mejora

escala5

Esta forma de diferenciar las personas es más precisa y permite identificar más claramente donde están las áreas de mejora. Cómo notarán mis lectores, en el primer caso las respuestas se agrupan en en un 97% en las descripciones positivas de integridad, en tanto que en el segundo ejemplo la mayor proporción (70%) está en los descriptores negativos de la competencia.

Eso es medir en psicología. Y la medición no necesita de cifras sino de discriminación, que es el término correcto en psicometría.

Ahora bien, para eliminar aún más el efecto comodín, las opciones no siempre irán en orden como las he presentado yo (A-B-C-D). Pueden presentarse en orden aleatorio, ya que no estamos asumiendo la variable como un continuo. Obtendremos resultados más confiables así.

¿Desventajas?

Por supuesto que las tiene. Una de ellas que la gente se queja que es un instrumento muy largo (porque cada respuesta implica leer 4 opciones). Pero es esto precisamente lo que impide que se usen respuestas “comodines”.

Otra desventaja es que no se pueden asumir promedio o escalas, pero ya vimos que eso es un anhelo que no debe significar mayor cosa al intentar aplicar números al comportamiento humano.

Otra razón para no usarla es que es más fácil construir una escala de 1 a 5 para todas las preguntas en lugar de desgastarse describiendo las conductas de cada competencia (que es un trabajo relativamente arduo y de esfuerzo conceptual al intentar describir las conductas esperadas).

A pesar de todo, puedo decirles con conocimiento de causa que este sistema es más eficiente. Lo que importa es diferenciar, discriminar entre quienes tienen las competencias y quienes no la poseen. Y el sistema que les propongo funciona de maravilla.

Yo sé que el pensamiento positivista de colocar cifras a la mente aun cala profundo en nuestras costumbres. Pero si nuestra necesidad es identificar como perciben los colaboradores (modo 360) a sus colegas, pares o jefes, este modelo propuesto discrimina perfectamente entre quienes demuestran la competencia y quienes no, y permite ver en qué áreas y en qué aspectos necesitan apoyo.

Y así, volvemos al principio: la importancia de la “medida” no es colocar un número. Es discriminar.

Espero que lo pongan a prueba.

Mas reflexiones y recursos AQUÍ.

Ramon Chaux

Psicólogo Organizacional

[email protected]

Comentarios