Don Ramón, psicología laboral

Publicado el ramon_chaux

La medida psicológica en temas laborales

 

measurement-1476913_960_720

¿Cuál es la mejor manera de conocer que piensa Pedro? Desde tiempos inmemoriales, desde que nos volvimos humanos la mejor manera es preguntar abierta y sinceramente:

¿Pedro, te gustan nuestras nuevas oficinas?

Respuesta de Pedro:

“¡Por supuesto! Me agradan mucho los ventanales de vidrio que las hacen ver muy iluminadas de manera natural, aunque me desagradan las paredes tan delgadas que no aíslan el ruido y se escuchan las conversaciones. El piso es demasiado liso. Me recuerda una oficina de mi padre y eso me da nostalgia. Aunque se ven más amplias, los espacios se redujeron mucho. Las plantas le dan un ambiente fresco y delicioso. ¡El olor a plantas y flores naturales me encanta!”.

Y así podríamos emprender un dialogo donde apreciemos lo que piensa, lo que siente y como actúa nuestro empleado en las nuevas oficinas.

Pero cuando son cientos o miles no podemos sentarnos a conversar sobre el tema (por un tema práctico y de tiempo) entonces debemos recurrir a “medir” mediante una evaluación o una encuesta y responder nuestra pregunta: “¿Le gustan nuestras nuevas oficinas a los empleados?”

Inventando las escalas: una manera de perder información

Pues bien. Ante la imposibilidad de conversar con todas y todos los empleados debemos recurrir a una evaluación y eso implica elegir una escala. Mi trabajo en este escrito es demostrar como las escalas son una forma de encausar la comunicación que puede traer ventajas y desventajas. Quiero además, que conozcan los errores de medida a los cuales se enfrentan desde que eligen una u otra forma de “medir” actitudes, competencias, sentimientos, conductas o conocimientos.

Sin más preámbulos, entremos en el tema.

El mundo físico Vs el psicológico

Empecemos por decir que el mundo físico es medible: un galón es lo mismo aquí que en la china. Un kilo de arroz igualmente. 10 centímetros, son 10 centímetros. La medida de temperatura es universal. Esta cualidad de aplicar la misma magnitud a las variables emocionales ha sido siempre el sueño de los psicólogos positivistas prácticamente desde que la psicología nació como disciplina científica.

En psicología, si bien se usan los números, son solo una convención social y científica que hemos asumido, un sistema de referencia. Para hablarlo claro, los números en psicometría se han asumido para poder trascender la medida simple de “A esta persona le gusta más las nuevas oficinas que a esta” o “estas oficinas gustan mucho más que las antiguas”.

¿Qué tanto más? ¿Con que magnitud? ¿Cómo se diferencia el gusto de Pedro Vs el de Juana?

Para poder responder esto, entonces metimos, un poco forzadamente, los números a las emociones, las actitudes y los conocimientos humanos. La verdad real es que ninguno de estos aspectos puede ser dibujado a la perfección con números, pero nuestro mundo actual necesita cifras para todo y para eso se inventaron las escalas de medición: para poder colocarle números a las emociones, las actitudes, los conocimientos y sentir algo de tranquilidad.

Entonces vienen las escalas, que es una forma de recortar abruptamente las formas de comunicación. Siguiendo con nuestro ejemplo inicial, vamos a revisar las múltiples formas que existen para hacer una pregunta simple y sencilla como: ¿Te gustan nuestras nuevas oficinas?

Para efectos de demostración, vamos a asumir que nuestro evaluado piensa exactamente como Pedro y esa será la respuesta analizada para todas las escalas.

1-   Escala dicotómica Si/No

¿Pedro, Te gustan nuestras nuevas oficinas?

SI

NO

Si usamos esta escala obtendremos el porcentaje y la frecuencia del SI versus los NO. Se nos quedarán por fuera las razones por las cuales les gusta o les disgusta. Además, tampoco tienen cabida los que tienen sentimientos encontrados. “Me gusta por las plantas pero redujeron espacio a las oficinas”. Es una elección forzada, en blanco y negro, un poco antinatural porque los seres humanos no suelen ser dicotómicos sino que tienen matices en sus opiniones y sentimientos.

Lo que se busca con esta escala es conocer si las oficinas nuevas gustan más que las antiguas. En otras palabras, lejos de la pretensión de ponerle número a los sentimientos, queremos saber si nuestra inversión valió la pena. Para que la respuesta sea afirmativa, el número de SI debe ser considerablemente mayor a la cantidad de NO en nuestra encuesta. Además, para responder Pedro debe hacer un concienzudo análisis si son más los beneficios que las desventajas y al final decidirse por una respuesta. No hay lugar a ambigüedades.

Lo que ganamos con esta escala: Sabemos exactamente a cuantos y qué % le gusta o le disgustan las nuevas oficinas. No caemos en el error de colocar un número al gusto o al disgusto y además le exigimos a nuestro evaluado que sopese todos los pros y los contras para que emita un juicio: Si le gustan o no le gustan. Punto. Además, cuando decimos que el 60% dice SI y el 40% dice NO, esa magnitud es real y representa fielmente la realidad de la composición. Esa proporción 60/40 es igual en cualquier parte del mundo y no acepta discusión.

Lo que perdemos: Forzamos a responder SI o NO a personas que se encuentran indecisas o con sentimientos encontrados. No podemos registrar a los que les da igual, a los que les gusta muchísimo, un poco. No podemos sacar promedios.

El error: El ser humano no piensa dicotómico.

2-   Escala numérica

¿Pedro, te gustan nuestras nuevas oficinas?

NADA           0         1         2         3         4         5         MUCHO

Conociendo que el ser humano no piensa dicotómico y para poder “retratar” mejor la gama de sentimientos, algunos proponen esta escala. Aquí no hay dicotomía y es posible colocar un 2 para reflejar que nos gusta un poco, podemos elegir un 4 para decir que nos gusta pero que tampoco es perfecta.

Lo que se busca con esta escala: pretende pasar las mismas características de lo físico a lo mental (medir con una escala) y además dar un abanico mayor de posibilidades para expresarse. Con una escala como esta podemos hacer análisis matemáticos como promedio, varianza, tendencias, etc. En palabras un poco más precisas, pretende darle valor de escala de intervalo a la medida (similar al mundo físico).

Lo que ganamos al usar una escala numérica: se pueden reflejar posiciones que no son dicotómicas y se obtiene una imagen más variada mucho más allá de la simple dicotomía “Me gusta/No me gusta”. Se pueden sacar promedios y hacer cálculos estadísticos. En esta escala el trabajo de Pedro no es pensar si pone un Sí o No me gusta, sino elegir un lugar en la escala entre los extremos 0 y 5.

Lo que perdemos: En la escala dicotómica sabemos exactamente si nuestros resultados dieron frutos (el Si le gana a los No). ¿Pero qué significa en esta escala que alguien coloque un tres? ¿Alguna persona puede decir en palabras lo que significa un 2,8 Vs un 3,2? Por el prurito del número, de cuantificar, podemos estar perdiendo información tan valiosa como es realmente saber si gusta o no gustan nuestras instalaciones.

El error: Quienes usan este tipo de escalas generalmente lo hacen con la esperanza de poder realizar análisis matemáticos como promedios, varianzas o tendencias. El gran error es que esta escala es ordinal y no de intervalo, pues quien responde 4 no significa que las oficinas les gusta exactamente el doble que quien respondió con un 2. La distancia entre un 3 y un 4 no es exactamente 1 (estamos hablando de allá adentro, en el mundo interior de nuestro empleado). Los números entonces son reales acá en el mundo exterior, pero dentro de la psique de Pedro son sólo una elección que nos indica o nos sirve de referencia a donde se inclina su gusto o disgusto, pero sin saber claramente a partir de donde es un me gusta y desde donde es no me gusta. A pesar de los números, solo podremos decir “A María le gusta más que a Pedro”. Los análisis numéricos entonces son ilícitos, arbitrarios y no dicen nada, o casi nada, de la realidad. Por ejemplo, si alguien contesta un 5 y otro un 1 tenemos 6 para un promedio de 3 ¿Tiene sentido? Por supuesto que no.

3-   La reina más conocida: la escala LIKERT

¿Pedro, te gustan nuestras nuevas oficinas?

  1. Me disgustan mucho
  2. Me disgustan
  3. Ni me gustan ni me disgustan
  4. Me gustan
  5. Me gustan muchísimo

Se supone que esta escala es capaz de recoger TODAS las posibles posiciones de una personas frente a un tema: discrimina a quienes simplemente les gusta de quienes les gusta mucho. Tiene el poder de permitir reflejar a los indecisos, los indiferentes o simplemente “les da igual”. Tales fortalezas la han hecho la escala más popular en clima y en evaluación de desempeño. Por ser una de las más usadas en todos los instrumentos, vamos a detenernos un poco mejor en el análisis de las ventajas y desventajas de esta escala.

Lo que se busca con esta escala: poder reflejar las diversas tendencias de pensamiento o actitudes de una persona frente a determinado factor. Entre los “me gusta” se pueden diferenciar claramente entre fuerte y no tan fuerte (“me gustan muchísimo” vs un simple “me gusta”). Igual con el disgusto (me disgusta vs me disgusta muchísimo). En ese sentido tenemos una información más poderosa que la simple escala dicotómica ya que podemos matizar nuestros sentimientos e incluso colocar un sentimiento neutro.

Todo parece indicar entonces que esta es la escala perfecta. Invito a mis lectores a continuar en nuestro análisis para saber si en verdad lo es.

Lo que ganamos al usar una escala Likert: Reflejar los sentimientos o actitudes en un continuo muy parecido a la realidad de las emociones. Además, si le asignamos números a cada respuesta elegida, podremos realizar análisis numéricos muy similares a los de la escala numérica No 2.

Normalmente suelen asignarse estos números así:

Me disgustan mucho                  =1

Me disgustan                              =2

Ni me gustan ni me disgustan    =3

Me gustan                                   =4

Me gustan muchísimo                =5

Otra ganancia, es cierta tranquilidad al saber que es la escala más usada en las evaluaciones.

Lo que perdemos: Esta escala no es perfecta (al igual que ninguna de las anteriores) pues si bien nos permite un punto más acorde a nuestras emociones, se pierden las razones del gusto o disgusto. Es decir, ganamos en predecir la dirección, pero al restringir la comunicación a una escala, perdemos gran parte del mensaje.

El error: Si bien esta es la escala más usada, está lejos de ser ausente de problemas. Vamos a verlos uno por uno y analizar sus deficiencias:

Error 1: La escala de Likert ha demostrado un efecto nocivo llamado Acquiescence bias. Por este fenómeno, las personas suelen responder “de acuerdo” o “muy de acuerdo” independiente de lo que se le pregunte. Para nuestro ejemplo, este efecto haría que las personas se ubiquen en el “Me gusta” o “me gusta muchísimo”. No se sabe bien la naturaleza de este efecto, pero está demostrado que existe. Probablemente se debe a nuestra naturaleza social en la cual buscamos no disentir ni salirnos de la norma. Es un fenómeno de aceptación social. Para una mejor definición de esta tendencia pueden ver un mejor resumen aquí. https://en.wikipedia.org/wiki/Acquiescence_bias

Error 2: La escala Likert también presenta el problema del “set response”. En esta situación, una persona elige una respuesta comodín y contesta todo el instrumento con la misma opción, aun cuando los ítems o reactivos varíen o cambien de asunto. Más grave es el problema cuando la respuesta elegida es justo la del medio, la indiferente (“Ni me gusta ni me disgusta”). Este fenómeno suele acentuarse más cuando quien nos pregunta tiene alguna jerarquía sobre nosotros. En la relación subordinada de empleado/empleador, muchos empleados colocarán su disgusto en el “Ni me gusta ni me disgusta” o “No sé del asunto” o “Ni acuerdo ni desacuerdo”. Un problema que acentúa más esta anomalía es que no hay datos científicos que indiquen que dirección tiene esa respuesta neutra. Hasta un 30% de las respuestas suelen ubicarse en el punto neutro de la escala Likert, lo cual significa que esas respuestas se pierden. No es posible identificar, de ninguna manera, si esa indecisión refleja un gusto o un disgusto hacia nuestras oficinas o si realmente es un punto de indecisión. No hay consenso en determinar que significa, pues allí caen quienes responden sin compromiso (sin leer a fondo), los que temen asumir una posición definida, los que no quieren comprometerse y, finalmente, los que están realmente indecisos.

Más errores: Igual que con las preguntas de escala numérica, las puntuaciones asignadas a cada respuesta tampoco tienen una correlación con las actitudes medidas. Eso quiere decir nuevamente que 4 no es el doble de 2 y que 5 no está apartado de 4 en un punto (psicológicamente hablando). Es decir, la Likert es una escala ordinal, no de intervalo. Muchos investigadores o personas de RRHH le dan una connotación de intervalo. Por ejemplo, puede llegarse a usar el promedio con la escala Likert lo cual no tiene absolutamente ningún sentido.

En el mismo sentido de asignar puntuaciones a cada respuesta de esta escala, dos personas pueden tener el mismo puntaje partiendo de opiniones diferentes, ejemplo:

Me gusta (4) y me disgusta muchísimo (1) suman 5

Ni me gusta ni me disgusta (3) y me disgusta (2) suman 5

En otras palabras, las escalas de intervalo implican que la distancia entre un punto de la escala y el siguiente es igual en todos los casos (como la escala métrica, la temperatura, el peso, etc.), cosa que solo sucede en la medida del mundo físico, jamás en el psicológico.

Esto significa también que con la escala reina de la psicometría se cometen muchos errores de medida bajo el espejismo de usar la escala más usada y de tener cifras cuantitativas.

¿Qué hacer? ¿Cuál es la opción?

Si yo tuviera la respuesta al problema de la fiabilidad de la medida probablemente sería millonario, sin embargo mi experiencia de muchos años me permiten dar estos consejos, útiles a quienes lo deseen aplicar:

1.   El primer gran consejo que daría a las personas de RRHH que elaboran sus propios instrumentos es que se olviden un poco del prurito de obtener una puntuación o una calificación. El concepto de medida en psicología está más asociado con discriminar, más que con asignar una puntuación. De esta manera, la medida es más ordinal que de intervalo. Una escala ordinal como “competencia en bajo desarrollo”, “competencia en desarrollo medio”, “competencia en desarrollo alto” y “competencia en desarrollo excepcional” puede dar información más útil que una cifra. Esto es más cierto para identificar las áreas de mejora de un empleado.

2.   Si ya tenemos claro lo que esperamos de un empleado, podemos perfectamente hacer preguntas dicotómicas basadas en conductas. Por ejemplo, si esperamos que nuestro empleado recicle el papel en su oficina podremos preguntar directamente “En mi oficina: «A: reciclo o B: no reciclo”. Con esto sabremos cuantos están alineados con las conductas y actitudes que esperamos. La mayoría de las variables de cultura organizacional podrán usarse como variables dicotómicas discriminando quienes actúan de la manera esperada Vs quienes no. El porcentaje de quienes hagan lo esperado será la alineación lograda y los que no, la población a intervenir. No sólo es más fácil sino más útil saber quién está alineado y quién no. ¿Para qué un número?

3.   No use la escala Likert para medida de competencias que tienen que ver con conductas. La escala «Muchas veces, pocas veces, casi nunca o nunca» (y otras parecidas) son una mala adaptación de la escala Likert al tema de las competencias. La Likert es una escala adecuada para actitudes o sentimientos. Para las conductas es más acertado conocer si existe o no existe la conducta, en ese sentido las dicotómicas o las ordinales parecen funcionar mejor.

4.   Trate de usar situaciones reales de trabajo con respuestas que reflejen la conducta alineada con lo esperado Vs una conducta inadecuada. Por ejemplo:

Si un colaborador a mi cargo comete un error grave, lo que generalmente hago es:

-Llamarle la atención.

-Hacer un análisis del por qué ocurrió el error

5.   Una buena idea es complementar los estudios cuantitativos con grupos focales. De esa manera profundizamos en los motivos y situaciones que facilitan u obstruyen nuestras metas. Esto aplica para clima y aspectos de cultura organizacional.

6.   Cuando haga encuestas o evaluaciones que desee cuantificar, tenga especial cuidado en el tipo de variables. La mayoría de escalas en psicología son ordinales, lo cual indica que el promedio, por ejemplo, no es una medida válida. Las medidas válidas en estas escalas ordinales son: contar los elementos en una categoría (frecuencia o porcentaje), establecer igualdades y diferencias (mayor que, menor que).

Una cuestión final. ¿Cuál de las escalas ofrecidas nos ofrece exactamente los motivos de Pedro para que le guste/disguste la oficina?

Recordemos:

“¡Por supuesto! Me agradan mucho los ventanales de vidrio que las hacen ver muy iluminadas de manera natural, aunque me desagradan las paredes tan delgadas que no aíslan el ruido y se escuchan las conversaciones. El piso es demasiado liso. Me recuerda una oficina de mi padre y eso me da nostalgia. Aunque se ven más amplias, los espacios se redujeron mucho. Las plantas le dan un ambiente fresco y delicioso. ¡El olor a plantas y flores me encanta!”.

¡Ninguna escala nos reflejó exactamente esto!

Entonces: medir es encausar un río enorme sobre unos canales hechos a nuestra medida y eso, indudablemente transforma la información y hace que pierda fuerza el mensaje original. Usar una escala, cualquiera que sea es restringir el mensaje a unas opciones. Desde allí mismo nace la fuente de error en la medición en psicología. Un adecuado balance entre las cifras y lo cualitativo, entre los guarismos y las descripciones es mejor que uno sola técnica.

Finalmente, el alma y el entendimiento humano son tan complejos que ninguna cifra, ningún test o prueba inventada o por inventarse, dará cuenta de todo lo que tiene por expresar y por realizar un ser humano. Nunca un número será lo suficientemente válido ni suficientemente cierto ante la inmensidad del talento y las emociones humanas.

Aquí puede ver características de mi propuesta en evaluación de desempeño: VER

Ramón Chaux

Psicólogo Organizacional

Comentarios