top of page

Explorando el mundo de HR Analytics

Dentro del ecosistema de Data y Analytics, hay un concepto que viene sonando con más fuerza: “HR ANALYTICS”.


Hoy en día, las empresas más innovadoras están evaluando la data de los empleados para determinar los factores por los que renuncian, reconociendo tendencias y vulnerabilidades, midiendo rotación, prediciendo demanda de empleados requeridos, contando con esos “insights” que los ayuden a diseñar y monitorear programas para mejorar la retención, satisfacción y contratación.


Conseguí un Dataset ofrecido por IBM Watson, con información de casi 1.500 empleados, que incluye diferentes variables como la edad, género, distancia hasta la oficina, experiencia laboral, sueldos, si el trabajo requiere que el empleado viaje, y si son empleados que renunciaron o no en un período.


El objetivo final es comprender los factores que lleven a las renuncias creando un modelo de machine learning (algoritmo predictivo), predecir quiénes son los empleados con alto riesgo de renuncia, entender un perfil ideal, crear herramientas que ayuden a los ejecutivos a diseñar programas de retención, reclutamiento y mantener alertas al equipo de Recursos Humanos.


Para lograr estos objetivos, haremos una serie de análisis que vamos a describir resumidamente a continuación.


Antes de comenzar con el modelo, vamos a revisar la data histórica y explorar para cuantificar el problema. Entonces visualizamos diferencias en las variables de empleados que renunciaron contra aquellos que no.


Por ejemplo, en los gráficos a continuación, se puede apreciar como empleados que trabajan horas extras tienden a renunciar más que aquellos que no, también podemos apreciar como empleados con menor sueldo también renuncian más; esto no debería sorprender a nadie.


También, vemos que empleados jóvenes son mas propensos a renunciar en esta empresa, quizás es el efecto de la generación “millenial”.


Nos pareció interesante, que el nivel educativo no pareciera ser un factor que se relacione con empleados que renuncien.


También, empleados que viven muy lejos de las oficinas de esta empresa tienden a renunciar más que aquellos que viven cerca.


En rojo: Empleados que renunciaron.


En azul: Empleados que no renunciaron.


Estas gráficas nos han ayudado a entender si una variable se relaciona al factor de renuncias, pero no nos dice si las variables están relacionadas entre ellas. Por ejemplo, el sueldo y la cantidad de viajes ¿están relacionados? La edad y las horas de sobretiempo ¿Están relacionados?


En el gráfico que a continuación veremos, evaluamos todas esas relaciones, con el fin de simplificar el modelo y evitar utilizar variables similares.



Esto es una matriz de relación, y muestra cómo se relacionan todas las variables.


Para leer, hacemos el cruce de una variable en cada eje, colores rojos indican que hay más relación, y azul indica que hay menos relación.


¿Qué podemos apreciar?


- Los incrementos de sueldos y las evaluaciones de desempeño están muy relacionados, esto era de esperarse, tendríamos un problema si no fuese el caso.

- La experiencia se relaciona al nivel de ingreso y a los años dentro de la empresa.

- También vemos cómo el nivel de renuncia se relaciona con el sobretiempo, distancia a la oficina, y nivel de ingreso.



El próximo paso es ya la construcción del modelo que pueda relacionar todos estos aprendizajes y realizar predicciones individuales, además de ayudarnos a medir la importancia de cada variable.


En este caso, estamos utilizando un algoritmo de clasificación, que va a predecir si un empleado renuncia o no renuncia, utilizaremos el algoritmo de “Decision Tree” o árbol de decisión.


Los resultados son positivos, tenemos una precisión de casi 85%.


Estas son las variables más importantes conseguidas:


El nivel de ingreso, la experiencia, la distancia a la oficina, si trabajan horas extra, si viajan mucho y si tienen bonificación de acciones son las variables más importantes del modelo.


El algoritmo entonces elabora, un árbol de decisión como vemos a continuación y la data de cada empleado pasa por estos pasos para darnos una predicción.


Por ejemplo, en esta sección, vemos que un empleado que cuenta con un plan de bonificación de acción, a pesar de trabajar horas extras, tiene menor chance de renunciar.

La realidad es más compleja, porque se generan muchos de estos árboles de decisión y la predicción final será el resultado de un promedio de todos los árboles.


Finalmente, tenemos la lista de empleados con su predicción y porcentaje de seguridad:

¿Y ahora qué?


Informemos estos resultados al equipo de Recursos Humanos y evaluemos acciones de mejora, nosotros tenemos algunas ideas, ¿Ustedes qué recomendarían?


1- Aplicativo con resultados en línea, para alertas potenciales, renuncias y potenciales contrataciones.


2- Modelo de predicción de rotación, para ser proactivos y buscar empleados antes que sean requeridos.


3- Revisar modelos de compensación y acciones para retener a los empleados.


4- Comprender diferencias en la retención por cada departamento, e investigar razones en las diferencias.


5- Evaluar planes de transporte, trabajo remoto, horarios mixtos para empleados viviendo muy lejos.


Y por supuesto, siempre controlar las métricas ANTES y DESPUÉS de las decisiones tomadas para evaluar resultados.


El tema de "Machine Learning" y "HR Analytics" no solo puede ser usado para empleados, también se pueden generar modelos para predecir deserción de estudiantes, predecir desempeño de fuerzas de venta o de estudiantes, clasificar o agrupar empleados o estudiantes en perfiles similares y luego tomar acciones más personalizadas.

bottom of page