Métricas de regresión (MSE, MAE, R2)

Métricas que cuantifican el error y la calidad del ajuste en modelos de regresión, ayudando a evaluar su desempeño.

Las métricas de regresión son indicadores usados para medir qué tan bien un modelo predictivo se ajusta a los datos reales en problemas donde la variable objetivo es continua. Las más comunes son:

  • Error Cuadrático Medio (MSE): Calcula el promedio de los cuadrados de las diferencias entre los valores predichos y los reales. Penaliza más los errores grandes, ya que eleva al cuadrado las diferencias, lo que lo hace sensible a valores atípicos.
  • Error Absoluto Medio (MAE): Es el promedio de las diferencias absolutas entre los valores predichos y reales. Mide el error promedio en las mismas unidades que la variable objetivo y trata todos los errores con igual peso.
  • Coeficiente de Determinación (R2): Indica la proporción de la variabilidad de la variable dependiente que es explicada por el modelo. Su valor varía entre 0 y 1, donde valores cercanos a 1 indican un buen ajuste del modelo a los datos.

Estas métricas permiten evaluar diferentes aspectos del rendimiento del modelo: mientras MSE y MAE cuantifican el tamaño del error de predicción, R2 mide la capacidad explicativa del modelo sobre la variabilidad observada.

Ejemplos

  • Ejemplo:
    Un modelo que predice precios de viviendas puede tener un MAE de 5,000, lo que indica que en promedio sus predicciones se desvían 5,000 unidades monetarias del valor real.
  • Ejemplo:
    Si un modelo tiene un MSE alto, significa que existen errores grandes en las predicciones, ya que este valor penaliza más los errores grandes al elevarlos al cuadrado.
  • Ejemplo:
    Un R2 de 0.85 indica que el 85% de la variabilidad en los datos de salida es explicada por las variables de entrada del modelo, mostrando un buen ajuste.

Preguntas frecuentes

¿Cuál es la diferencia principal entre MSE y MAE?
El MSE eleva al cuadrado los errores, penalizando más los errores grandes, mientras que el MAE calcula el promedio de los errores absolutos, tratando todos los errores con igual peso.
¿Qué significa un valor de R2 cercano a 0?
Un R2 cercano a 0 indica que el modelo no explica la variabilidad de los datos, es decir, tiene un mal ajuste y no captura bien la relación entre variables.
¿Se puede usar R2 para comparar modelos con diferentes números de variables?
Para comparar modelos con distinto número de variables es mejor usar el R2 ajustado, que penaliza la inclusión de variables que no mejoran el modelo.

SINÓNIMOS

También conocido como: Métricas de evaluación de regresión, Indicadores de error en regresión

ÚLTIMA REVISIÓN

Actualizado el: 10/12/2025