¿Qué es el recall?

El recall, también conocido como exhaustividad, es una métrica en aprendizaje automático que mide la proporción de casos positivos que un modelo de clasificación logra identificar correctamente en relación con el total de casos positivos reales. En otras palabras, indica cuántos de los casos positivos fueron «recuperados» o capturados por el modelo. El recall es útil cuando es importante evitar falsos negativos y se expresa como un porcentaje.

¿Por qué es importante el recall en contextos donde no detectar un evento positivo tiene altos costos, como en la detección de enfermedades?

En contextos como la detección de enfermedades, un alto recall es vital porque los costos de no detectar un evento positivo, como una enfermedad grave, pueden ser extremadamente altos, incluyendo riesgos para la salud o la vida. Un recall alto asegura que se identifiquen la mayoría de los casos reales de la enfermedad, lo que es preferible a pasar por alto un diagnóstico correcto. En tales situaciones, es mejor tolerar algunos falsos positivos, que pueden ser corregidos con pruebas adicionales, a arriesgarse a no tratar a pacientes que realmente necesitan atención médica.

¿Cómo se compara y contrasta el recall con otras métricas como la precisión y la exactitud?

El recall, la precisión y la exactitud son métricas utilizadas para evaluar el rendimiento de los modelos de clasificación, pero cada una mide aspectos diferentes:

  • Recall (exhaustividad): Mide la proporción de verdaderos positivos identificados correctamente respecto al total de casos positivos reales. Es decir, entre todos los positivos reales, ¿cuántos detectamos?
  • Precisión: Mide la proporción de verdaderos positivos respecto al total de casos identificados como positivos por el modelo. Es decir, de todas las instancias que el modelo predice como positivas, ¿cuántas lo son realmente?
  • Exactitud (accuracy): Mide la proporción de predicciones correctas (verdaderos positivos y verdaderos negativos) respecto al total de casos. Es decir, ¿cuántas predicciones hizo correctamente el modelo en relación con el tamaño total del conjunto de datos?

El recall es crítico en situaciones donde los falsos negativos son costosos, mientras que la precisión es importante cuando los falsos positivos son más problemáticos. La exactitud puede ser engañosa en conjuntos de datos desequilibrados, ya que un modelo podría predecir simplemente la clase más común y aún así parecer «exacto». Por lo tanto, es importante elegir la métrica adecuada según el contexto específico del problema y, a menudo, considerar un equilibrio entre ellas.

Email: info@foqum.io

Teléfono: +34 675 481 701

Spain

C. de Agustín Durán, 24, Local bajo izquierda, 28028 Madrid.

Discovery

Plataforma IA

Herramientas Plug & Play