Aplicación de RL

 Aplicación Práctica: Regresión Logística (Aprendizaje Supervisado)










Conceptos clave de la regresión logística:

La regresión logística es un algoritmo de aprendizaje supervisado utilizado principalmente para problemas de clasificación binaria, donde la variable de respuesta es categórica y tiene dos categorías (por ejemplo, sí/no, positivo/negativo). Aunque se llama "regresión", se utiliza para la clasificación, no para la regresión. Aquí están los conceptos clave:

  1. Función Logística:

    • La regresión logística utiliza la función logística (también conocida como sigmoide) para modelar la probabilidad de que una instancia pertenezca a una clase en particular.
    • La función logística se expresa como (=1)=11+(0+11++), donde es la variable de respuesta, 1,, son las variables predictoras y 0,, son los coeficientes del modelo.
  2. Entrenamiento y Coeficientes:

    • El modelo se entrena ajustando los coeficientes para maximizar la verosimilitud de que los datos observados pertenezcan a sus respectivas clases.
    • Los coeficientes indican la contribución relativa de cada predictor a la probabilidad de la clase.

Implementación en un caso de estudio: Clasificación binaria en diagnósticos médicos

Supongamos que estamos utilizando la regresión logística para predecir si un paciente tiene una enfermedad (1) o no (0) basándonos en dos variables predictoras: resultados de una prueba específica y la edad del paciente.

# Importar bibliotecas necesarias import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn import metrics # Cargar datos de diagnósticos médicos data = pd.read_csv("datos_medicos.csv") # Dividir datos en conjunto de entrenamiento y prueba X = data[['Resultado_Prueba', 'Edad']] y = data['Enfermedad'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # Crear modelo de regresión logística model = LogisticRegression() model.fit(X_train, y_train) # Hacer predicciones en el conjunto de prueba y_pred = model.predict(X_test) # Evaluar el rendimiento del modelo print('Exactitud:', metrics.accuracy_score(y_test, y_pred)) print('Matriz de confusión:\n', metrics.confusion_matrix(y_test, y_pred)) print('Informe de clasificación:\n', metrics.classification_report(y_test, y_pred))


Interpretación de los coeficientes y evaluación del modelo:

  1. Interpretación de Coeficientes:

    • Los coeficientes (0, 1, 2) indican la dirección y magnitud de la influencia de cada variable predictora en la probabilidad de tener la enfermedad.
    • Por ejemplo, si el coeficiente 1 es positivo, un aumento en el resultado de la prueba aumenta la probabilidad de tener la enfermedad.
  2. Evaluación del Modelo:

    • La exactitud, la matriz de confusión y el informe de clasificación proporcionan métricas para evaluar el rendimiento del modelo.
    • La matriz de confusión muestra los verdaderos positivos, verdaderos negativos, falsos positivos y falsos negativos.

Sugerencias de Videos para el Blog:








Estos videos proporcionan una comprensión visual y práctica de la regresión logística y son apropiados para complementar la lectura del blog.










Comentarios