馃搱

Tutorial sobre Regresi贸n Lineal

Jul 18, 2024

Tutorial sobre Regresi贸n Lineal

Introducci贸n a la Regresi贸n Lineal

  • Primer algoritmo del curso de Data Mining supervisada
  • Enfoque en variables que se quieren pronosticar o explicar (variable 'label') en funci贸n de otras variables (atributos)
  • Divisi贸n adicional basada en la naturaleza de la variable dependiente:
    • Num茅rica: problema de predicci贸n
    • Categ贸rica: problema de clasificaci贸n

Conceptos Fundamentales

  • La variable dependiente es una funci贸n de las variables independientes (X1, X2, X3, ..., Xk)
  • Ejemplo con una variable dependiente (salario, precio de casa) y varias independientes (edad, educaci贸n, n煤mero de cuartos)
  • Enfoque en modelos simples: ecuaci贸n lineal
  • Ejemplos hist贸ricos de regresi贸n lineal: trabajo de Francis Galton sobre la relaci贸n entre la altura de padres e hijos

Ejemplo de Regresi贸n Lineal con una Variable

  • Datos: altura del padre (variable X) y altura del hijo (variable Y)
  • Ecuaci贸n de regresi贸n: altura del hijo = 23.94 + 0.64 * altura del padre
  • Uso de la ecuaci贸n para hacer predicciones
    • Ejemplos con padres de 62, 68 y 74 pulgadas
    • Pron贸sticos: 63.6, 67.4 y 71.3 pulgadas respectivamente
  • Concepto de 'regresi贸n a la media'
    • Tendencia de las variables a aproximarse a la media*

Regresi贸n Lineal con Dos Variables Atributo

  • Nuevos datos: salario en funci贸n de nivel de educaci贸n y experiencia del empleado
  • Ecuaci贸n de regresi贸n: salario = 6.8 + 1.46 * educaci贸n + 0.35 * experiencia
  • Graficaci贸n en tres dimensiones (salario, educaci贸n, experiencia)
  • Ejercicio: pronosticar salario con 12 a帽os de educaci贸n y 10 a帽os de experiencia

Variables Categ贸ricas y Variables Dummy

  • Problema con variables categ贸ricas (texto) en an谩lisis de regresi贸n
  • Ejemplo: precio de casas como funci贸n del 谩rea, n煤mero de ba帽os y vecindario
  • Creaci贸n de variables dummy para resolver el problema
    • Variables binarias (0 o 1) para cada categor铆a
    • Ejemplo: vecindario (este, norte, oeste)
  • Codificaci贸n de variables dummy:
    • Si casa est谩 en el vecindario 'este': vecindario_este=1, vecindario_norte=0, vecindario_oeste=0
    • Repetir proceso para otros vecindarios

Aplicaci贸n de la Regresi贸n con Variables Dummy

  • Ecuaci贸n de regresi贸n con variables dummy: precio = 36191 + 35.4 * 谩rea + 9619 * n煤mero de ba帽os - 1599 * vecindario_este - 16360 * vecindario_norte + 22959 * vecindario_oeste
  • Interpretaci贸n de coeficientes:
    • Coeficiente positivo: incremento en precio
    • Coeficiente negativo: decremento en precio
  • Ejercicio: pronosticar precio de una casa con 1790 ft虏, dos ba帽os en vecindario 'este' y 'oeste'*