Caso de estudio · Regresión

Predicción de precios de vivienda en Bogotá

¿Qué variables determinan el precio de un inmueble en Bogotá? Un modelo de regresión múltiple sobre 551 propiedades para responder esa pregunta con datos.

89,26%
R² ajustado
551
Inmuebles analizados
16 → 9
Variables (reducción)
3
Versiones del modelo

01 El problema

¿Qué variables realmente mueven el precio de un inmueble en Bogotá? El mercado inmobiliario colombiano carece de herramientas accesibles para que un comprador o inversionista pueda estimar el valor justo de una propiedad con base en sus características. Este proyecto busca construir ese modelo.

02 Los datos

Dataset de 551 inmuebles scrapeados de portales inmobiliarios en Bogotá (2023). 16 variables originales: estrato, área construida, número de baños, garajes, antigüedad, tipo de inmueble, ubicación, entre otras. El dataset fue limpiado y preparado para modelado estadístico.

03 El enfoque

Probé 3 versiones del modelo de regresión múltiple (con y sin transformación logarítmica). Reduje las variables de 16 a 9 usando una prueba F parcial (p=0,508), confirmando que las 7 variables eliminadas no aportaban significancia estadística al modelo.

04 El resultado

El modelo final explica el 89,26% de la varianza en los precios. Esto significa que con solo 9 variables se puede predecir con alta precisión el precio de una vivienda en Bogotá — una herramienta útil para decisiones de inversión inmobiliaria.

05 Variables con mayor impacto

Estrato
r = 0,82
La estratificación socioeconómica es el predictor más fuerte del precio de vivienda en Bogotá.
Área construida
r = 0,81
Metros cuadrados construidos — relación casi lineal con el precio.
Garajes
r = 0,81
El costo del parqueo en Bogotá lo convierte en un driver clave del precio.
Próximos proyectos
Clustering · Machine Learning

Segmentación de jugadores de fútbol con K-Means

Agrupación de jugadores según métricas de rendimiento usando K-Means y PCA para visualización en 2D.

Próximamente
Deep Learning · CNN

Clasificación de imágenes con redes neuronales

CNN entrenada en Google Colab con data augmentation y GPU para clasificación de imágenes.

Próximamente