Проект предзначен для предсказания стоимости автомобиля по его характеристикам. Обучена модель инференс которой реализуется через сервис написанный на FastAPI.
- Очищены входные данные
- Заполнены пропуски
- Проведён EDA
- Категориальные признакие преобразованы с помощью OHE
- Обучена Линейная регрессия c линейной комбинацией
l1
иl2
регуляризаций (ElasticNet
): подбор гиперпараметров осуществлялся на кросс-валидации по 10 фолдам
R2
:0.818
MSE
:1.05e+11
доля предиктов, отличающихся от реальных цен на эти авто не более чем на 10%
: 0.281
Хороший буст дало логарифмирование таргета (+0.2 R2
), поскольку изначально у целевой переменной был длинный хвост, что приводило к переобучению и мешало генерализации это сильно сказалось на качестве
Модель обладает неплохим качеством с точки зрения R2
, но всё ещё является бейзлайном который явно можно улучшить за счёт более качественного фича инжиниринга.