Original size 1024x1536

Анализ выбросов CO₂ автомобилей

PROTECT STATUS: not protected

Цели и задачи исследования

post

Цель: понять, как характеристики автомобилей (класс, объём двигателя, топливо, трансмиссия и т. д.) связаны с выбросами CO₂.

Задачи:

  1. подготовить и очистить данные (co2.csv),
  2. провести EDA и визуализации,
  3. выявить основные зависимости,
  4. попробовать простую модель для прогноза CO₂.

Описание данных

big
Original size 1280x167
post

Источник данных

Этот датасет содержит информацию о технических характеристиках автомобилей, расходе топлива и выбросах CO₂. Данные собраны для анализа влияния различных параметров автомобилей на их экологический след и предсказания выбросов CO₂ с помощью моделей регрессии.

Переменные в датасете: — Make — Производитель автомобиля (строка, object). — Model — Модель автомобиля (строка, object). — Vehicle Class — Класс автомобиля (строка, object). — Engine Size (L) — Объем двигателя в литрах (число, float64). — Cylinders — Количество цилиндров (число, int64). — Transmission — Тип трансмиссии (строка, object). — Fuel Type — Тип топлива (строка, object). — Fuel Consumption City (L/100 km) — Расход топлива в городе (число, float64). — Fuel Consumption Hwy (L/100 km) — Расход топлива на шоссе (число, float64). — Fuel Consumption Comb (L/100 km) — Средний расход топлива (число, float64). — Fuel Consumption Comb (mpg) — Средний расход топлива в милях на галлон (число, int64). — CO2 Emissions (g/km) — Выбросы CO₂ в граммах на километр (число, int64).

0
post

— Автомобили с объемом двигателя больше 3.0 литров — всего 3 156 моделей. Это подтверждает, что автомобили с мощными двигателями встречаются довольно часто. — Автомобили с выбросами CO2 менее 150 г/км — всего 155 моделей. Это небольшое количество говорит о том, что большинство автомобилей не являются особо экологичными. — Автомобили с механической КПП — 1 185 моделей. Несмотря на популярность автоматической коробки передач, механика все еще встречается. — Автомобили с объемом двигателя более 3.0 литров и выбросами CO2 выше 250 г/км — 2 715 моделей. Подтверждается закономерность: чем больше двигатель, тем выше выбросы. — Дизельные автомобили с расходом в городе меньше 7 л/100 км — 0 моделей. Видимо, в этом наборе данных нет экономичных дизельных машин. — Гибридные автомобили с выбросами CO2 меньше 120 г/км — данных нет, что может означать либо малую представленность гибридов, либо их неэффективность в этой базе.

Визуализация

post

Выбросы CO2 (целевой признак):

  • Медиана (центральная линия в ящике) показывает, что половина автомобилей выбрасывает CO2 ниже примерно 246 г/км, а другая половина — выше.
  • Ящик (межквартильный размах, IQR) находится между 208 и 288 г/км, что означает, что 50% данных лежат в этом диапазоне.
  • Усы (минимальные и максимальные значения без выбросов) показывают, что большинство автомобилей выбрасывает CO2 в пределах от 96 до 400 г/км.
  • Выбросы (отдельные точки за пределами усов) — есть автомобили с экстремально высокими выбросами CO2 (до 522 г/км), что может соответствовать мощным двигателям или устаревшим моделям.

Объем двигателя (предиктор):

  • Медиана около 3.0 литров, что означает, что половина автомобилей имеет объем двигателя меньше 3.0 литров, а другая половина — больше.
  • Ящик (IQR) расположен примерно между 2.0 и 4.5 литрами, что говорит о высокой вариативности объемов двигателей.
  • Усы показывают, что типичный диапазон объемов двигателей находится между 1.0 и 6.0 литрами.
  • Выбросы — двигатели объемом выше 6.5 литров считаются аномальными, что, вероятно, относится к мощным спортивным или грузовым автомобилям.
post

Удалено 85 выбросов. Итоговый размер датафрейма: 7300 строк.

post

Сильная положительная корреляция:

  • Выбросы CO2 и расход топлива (Fuel Consumption): Чем выше расход топлива, тем больше выбросы CO2 (коэффициенты > 0.9).

  • Объем двигателя (Engine Size) и выбросы CO2: Мощные автомобили с большим двигателем выделяют больше CO2.

  • Количество цилиндров (Cylinders) и выбросы CO2: Чем больше цилиндров, тем выше выбросы. Отрицательная корреляция:

  • Расход топлива (L/100 km) и его аналог в mpg: Чем выше расход топлива в литрах, тем ниже эффективность в mpg (отрицательная корреляция около -1).

Вывод:

  • Можно предсказать выбросы CO2 на основе расхода топлива и объема двигателя.
  • Эффективность автомобиля (mpg) обратно пропорциональна его расходу — это ожидаемый результат.
  • Автомобили с большим числом цилиндров потребляют больше топлива и выбрасывают больше CO2.
post

— Распределение объема двигателя — показывает, что большинство автомобилей имеют объем двигателя в пределах 1-2 литров. — Распределение выбросов CO2 — демонстрирует, что выбросы CO2 в основном сосредоточены в диапазоне 150-300 г/км. — Распределение расхода топлива в городе — основная масса автомобилей потребляет от 10 до 15 литров на 100 км.

post

— Типы топлива — бензин (Z) и дизель (D) являются наиболее популярными. — Топ-10 трансмиссий — автоматические коробки передач встречаются чаще, чем механические. — Топ-10 классов автомобилей — компактные, среднеразмерные и внедорожники доминируют в выборке.

Original size 1489x489

Регрессионная модель

post

Уравнение модели: y = 0.66 + 0.82 * X Метрики качества модели: MAE: 0.23 MSE: 0.10 RMSE: 0.31 R²: 0.9873

  • Высокая точность модели — R² ≈ 0.99 подтверждает, что городской расход топлива почти полностью объясняет комбинированный расход.
  • Модель предсказывает с низкой ошибкой — в среднем отклонение от реальных значений не превышает 0.31 л/100 км.
  • Этот предиктор слишком очевидный — комбинированный расход топлива напрямую зависит от городского, поэтому в более сложных моделях его можно исключить, чтобы избежать мультиколлинеарности. ​

Генерация обложки и других дополнительных изображений — Sora. URL: https://openai.com/sora/

Источник данных — kaggle. URL: https://www.kaggle.com

Анализ выбросов CO₂ автомобилей
Project created at 14.10.2025
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more