Original size 2480x3500

Анализ недвижимости в Москве

PROTECT STATUS: not protected

КОНЦЕПЦИЯ

Тема недвижимости, в частности, её функционирование в условиях крупного и динамично развивающегося мегаполиса, каким является Москва, представляла для меня предмет особого интереса. В этой связи, было принято решение о проведении аналитического исследования ценовой политики на рынке жилой недвижимости в различных административных округах столицы. Целью данного исследования является выявление устойчивых тенденций и закономерностей, определяющих формирование стоимости жилья в зависимости от локационных, инфраструктурных и иных факторов. Для этого я использовала датасет «Moscow Housing Price Dataset» с платформы Kaggle. В нём собрана информация о квартирах, включая цену, количество комнат, площадь, удалённость от метро и другие параметры.

big
Original size 0x0

Изображение сгенерировано с помощью ideogram.ai

Мне было важно не просто изучить сами цены, но и визуализировать данные, чтобы наглядно увидеть, какие факторы сильнее всего влияют на стоимость жилья. Поэтому я использовала различные виды графиков:

> Гистограммы — для распределения цен, количества квартир в районах, этажности. > Столбчатые диаграммы — для анализа стоимости жилья у разных станций метро. > Круговую диаграмму — чтобы показать распределение квартир по типу ремонта. > Облако слов — чтобы выделить наиболее популярные станции метро. > Графики рассеяния — для изучения связи между ценой, удалённостью от метро и площадью.

Обработка данных

Первым шагом я скачала датасет с помощью библиотеки kagglehub и нашла нужный CSV-файл. Далее я провела первичный анализ:

-Проверила, какие данные есть в датасете, сколько в нём пропущенных значений. -Вычислила статистические показатели — среднее, медиану, минимальные и максимальные цены. -Определила уникальные значения для категориальных признаков.

Затем я начала подготовку данных:

-Привела цены в более удобный формат — миллионы рублей. -Преобразовала некоторые числовые и категориальные признаки.

Визуализация данных

Original size 1200x1426

Я создала собственное оформление с помощью matplotlib, где основной цвет всех графиков — бордовый (#a8002c), так как это цвет фона герба Москвы, а по мере снижения показателей оттенок становится светлее.

Original size 3500x2000

(1) Гистограмма цен квартир

Гистограмма цен квартир — показала распределение стоимости жилья, выявив, что большая часть квартир стоит до 50 миллионов рублей.

Original size 1279x705

(2) Столбчатый график по районам

Столбчатый график по районам — позволил увидеть распределение предложения по Москве и Московской области.

Original size 1264x792

(3) Средняя цена по станциям метро

Средняя цена по станциям метро — оказалось, что самые дорогие квартиры находятся у станций Лужники, Площадь Революции и Театральная, а самые дешевые у станций Лихоборы, Остафьево и Бутово.

Original size 1583x984

(4) Круговая диаграмма типа ремонта

Круговая диаграмма типа ремонта — показала, что больше половины квартир продается с косметическим ремонтом.

Original size 986x811

(5) Облако слов станций метро

Облако слов станций метро — визуализировало, у каких станций чаще всего продаются квартиры.

Original size 1182x601

(6) Распределение квартир по этажам

Распределение квартир по этажам — абсолютное большинство предложений находится на нижних и средних этажах (1–17 этажи).

Original size 2480x3500

(7) График зависимости цены от времени до метро

График зависимости цены от времени до метро — подтвердил очевидное: чем дальше от метро, тем дешевле жильё.

Original size 1187x704

(8) Кластеризация квартир по площади и цене

Кластеризация квартир по площади и цене — позволила выделить группы жилья по метражу и стоимости, показав, какие типы квартир наиболее популярны. Начиная с общей площади квартиры в 80 м² наблюдается четкая линейная зависимость роста цены от дальнейшего увеличения площади.

Original size 1186x708

(9) Модель для предсказания цен

После анализа данных я решила попробовать предсказать цену квартиры на основе её параметров. Для этого я использовала градиентный бустинг (Gradient Boosting Regressor).

Алгоритм был обучен на следующих характеристиках:

-Площадь квартиры; -Количество комнат; -Удалённость от метро; -Этаж.

Я провела обучение модели и оценила её точность с помощью метрики MAE (средняя абсолютная ошибка). Она составила ≈ 13 млн рублей, что является неплохим результатом, учитывая сложность рынка недвижимости.

На финальном графике я сравнила реальные и предсказанные цены, и можно сказать, что модель справилась достаточно хорошо.

Original size 1255x705

Выводы

Этот анализ помог мне глубже понять рынок недвижимости Москвы.

Среди ключевых выводов:


✔️ Цена квартиры сильно зависит от близости к метро — удалённость в 10+ минут снижает стоимость.
 ✔️ Район и станция метро имеют огромное значение — жильё в центре по-прежнему в разы дороже.
 ✔️ Квартиры с косметическим ремонтом встречаются чаще, чем с дорогой отделкой. ✔️ Средний сегмент — это квартиры 50–70 м² за 15–25 млн рублей.

Original size 1248x832

Изображение сгенерировано с помощью ideogram.ai

Описание применения генеративной модели

Chat GPT — это запросы для получения инструкций и советов по оптимизации кода, ответы на вопросы об использовании функций и библиотек. (URL: https://chatgpt.com)

Leonardo AI — генерация обложки (URL: https://leonardo.ai)

Ideogram.ai — генерация изображений по заданному промту (URL: https://ideogram.ai)

Matplotlib — создание визуализаций на Python (URL:https://matplotlib.org/)

Ссылка на блокнот и датасет:

https://disk.yandex.ru/d/q3Ie5PbcvKZP8w

Анализ недвижимости в Москве
Project created at 23.03.2025
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more