О проекте
Проект посвящён визуальному исследованию данных о фильмах на основе открытого датасета TMDB. Цель — понять, как меняется структура киноиндустрии, какие жанры доминируют и как соотносятся пользовательские рейтинги и коммерческие показатели.
Фокус проекта — не на сложной статистике, а на наглядной визуализации, которая позволяет быстро увидеть ключевые тенденции и закономерности в данных.
Данные
В проекте использован датасет TMDB 5000 Movie Dataset, содержащий информацию о фильмах, включая:
• год выхода
• жанры
• пользовательские рейтинги
• количество голосов
• бюджет и выручку
Перед анализом данные были очищены и приведены к удобному формату: удалены пропуски, извлечён год выхода и нормализованы числовые показатели.
Визуальный стиль
Визуальный стиль проекта вдохновлён интерфейсом платформы TMDB и использует фирменную голубую палитру, что создаёт ощущение аналитического и технологичного продукта и подчёркивает цифровую природу данных.
Цветовая палитра The Movie Database
Вопросы исследования
В рамках проекта были сформулированы следующие вопросы:
• Как менялось количество выпускаемых фильмов со временем?
• Какие жанры представлены в датасете чаще всего?
• Какие жанры в среднем получают более высокие оценки?
• Есть ли визуальная связь между рейтингом фильма и его коммерческим успехом?
Количество фильмов по годам
График отражает общий рост числа релизов в последние десятилетия. Начиная с конца XX века наблюдается заметное увеличение количества фильмов, что связано с ростом индустрии и развитием цифровых технологий производства и дистрибуции контента.
Последние годы представлены менее полно, что может быть связано с ограничениями датасета. (Unfortunately)
Топ-10 жанров
Распределение жанров показывает, что основную долю составляют драма, комедия и триллер. Эти жанры формируют базу массового кинопроизводства и часто комбинируются между собой.
Средний рейтинг по жанрам
Некоторые жанры демонстрируют более высокие средние рейтинги, несмотря на меньшее количество релизов. Это может указывать на более нишевую аудиторию и более высокие ожидания к качеству контента.
Рейтинг и выручка
Диаграмма рассеяния показывает, что между рейтингом фильма и его выручкой отсутствует простая линейная зависимость. Среди коммерчески успешных фильмов встречаются как высоко, так и средне оценённые работы.
Выводы
Визуальный анализ показывает, что киноиндустрия за последние десятилетия значительно выросла, при этом структура жанров остаётся относительно стабильной. Различные жанры демонстрируют заметные различия в пользовательских оценках, а коммерческий успех не всегда напрямую связан с рейтингами.



