Концепция
Кино является одним из самых популярных видов досуга, а вопрос «что посмотреть?» — вечным. Сравнение двух крупнейших баз данных, Кинопоиска и IMDb, представляет огромный интерес как для киноманов, так и для профессионалов индустрии. Это позволяет понять, какие фильмы имеют универсальный успех, а какие остаются локальными феноменами.
Проект представляет собой визуальное сопоставление данных двух крупнейших баз о кино. Инфографика анализирует расхождения в оценках, популярности жанров между русскоязычной и международной аудиториями. Визуализация построена по принципу «от общего к частному»: от глобального сравнения рейтингов к детальному разбору жанров и экономики кинопроизводства.
Цель проекта
Выявить ключевые различия в оценке фильмов русскоязычной и международной аудиториями на основе сравнительного анализа данных Кинопоиска и IMDb.
Данные
В основе данного проекта лежит объединённый датасет, содержащий информацию о фильмах из топов Кинопоиска и IMDb. Набор данных представляет собой структурированную таблицу, где каждая строка — это отдельный фильм, а столбцы описывают его ключевые характеристики.
Ключевая особенность этого датасета заключается в наличии парных идентификаторов и оценок (Rating Kinopoisk, Rating Imdb) для одних и тех же фильмов. Это позволяет проводить прямое сравнение и анализировать расхождения во мнениях двух разных аудиторий по широкому спектру параметров: от художественных предпочтений до экономических показателей успеха.
Инфографика
Инфографика помогает увидеть сравнение двух платформ.
Группированная гистограмма (Bar Chart) — Позволяет сравнить две аудитории бок о бок. Легко увидеть, в чем именно заключаются различия вкусов.
Горизонтальная гистограмма — показывает разницу в баллах и выводит Топ-10 фильмов, которые любят в мире и Топ-10 фильмов, которые любят в России.
Точечная диаграмма — показывает корреляцию рейтингов.
Линейный график — динамика среднего рейтинга фильмов по годам у Кинопоиска и IMDb
Гистограмма распределения разницы рейтингов, показывающая, насколько оценки на Кинопоиске отличаются от IMDb. И доля фильмов с совпадающими оценками показывает соотношение совпадений.
Мокапы
Процесс создания
Обработка данных: 1. Импорт: Загрузка CSV-файла в Google Colab. 2. Очистка: Преобразование типов данных и очистка числовых столбцов, обработка пропусков, приведение названий колонок к единому виду 3. Создание новых производных столбцов: разница рейтингов, средний рейтинг 4. Фильтрация 5. Подготовка данных для графика
Создание инфографики: 1. Создание графиков 2. Оформление итогового плаката с инфографиками в Figma 3. Создание обложки в FLUX.1 (promt: постер к фильму аватар в пиксель-арт стиле черно-белого цвета) 4. Создание итоговых мокапов в Photoshop
Использованные ресурсы: UPROCK FLUX.1
Заключение
Анализ объединенного датасета Кинопоиска и IMDb позволил визуализировать не просто сухие цифры, а целую экосистему мирового кинематографа, показав, как пересекаются и расходятся вкусы русскоязычной и международной аудиторий.