Идея и концепция
Проект посвящён романтической литературе и тому, как в данных выглядит «успешный» роман.
На первый взгляд кажется, что успех книги можно измерить рейтингом. Но в датасете рейтинг большинства книг находится в довольно узком высоком диапазоне. Поэтому одной оценки недостаточно: книга может иметь хороший рейтинг, но оставаться почти незаметной для широкой аудитории.
В инфографике я сравниваю рейтинг, длину книги, год выхода и количество читательских оценок. Цель проекта — показать, что популярность романтического романа складывается не только из высокой оценки, но и из масштаба читательского внимания.
Главный вывод проекта: высокая оценка не равна популярности. В этой выборке успешный роман чаще выглядит как книга среднего объёма, вышедшая в эпоху онлайн-оценок и собравшая большое количество реакций.
В качестве источника использован открытый датасет Romance Books: A Must-Read for Book Lovers на Kaggle.
В датасете собраны данные о романтических книгах: название, автор, год выхода, рейтинг, длина книги и количество оценок. Для проекта были использованы показатели, которые позволяют сравнивать не только качество оценки, но и видимость книги среди читателей.
Основные параметры анализа: — рейтинг книги; — количество страниц; — год выхода; — количество читательских оценок.
Перед визуализацией данные были очищены и приведены к удобному формату: числовые значения рейтинга, длины книги, года выхода и количества оценок были обработаны в Python с помощью pandas.
Процесс создания
Работа началась с анализа прошлогоднего проекта и исходного датасета. Сначала я выделила основные переменные, которые могут описывать успех книги: рейтинг, объём, год публикации и количество оценок.
Данные были обработаны в Python: я проверила числовые значения, убрала лишние столбцы и подготовила отдельные таблицы для графиков. После этого были собраны несколько визуализаций: распределение книг по длине, связь длины и рейтинга, топ книг по количеству оценок и распределение книг по десятилетиям.
Черновые графики были экспортированы и доработаны визуально: для проекта выбрана спокойная тёплая палитра, близкая к бумаге и книжной теме. Основной акцентный цвет используется для всех графиков, чтобы постер воспринимался как единая система.
Финальный носитель — вертикальный постер. Такой формат позволяет показать несколько уровней анализа: от общего наблюдения к главному графику и финальному выводу. После создания постера были подготовлены мокапы, чтобы показать инфографику в реальном носителе.
Финальная инфографика
Вертикальный постер показывает связь между рейтингом, объёмом книги, годом выхода и количеством читательских оценок.
Вывод
Высокая оценка не равна популярности. В этой выборке успешный роман чаще выглядит как книга среднего объёма, вышедшая в эпоху онлайн-оценок и собравшая большое читательское внимание.
Данные также показывают, что выборка сильно смещена к книгам XXI века. Поэтому проект говорит не обо всей истории романтической литературы, а о том, как жанр представлен в современной цифровой среде оценок и рекомендаций.
Носитель
Мокапы показывают инфографику как вертикальный постер в интерьерном и выставочном контексте.
Процесс
Работа началась с анализа исходного датасета и выбора ключевых параметров: рейтинга, длины книги, года публикации и количества оценок.
Данные были обработаны в Python с помощью pandas. После очистки были подготовлены отдельные таблицы для графиков: распределение книг по длине, связь длины и рейтинга, топ книг по количеству оценок и распределение книг по десятилетиям.
Графики были собраны в единой цветовой системе и перенесены в Figma, где из них был сверстан финальный постер. Для подачи проекта также были подготовлены обложка без текста и мокапы носителя.
Рабочий файл в Figma: финальный постер, обложка и подготовка визуальной подачи проекта.
Источник: Kaggle — Romance Books: A Must-Read for Book Lovers. Инструменты: Python, pandas, matplotlib, Figma.



