Анатомия успешного романтического романа on Dafes

Идея и концепция

Проект посвящён романтической литературе и тому, как в данных выглядит «успешный» роман.

На первый взгляд кажется, что успех книги можно измерить рейтингом. Но в датасете рейтинг большинства книг находится в довольно узком высоком диапазоне. Поэтому одной оценки недостаточно: книга может иметь хороший рейтинг, но оставаться почти незаметной для широкой аудитории.

В инфографике я сравниваю рейтинг, длину книги, год выхода и количество читательских оценок. Цель проекта — показать, что популярность романтического романа складывается не только из высокой оценки, но и из масштаба читательского внимания.

Главный вывод проекта: высокая оценка не равна популярности. В этой выборке успешный роман чаще выглядит как книга среднего объёма, вышедшая в эпоху онлайн-оценок и собравшая большое количество реакций.

Данные и источник

В качестве источника использован открытый датасет Romance Books: A Must-Read for Book Lovers на Kaggle.

В датасете собраны данные о романтических книгах: название, автор, год выхода, рейтинг, длина книги и количество оценок. Для проекта были использованы показатели, которые позволяют сравнивать не только качество оценки, но и видимость книги среди читателей.

Основные параметры анализа: — рейтинг книги; — количество страниц; — год выхода; — количество читательских оценок.

Перед визуализацией данные были очищены и приведены к удобному формату: числовые значения рейтинга, длины книги, года выхода и количества оценок были обработаны в Python с помощью pandas.

Процесс создания

Работа началась с анализа прошлогоднего проекта и исходного датасета. Сначала я выделила основные переменные, которые могут описывать успех книги: рейтинг, объём, год публикации и количество оценок.

Данные были обработаны в Python: я проверила числовые значения, убрала лишние столбцы и подготовила отдельные таблицы для графиков. После этого были собраны несколько визуализаций: распределение книг по длине, связь длины и рейтинга, топ книг по количеству оценок и распределение книг по десятилетиям.

Черновые графики были экспортированы и доработаны визуально: для проекта выбрана спокойная тёплая палитра, близкая к бумаге и книжной теме. Основной акцентный цвет используется для всех графиков, чтобы постер воспринимался как единая система.

Финальный носитель — вертикальный постер. Такой формат позволяет показать несколько уровней анализа: от общего наблюдения к главному графику и финальному выводу. После создания постера были подготовлены мокапы, чтобы показать инфографику в реальном носителе.

Финальная инфографика

Original size 2800x4000

Вертикальный постер показывает связь между рейтингом, объёмом книги, годом выхода и количеством читательских оценок.

Вывод

Высокая оценка не равна популярности. В этой выборке успешный роман чаще выглядит как книга среднего объёма, вышедшая в эпоху онлайн-оценок и собравшая большое читательское внимание.

Данные также показывают, что выборка сильно смещена к книгам XXI века. Поэтому проект говорит не обо всей истории романтической литературы, а о том, как жанр представлен в современной цифровой среде оценок и рекомендаций.

Носитель

Original size 4096x2730

Original size 4096x3072

Original size 4096x2730

Мокапы показывают инфографику как вертикальный постер в интерьерном и выставочном контексте.

Процесс

Работа началась с анализа исходного датасета и выбора ключевых параметров: рейтинга, длины книги, года публикации и количества оценок.

Данные были обработаны в Python с помощью pandas. После очистки были подготовлены отдельные таблицы для графиков: распределение книг по длине, связь длины и рейтинга, топ книг по количеству оценок и распределение книг по десятилетиям.

Графики были собраны в единой цветовой системе и перенесены в Figma, где из них был сверстан финальный постер. Для подачи проекта также были подготовлены обложка без текста и мокапы носителя.

Original size 3600x2338

Рабочий файл в Figma: финальный постер, обложка и подготовка визуальной подачи проекта.

Источник: Kaggle — Romance Books: A Must-Read for Book Lovers. Инструменты: Python, pandas, matplotlib, Figma.