Original size 2400x3369

Анализ и визуализация контента платформы Netflix

PROTECT STATUS: not protected

В данном проекте я исследую данные Netflix о фильмах и сериалах, взятые из датасета с сайта Kaggle, netflix_titles.csv.

База данных Netflix (netflix_titles.csv) Содержит информацию о фильмах и сериалах: тип (Movie / TV Show) год выпуска страна рейтинг

big
Original size 1600x1282

Для визуализации данных были выбраны несколько типов графиков: линейный график, столбчатая диаграмма, гистограмма и круговая диаграмма. Линейный график использовался для отображения изменения количества контента по годам, столбчатая диаграмма — для сравнения фильмов и сериалов, гистограмма — для анализа распределения возрастных рейтингов, а круговая диаграмма — для наглядного представления стран с наибольшим количеством контента.

Работа с данными началась с их загрузки с помощью библиотеки pandas. После этого были выбраны только необходимые столбцы, содержащие ключевую информацию для анализа: тип контента, год выпуска, страна, возрастной рейтинг и длительность.

После очистки данных были удалены пропущенные значения, а также проведено преобразование некоторых признаков (например, извлечение числового значения длительности из текстового формата). Далее данные были сгруппированы по годам для анализа динамики выпуска контента, а также подсчитано количество значений для различных категорий.

Загрузка данных

Original size 1302x833

Создание единого стиля

Original size 1250x185

Обработка данных и построение графиков

Линейный график

Original size 1250x491
Original size 1232x600

Столбчатая диаграмма

Original size 1249x388
Original size 1244x424

Гистограмма

Original size 1251x335
Original size 1239x567

Круговая диаграмма

Original size 1109x759

Заключение

Анализ показал, что количество контента на платформе значительно увеличивается с течением времени, особенно в последние годы. При этом фильмы составляют большую часть библиотеки по сравнению с сериалами. Большинство контента ориентировано на широкую аудиторию, что отражается в распределении возрастных рейтингов. Также наблюдается концентрация производства контента в нескольких странах, среди которых лидирующую позицию занимают США.

Использование визуализации позволило упростить восприятие информации и сделать анализ более наглядным. Применение различных типов графиков дало возможность рассмотреть данные с разных сторон и выявить основные закономерности.

Анализ длительности показал, что большинство фильмов соответствует стандартному временному диапазону, принятому в индустрии, что говорит о следовании общим производственным практикам.

В процессе выполнения проекта использовалась нейросеть ChatGPT в качестве вспомогательного средства: для уточнения синтаксиса кода и улучшения визуализации графиков.

Анализ и визуализация контента платформы Netflix
Project created at 22.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more