Original size 1090x1595

Музыка в цифрах: анализ данных Spotify

PROTECT STATUS: not protected

Рубрикатор

  1. Концепция
  2. Введение
  3. Цветовая палитра
  4. Анализ популярности артистов
  5. Анализ продолжительности треков и количества выпущенных песен в год
  6. Анализ наличия PAL
  7. Анализ зависимости аудио характеристик к популярности
  8. Анализ тенденций среди слушателей
  9. Вывод
  10. Описание применения генеративной модели
  11. Ссылки

Концепция

Для анализа данных я выбрала информацию о музыкальных треках, их аудиохарактеристиках и популярности на стриминговой платформе Spotify.
 Датасет был найден на платформе Kaggle и представляет собой набор данных о тысячах песен, включающий метаданные и подробные аудиометрики, рассчитанные алгоритмами платформы.
 Мне было интересно проанализировать именно эти данные, так как Spotify является крупнейшем игроком в индустрии музыкального стриминга, и его тренды отражают мировые предпочтения слушателей.
 Важно: данные актуальны по 2023 год

Введение

Для визуализации данных я использовала следующие типы графиков:

  1. Столбчатая диаграмма — для составления рейтинга артистов по средней популярности песен
  2. Гистограмма — для сравнения средней временной продолжительности треков, а также для выявления количества выущенных песен на платформе в год
  3. Круговая диаграмма — распределение песен по наличию нецензурной лексики
  4. Точечная диаграмма — для выявления связи между аудиохарактеристиками песни и ее популярности
  5. Тепловая карта нормализованных характеристик — для рассмотрения эволюции в музыкальных предпочтениях слушателей по годам

Цветовая палитра

Original size 2940x1274

Анализ популярности артистов

Я использовала код, чтобы проанализировать среднюю популярность артистов по средней популярности их песен. Этот анализ показывает самых успешных исполнителей датасета и позволяет сравнивать их между собой.

Original size 2782x1582

Анализ продолжительности треков и количества выпущенных песен в год

Также с помощью кода были построены гистограммы для сравнения продолжительности треков в датасете, а также для выявления среднего числа выпускаемых работ в год.

Original size 2940x1750

Анализ наличия PAL

Далее мне стало интересно понять, какой процент треков датасета имеет нецензурную лексику в своих текстах. Для этого я построила круговую диаграмму, которая отлично это демонстрирует.

0

Анализ зависимости аудио характеристик к популярности

Для одного из самых интересных и сложных анализов была выбрана точечная диаграмма, которая показывает зависимость популярности композиции от ее аудио характеристик.

Original size 2846x1766
Original size 1734x1398

Анализ тенденций среди слушателей

Финальный анализ включает в себя сразу большое количество показателей, которые помогают нам отследить предпочтения и тенденции слушателей по годам. Для этого был написан код с акцентом на нормализацию музыкальных характеристик и их визуализацию в виде тепловой карты, показывающей эволюцию музыкальных предпочтений с 1990 года по настоящее время. Этот анализ демонстрирует, как менялись музыкальные характеристики от года к году, какие тренды наблюдаются в развитии музыкальных предпочтений аудитории, и позволяет выявить периоды наиболее значительных изменений в музыкальной индустрии.

Original size 2772x1748
Original size 2026x1560

Вывод

Анализ, выбранных мной данных, показал, что популярность треков зависит от множества факторов: жанра, энергетики, длительности, года выпуска и наличия explicit-контента. Топ-артисты поддерживают стабильно высокую популярность, музыкальные характеристики эволюционируют во времени, отражая изменения в технологиях, культуре и вкусах аудитории. Анализ выявил корреляцию между энергетичностью и популярностью, оптимальную длительность треков и динамику предпочтений по годам, что может быть использовано артистами, продюсерами и платформами для оптимизации музыкального контента и рекомендательных систем.

Описание применения генеративной модели

В проекте использована большая языковая модель Claude (версия 4.5), которая помогла с написанием кода и устранением ошибок в нем.

Музыка в цифрах: анализ данных Spotify
Project created at 17.01.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more