Original size 1140x1600

Как залететь в тренды? Анализ данных по вирусному контенту в соцсетях

PROTECT STATUS: not protected

Концепция

Сейчас, пожалуй, каждый из нас является активным пользователем социальных сетей, а многие и вовсе ведут и развивают свой блог, в качестве развлечения или работы. Однако фактом остается одно, главная валюта социальных сетей — это внимание пользователей. В связи с этим, мне стало интересно, что делает контент вирусным? Ответить на этот вопрос мне помог анализ базы данных с сайта Kaggle «Viral Social Media Trends & Engagement Analysis».

big
Original size 1664x928

В этой базе я нашла данные о динамике вирусных трендов в социальных сетях TikTok, Instagram, Twitter и YouTube, а также данные о популярных хештегах, типах контента и вовлеченности пользователей. Поэтому, я решила проследить зависимость популярности публикаций от платформы, на которой они публикуются, сопровождающих их хештегов и типа формата.

Для визуализации я использовала различные типы графиков, например линейную диаграмму для демонстрации динамики числа просмотров в зависимости от платформы, или круговую для показа процентного соотношения просмотров, приходящихся на тот или иной хештег. Также были использованы столбчатые диаграммы и бабл чарт.

Подготовка к работе

Прежде всего, я загрузила датасет в Google Colab, чтобы с ним можно было работать, а затем подобрала цветовую палитру с помощью Adobe Color для будущих графиков и внедрила ее с помощью переменных.

big
Original size 1677x607

Загрузка датасета

Original size 1681x682

Создание кастомной палитры

Для своей работы я выбрала яркие цвета, которые ассоциируются с соц-сетями и отсылают к трендовому, «кричащему» контенту.

Original size 1871x881

цветовая палитра

График № 1

Прежде всего я решила выяснить, на какой платформе публикации увидит наибольшее количество людей. Для этого в линейной диаграмме были сопоставлены социальные сети и среднее количество просмотров на каждой из них. Выяснилось, что лидером, пусть и с небольшим отрывом, в этой категории является YouTube.

Original size 1189x690
Original size 1650x457

График № 2

Затем мне стало интересно, какие хештеги присвоены самым популярным видео. Для этого я составила круговую диаграмму с процентным соотношением в зависимости от количества просмотров.

Original size 992x876
Original size 1682x503

Данная диаграмма показала, что все хештеги находятся в примерно в равном соотношение в около 10%, однако в топ 3 по миру входят Fitness, Education и Challenge.

Original size 1376x768

График № 3

Однако рекомендации пользователей довольно сильно зависят не только от личных предпочтений, но и от региона, в котором они находятся. В связи с этим я также решила выделить самые популярные хештеги в разных странах, чтобы понять, что больше интересует людей там. Бабл чарт помог мне отследить количество просмотров, приходящееся на самый популярный хэштег в каждом регионе.

Original size 1180x790
Original size 1722x704
Original size 1738x441

Благодаря этому графику можно предположить какой контент стоит снимать для аудитории той или иной страны.

Графики № 4 и № 5

Далее я задалась вопросом: что больше влияет на вовлеченность пользователей, хештеги или тип формата? Чтобы ответить на него, я построила две гистограммы, которые иллюстрируют колебания уровня вовлеченности пользователей в зависимости от тегов и формы контента.

Original size 1189x690
Original size 1698x535
Original size 1189x690
Original size 1702x539

Судя по графикам, больший диапазон значений среднего уровня вовлеченности для различных хештегов, по сравнению с категориями типов контента, указывает на то, что хештеги оказывают более значительное влияние на уровень вовлеченности, чем типы контента. И хотя оба фактора играют роль, выбор хештега, по-видимому, приводит к более широкому спектру результатов среднего уровня вовлеченности.

Вывод

С помощью анализа датасета удалось выяснить, какой контент, где, и с какими тегами чаще становится популярен. Теперь можно смело идти покорять просторы интернета!

Ознакомиться с блокнотом можно здесь.

Original size 1152x836

Описание применения генеративных моделей

В ходе работы для написания кодов была использована встроенная в Google Colab модель Gemini, генерация всех изображений сделана с помощью Qwen.

Как залететь в тренды? Анализ данных по вирусному контенту в соцсетях
Project created at 16.01.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more