Original size 1024x1536

Sleep & Lifestyle: визуальный анализ данных о сне и привычках

PROTECT STATUS: not protected

Вводная часть

Данные и источник

Я использовала датасет Sleep Health and Lifestyle Dataset.

Формат данных — таблица с записями о людях: возраст, пол, профессия, длительность сна, субъективное качество сна, уровень стресса, физическая активность, количество шагов, пульс и наличие/тип расстройства сна.

Источник: открытый датасет с платформы открытых данных (Kaggle / open data-площадка).

Почему именно эти данные

Тема сна и стресса напрямую связана с повседневной жизнью и благополучием человека.

В датасете одновременно есть факторы образа жизни (активность, шаги, стресс) и показатели сна (длительность, качество, расстройства).

Такой набор позволяет не просто построить красивые графики, а проверить интуитивные гипотезы: — помогает ли физическая активность спать лучше; — насколько сильно стресс портит сон; — как связаны шаги, пульс и качество сна.

Какие виды графиков я выбрала и почему

Я использовала несколько типов визуализаций:

Гистограмма — чтобы показать распределение длительности сна в выборке и увидеть, где находится «норма».

Линейный график (среднее качество сна vs уровень активности) — чтобы показать, как качество сна меняется по группам активности, в динамике, а не одной цифрой.

Тепловая карта корреляций — чтобы одновременно показать все взаимосвязи между параметрами: сном, стрессом, активностью, шагами и пульсом.

Линейный график (качество сна vs уровень стресса) — чтобы отдельно подчеркнуть, как именно стресс влияет на сон, и сделать объясняющий график с ярко читаемым трендом.

Такая комбинация даёт и обзор распределений, и анализ связей, и наглядные объясняющие графики.

Этапы работы

Обработка данных (pandas)

  1. Загрузка данных
Original size 2190x660
Original size 2174x290
  1. Проверка
Original size 2182x934
  1. Работа с пропусками и категориями

Заполнила пропуски в столбце с расстройствами сна значением «без расстройств».

Создала категориальные группы по уровню активности и уровню стресса (очень низкий — очень высокий).

  1. Агрегации и группировки

Считала среднее качество сна для разных уровней активности и стресса.

Собрала выборку числовых признаков для корреляционной матрицы.

Использование нейросетей

Я использовала генеративную модель ChatGPT (GPT-5.1): — для помощи в написании кода на Python / pandas / matplotlib; — для создания обложки проекта; — для подбора структуры и подписей к графикам.

Примеры запросов (промптов): — «Подскажи код для тепловой карты корреляций» — «Помоги сформулировать вывод по графику зависимости стресса и сна».

Стилизация графиков

Использовала библиотеки matplotlib и seaborn.

Задала единый шрифт IBM Plex Sans через matplotlib.font_manager, чтобы графики выглядели как единая инфографика.

Палитра — спокойные зелёные и мятные оттенки, ассоциирующиеся с медициной, здоровьем и мониторингом состояния.

Вдохновлялась визуальным языком медицинских дашбордов и научных журналов.

Статистические методы

Описание распределений — с помощью гистограммы посмотрела форму распределения длительности сна.

Средние значения по группам — groupby + mean () для анализа качества сна при разных уровнях активности и стресса.

Корреляционный анализ — использовала метод .corr () (корреляция Пирсона) для числовых параметров: длительность сна, качество сна, активность, стресс, шаги, пульс. — визуализировала матрицу корреляций через seaborn.heatmap.

Интерпретация корреляций — сильная отрицательная корреляция (около −0.8…−0.9) между стрессом и качеством/длительностью сна; — положительная корреляция между физической активностью и шагами, а также между активностью и качеством сна.

Итоговые графики

График 1 — Распределение длительности сна

Что показывает: Как наиболее часто распределены часы сна среди всех участников.

Вывод: — Большинство людей спят от 6.5 до 7.8 часов — Это близко к медицинским нормам — Крайние значения редки

Original size 2184x790
Original size 771x564

График 2 — Влияние физической активности на качество сна

Что показывает: Рост качества сна по мере увеличения физической активности.

Вывод: — При высокой активности качество сна наиболее высокое — У малоподвижных участников сон хуже — Очень высокая активность даёт эффект, но немного ниже пика (перетрен?).

Original size 2166x1086
Original size 785x567

График 3 — Корреляции

Что показывает: Взаимосвязи между 6 ключевыми параметрами.

Главные выводы: — Сон и стресс имеют сильную отрицательную корреляцию (−0.81 / −0.90) — Качество сна растёт при увеличении активности — Пульс растёт при увеличении стресса — Количество шагов связано с уровнем активности (0.77)

Original size 2172x1146
Original size 2176x686
Original size 893x724

График 4 — Качество сна и стресс

Что показывает: Чем выше стресс, тем хуже качество сна.

Вывод: — При низком стрессе качество сна максимально — После уровня стресса 6 начинается резкое ухудшение — На уровне 8 качество сна минимально

Original size 2168x1280
Original size 778x558

Общие выводы

Сон оказывается чувствителен и к позитивным факторам (физическая активность), и к негативным (стресс).

Умеренная и высокая активность связаны с лучшим качеством сна.

Стресс — главный негативный фактор: с ростом стресса сон становится короче и хуже по субъективной оценке.

Датасет позволяет сформулировать выводы, которые согласуются с общими медицинскими рекомендациями: больше движения, меньше стресса → лучше сон.

Код и данные

Sleep & Lifestyle: визуальный анализ данных о сне и привычках
Project created at 14.01.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more