Original size 2474x3500

Анализ датасета COVID-19

PROTECT STATUS: not protected

Концепция

SARS-CoV-2, наиболее известный как COVID-19, потряс весь мир, вызвав глобальный локдаун по всему миру. Коронавирус оказал серьёзное воздействие не только на здоровье миллиардов людей, но и на мировую экономику в целом. Многим из нас 2020 год — год пандемии, запомнится как значимое, но далеко не самое весёлое событие в жизни.

Цель данной работы — провести анализ на основе датасета COVID-19 Dataset, где собрана информация о заболевших. В нём представлены данные о поле, возрасте, имеющихся заболеваниях и прочих маркерах, важных для медицинского исследования.

Цветовая гамма

big
Original size 2560x1130

В качестве основных цветов я выбрала именно те, которые можно увидеть на снимках из микроскопа — красноватый и бледно-жёлтый. На мой взгляд, они сами по себе даже ассоциируются с болезненностью, особенно жёлтый.

Визуализация данных

Первым делом я импортировала все нужные для работы библиотеки: pandas, matplotlib и numpy. А также скачала файл датасета. В качестве рабочей среды был выбран Google Colab.

big
Original size 2560x1130

Импорт нужных библиотек и смачивание файла датасета в colab

Первым пластом данных для обработки стало распределение по половому признаку. Первый график — сравнение количества заболевших среди мужчин и женщин. Здесь, как мы видим, разницы практически нет: и мужчины, и женщины, заболевали одинаково. Второй график отражает смертность по полу. Здесь наоборот заметно, что мужчины умирали реже женщин.

Original size 2560x1117

Диаграммы заболевших COVID-19 по полу и смертности по полу среди пациентов

Original size 2560x1130

Следующий график — это данные о смертности пациентов с сопутствующим COVID-19 заболеваниями. Как мы видим, наиболее высоким риском умереть от коронавируса обладали пациенты с гипертонией, а в зоне наименьшего риска находились астматики.

Original size 2560x1130

График смертности среди пациентов с сопутствующими заболеваниями

Original size 2560x1130

Далее было подобрано две метрики для сравнения: пол и возраст. Как заметно на графике, наибольшая смертность среди как мужчин, так и женщин, наблюдалась в группе 80-99 лет. И, как мы уже заметили ранее, женщины болели чаще мужчин.

Original size 2560x1130

График смертности от заболевания по возрасту и полу

Original size 2560x1130

Здесь наглядно прослеживается пик смертности у женщин и мужчин на июньский период 2020-го года. Перед этим количество смертей от COVID-19 резко начал возрастать.

Original size 2560x1130

График смертности по месяцам и полу

Original size 2560x1130

Источники

Анализ датасета COVID-19
Project created at 14.10.2025
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more