Original size 376x600

Исследование факторов выживания дтп

PROTECT STATUS: not protected

Исследование факторов выживания в ДТП

Вводная часть

Выбор данных и их источник

Выбор данных и их источник Для данного исследования я выбрал набор данных, содержащий информацию о дорожно-транспортных происшествиях. Файл accident.csv включает следующие параметры: — Возраст участника ДТП — Пол (мужской/женский) — Скорость при столкновении (км/ч) — Использование защитного шлема (да/нет) — Использование ремня безопасности (да/нет) — Исход происшествия (выживание/гибель)

Почему эти данные?

Изучение данных о ДТП представляет особую ценность для общества, поскольку помогает выявить ключевые факторы, влияющие на выживаемость, и может послужить основой для разработки более эффективных мер безопасности на дорогах. Меня заинтересовала возможность проанализировать, как различные факторы — возраст, пол, скорость и использование защитных средств — комплексно влияют на шансы выжить в аварии.

Выбранные типы визуализации

Для разностороннего анализа данных я выбрала 6 различных типов визуализации: Гистограмма с наложением — показывает распределение скорости при столкновении для выживших и погибших Столбчатая диаграмма — отображает процент выживаемости по возрастным группам Горизонтальная диаграмма — демонстрирует влияние использования защитных средств Тепловая карта — визуализирует выживаемость в зависимости от возраста и скорости Гистограммы по полу — сравнивает распределение по возрасту среди мужчин и женщин Точечная диаграмма — представляет многофакторный анализ с учетом всех переменных

Этапы работы

Предобработка данных

Началом работы стала загрузка и предварительная обработка датасета: Импорт файла в Google Colab через специальный интерфейс загрузки Перевод названий столбцов и категориальных значений на русский язык Создание дополнительных признаков: возрастные группы (0-18, 19-30, 31-45, 46-60, 61+) и группы скорости (диапазоны по 20 км/ч) Подготовка данных для визуализации с необходимыми агрегациями

Использование нейросетей

В процессе проекта я активно применяла модель DeepSeek для: Написания и оптимизации кода на Python Подбора оптимальных параметров визуализации Исправления синтаксических ошибок в сложных фрагментах кода Формулировки выводов на основе полученных визуализаций Наиболее полезными оказались следующие промпты: «Напиши код для анализа факторов выживаемости в ДТП на Python» «Как лучше визуализировать связь между возрастом, скоростью и выживаемостью?» «Исправь ошибки в коде тепловой карты с несколькими параметрами»

Стилизация графиков

Для всех визуализаций я разработала единую цветовую схему, основанную на пяти гармоничных цветах: Синие оттенки для положительных показателей (выживаемость) Красные и оранжевые для отрицательных показателей (невыживаемость) Дополнительные цвета для создания градиентов и акцентов Все графики оформлены в едином стиле с использованием: Сетки с пунктирными линиями для улучшения читаемости Четких подписей осей и заголовков с увеличенным шрифтом Легенд с понятными обозначениями Отображения конкретных значений (процентов) на графиках

Итоговые графики и их интерпретация

1. Распределение скорости при столкновении и выживаемость

Первый график показывает, как распределяется выживаемость в зависимости от скорости столкновения. Явно видна закономерность: чем выше скорость, тем меньше шансов выжить. Особенно заметен резкий спад выживаемости после отметки 80 км/ч. В диапазоне 100-120 км/ч подавляющее большинство случаев заканчивается летальным исходом.

Original size 1338x889

2. Процент выживаемости по возрастным группам

На этом графике неожиданно обнаруживается, что самый низкий показатель выживаемости (20%) у молодых людей от 0 до 18 лет. Далее выживаемость растет с возрастом, достигая максимума в группе 46-60 лет (56.4%). Группы 31-45 и 61+ также показывают относительно высокие показатели выживаемости (около 50%).

Original size 1189x690

3. Влияние использования защитных средств на выживаемость

Два горизонтальных графика наглядно демонстрируют разницу в выживаемости при использовании защитных средств: Ремень безопасности увеличивает шансы на выживание с 47,2% до 53,2% При использовании защитного шлема выживаемость составляет 48,6% против 52,8% без шлема Интересно, что по данному набору данных использование шлема не показало ожидаемого положительного эффекта.

Original size 1589x690

4. Тепловая карта выживаемости по возрасту и скорости

Тепловая карта дает комплексное представление о взаимовлиянии двух факторов. Наблюдаются закономерности: Наивысшая выживаемость (100%) в клетках с низкой скоростью (0-20 км/ч) для возрастных групп 19-30 и 46-60 Некоторые неожиданные аномалии, например, 100% выживаемость в группе 61+ при скорости 81-100 км/ч Нулевая выживаемость в группе 0-18 лет при скоростях 0-20 и 81-100 км/ч

Original size 1116x890

5. Различия в выживаемости между полами

Сравнительные гистограммы показывают различия в паттернах выживаемости между мужчинами и женщинами: У женщин наблюдается больше случаев с высокой выживаемостью в возрасте 50-60 лет У мужчин больше случаев гибели распределено по возрастам 30-60 лет Женщины показывают более высокую выживаемость в возрасте после 50 лет

Original size 1589x690

6. Точечная диаграмма факторов выживаемости

Комплексная диаграмма объединяет все факторы: Цвет точек (от красного к зеленому) отражает выживаемость Размер точек показывает количество используемых средств защиты Положение точек соответствует возрасту (вертикальная ось) и скорости (горизонтальная ось) График демонстрирует сложное взаимодействие факторов, но позволяет заметить тенденцию: зеленые точки (выжившие) чаще встречаются при низких скоростях и с большим размером (больше средств защиты)

Original size 1189x690

Выводы

Анализ данных о дорожных происшествиях позволил выявить несколько ключевых факторов, влияющих на выживаемость: Скорость при столкновении является критическим фактором — при превышении 80 км/ч шансы на выживание существенно снижаются.

Возраст имеет неожиданное влияние: вопреки ожиданиям, молодые люди (0-18) показывают самую низкую выживаемость, а люди среднего и старшего возраста — более высокую.

Использование защитных средств показывает неоднозначные результаты: ремни безопасности увеличивают выживаемость, а защитные шлемы в данной выборке не продемонстрировали ожидаемого положительного эффекта.

Пол также влияет на исход: женщины имеют более высокие показатели выживаемости в старшем возрасте по сравнению с мужчинами.

Комбинация факторов создает сложную картину выживаемости, где присутствуют как ожидаемые закономерности, так и статистические аномалии.

Результаты исследования могут быть полезны для: Разработки более эффективных программ дорожной безопасности Создания целевых профилактических мер для групп повышенного риска Пересмотра стандартов безопасности транспортных средств с учетом возрастных особенностей

Описание применения генеративной модели

В рамках данного проекта я использовала генеративную модель DeepSeek для нескольких задач: Создание базового кода для анализа данных и построения различных типов визуализаций с использованием библиотек Pandas, Matplotlib, Seaborn и NumPy.

Оптимизация параметров визуализации — подбор оптимальных цветовых схем, размеров графиков, шрифтов и других элементов оформления.

Отладка сложных фрагментов кода, особенно при работе с тепловой картой и точечной диаграммой, где требовалась настройка множества параметров.

Формулировка аналитических выводов на основе визуализаций и выявление неочевидных закономерностей в данных.

Исследование факторов выживания дтп
Project created at 23.03.2025
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more