Original size 1140x1600

Исследование данных о приюте

PROTECT STATUS: not protected

Для данного проекта я использовала базу данных с сайта Kaggle.com, с данными из приюта для животных.

https://www.kaggle.com/datasets/chaudharisanika/pet-adoption-records-with-animal-and-adopter-data?resource=download

Как шла работа:

  1. Импорт библиотек, настройка стиля графиков (изначально выбрала один из имеющихся стилей в плот.либе)
  2. Загрузка таблицы с данными
  3. Предварительная обработка данных, если требовалась
  4. Создание новых признаков
  5. Построение графиков

Фильтрация и сортировка

0

Фильтрация с одним условием и сортировка отфильтрованных данных

0

Фильтрация одновременно по нескольким условиям и сортировка отфильтрованных данных

Новые признаки

0

Создание нового признака в данных с помощью анонимной функции

Создала новую категорию, определяющую возраст животного — взрослое (большое) ли оно.

0

Создание нового признака в данных с помощью именной функции

Создала новый признак, переведя годы в возрасте в месяцы.

Сводные таблицы

0

Сводная таблица: одни столбец группировки, один столбец агрегирования, один метод агрегирования

0

Сводная таблица: несколько столбцов группировки, один столбец агрегирования, один метод агрегирования

0

Сводная таблица: одни столбец группировки, несколько столбцов агрегирования, один метод агрегирования

0

Сводная таблица: одни столбец группировки, один столбец агрегирования, несколько методов агрегирования

0

Сводная таблица: одни столбец группировки, несколько столбцов агрегирования, несколько методов агрегирования

Замена пропусков и удаление выбросов

0

Проверка наличия пропусков в данных

0

Использование метода N стандартных отклонений для целевой переменной

0

Использование метода 1.5IQR для предиктора или другого количественного признака (не целевого):

0

Меры центральной тенденции целевого признака

0

Квартили целевого признака

0

Меры разброса целевого признака

0

Описание категориального признака

Корреляция Пирсона

0

Интерпретация самой сильной корреляции между признаками, по тепловой карте

0

Визуализация корреляционной матрицы с помощью тепловой карты

0

Построение диаграммы рассеяния между признаками, у которых самая сильная корреляция

Линейная регрессия

Модель парной (простой) линейной регрессии предполагает, что значение целевого признака adopter_age можно предсказать как линейную функцию признака age_years, то есть, что изменение age_years на единицу приводит к изменению adopter_age на определённое постоянное значение, с учетом случайных ошибок.

Y = b₀ + b₁X, где Y — зависимая переменная, X — независимая переменная, b₀ — свободный член (тоже, что и точка пересечения с осью Y), а b₁ — коэффициент регрессии, показывающий изменение Y при изменении X на единиц

  1. Уравнение парной линейной регрессии Общий вид уравнения:

adopter_age^ = b₀+b₁×age_years где: b₀ — свободный член (пересечение с осью Y), b₁ — коэффициент наклона (показывает, насколько в среднем изменяется adopter_age при увеличении age_years на 1)

0

Диаграмма рассеяния между целевой и предиктором c нанесенным на нее найденным уравнением линейной регрессии

Original size 970x628

Коэффициент детерминации R²: 0.010 Среднеквадратичная ошибка (MSE): 70.416 Средняя абсолютная ошибка (MAE): 7.152

Исследование данных о приюте
Project created at 02.07.2025
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more