Бабочки — одна из самых узнаваемых групп насекомых, привлекающая внимание как учёных, так и любителей природы. Однако далеко не все задумываются о том, насколько разнообразен мир чешуекрылых и какие виды действительно преобладают в природе. В рамках проекта были исследованы 100 видов бабочек и мотыльков, а собранные данные о распределении изображений представлены в формате наглядной визуальной истории.
Цель инфографики — показать, какие виды наиболее распространены в датасете, как соотносится количество бабочек и мотыльков. Инфографика помогает быстро выявить дисбаланс классов, который сложно заметить при работе с табличными данными. Она может быть полезна исследователям в области компьютерного зрения, энтомологам и всем, кто интересуется биоразнообразием чешуекрылых.
Информационный плакат
Основой проекта послужили данные о различных видах бабочек, собранные из открытого датасета, содержащего информацию о классификации видов и распределении изображений по категориям.
Для каждого вида были проанализированы данные о количестве экземпляров в выборке, разнообразии представленных категорий и особенностях распределения классов внутри набора данных.
Исходные графики, полученные при помощи Python и Google Colab
На первом этапе вся информация была собрана, систематизирована и предварительно организована в Google Sheets, что позволило удобно провести первичную проверку структуры данных и подготовить таблицу к дальнейшей работе. После этого подготовленный набор данных был экспортирован в формат CSV и загружен в среду Google Colab для последующей обработки.
Мокапы
Анализ данных и построение визуализаций выполнялись с использованием Python, благодаря чему удалось создать более детализированные графики, отражающие распределение видов, соотношение категорий и общую структуру датасета. На заключительном этапе полученные графические материалы и дополнительные визуальные элементы были объединены в единую инфографику, представляющую результаты исследования в целостном и наглядном формате.
мокапы
Самый большой по численности вид — Mourning Cloak. Этот вид лидирует по числу изображений и опережает остальных представителей выборки.
Преобладание бабочек над мотыльками (≈4:1) указывает на выраженную дневную направленность выборки. Это накладывает ограничения на обобщающую способность модели, особенно для редких и ночных видов.
Исходные данные



