Original size 928x1232

Анализ имён созвездий

PROTECT STATUS: not protected

Введение

Звёзды — одно из самых привлекательных явлений природы. Я не знаю человека, который не любит на них смотреть. Каждая звезда обладает уникальным строением, температурой, свойствами. Эти невероятные частицы вселенной формируют созвездия, не менее уникальные по своей природе явления.

Ни одно не похоже в точности на другое, поэтому учёные дают созвездиям имена, многие из которых зависят от мифологии Древней Греции, культурных традиций, внешнего сходства расположения звезд с предметами или животными.

Мне стало интересно изучить эту тему поглубже, поэтому я провела анализ строения имён созвездий с лингвистической точки зрения (окончания/длина слов и тп).

Я выбрала данные с сайта Kaggle — ведущей мировой онлайн-платформа и сообщества для специалистов по Data Science и машинному обучению, принадлежащей Google

Для визуализации данных я использовала точечную диаграмму (наглядно показывает распределение звёзд по количеству букв в имени), круговую диаграмму (очевидно демонстрирует соотношение звёзд с разным количеством слов в имени), 2 гистограммы (отлично показывают соотношение первых букв и разных окончаний в именах), а также облако слов (ярко отображает самые часто встречающиеся в данных имена).

Оформление

big
Original size 1920x1025
big
Original size 1920x1025

Обработка данных

Original size 850x183

Для начала я импортировала необходимые мне библиотеки: numpy, matplotlib.pyplot, wordcloud и pandas.

Original size 850x183

После чего считала скачанный csv-файл «Stars_Names.csv» и отобразила данные, чтобы убедиться в корректности загрузки

Original size 850x220

Далее очистила данные, убрав лишние пропуски и пробелы, а также подготовила данные для диаграмм:

  1. Подсчитала количество символов для точечной диаграммы
  2. Подсчитала количество слов для круговой диаграммы

Создала стиль оформления. Для передачи атмосферы космоса я задала тёмно-синий цвет для фона диаграмм с голубой для акцентов

Original size 850x220

Визуализация данных

0

Точечная диаграмма показывает, что чаще всего длина имён составляет 4-8 символов, реже встречаются более длине имена (9-16) и практически не встречаются имена с количеством символов меньше 3

0

На круговой диаграмме видно, что имена созвездий почти всегда состоят из 1 слова (92.8%), в редких случаях имена бывают из 2 слов (7.2%), а из 3 и более слов не записывают.

По результатам первых двух графиков уже можно сделать предположение: такая статистика может быть связана с тем, что короткие имена легче запомнить и нанести на звездные карты.

0

Среди первых букв созвездий чаще всего встречается буква А (больше 85), М (около 38), S (около 35) и T (около 22). Я спросила у Google Gemini, с чем это может быть связано и вот какой результат он мне дал [1]:

«Буква A лидирует из-за обилия арабских имен звезд, начинающихся на артикль „Аль-“, а буквы S и T преобладают в списках из-за системы именования переменных звезд, которые получают латинские литеры по алфавиту начиная с R. Статистика M объясняется популярностью каталога Мессье и обилием красных карликов спектрального класса M в списках ближайших к нам объектов.»

0

Среди окончаний имён созвездий самым распространённым вариантом является -lis, на втором месте -ior, затем -rus и -rab.

Google Gemini объясняет это так: «Эта статистика — прямое отражение латинской грамматики, на которой официально названы все 88 созвездий… Такое распределение возникло потому, что астрономы XVIII–XIX веков (Лакайль, Гевелий) давали новым созвездиям технические латинские имена, часто используя именно эти грамматические формы.»

0

Это облако слов состоит из имён звёзд. Чем крупнее шрифт, тем чаще это слово встречается в именах звёзд. Например, Australis (Южная) — один из самых частых эпитетов в каталогах

Нейросети

[1] Для своей работы я использовала нейросеть Google Gemini, которая помогла мне проанализировать данные графиков, а также частично усовершенствовала код, когда у меня возникали ошибки, с которыми было сложно разобраться.

Ссылка на модель нейросети

post

Обложка сгенерирована при помощи нейросети Midjourney

Промпт: stars shedule Картинка фотостиля приложена к тексту

Анализ имён созвездий
Project created at 24.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more