Original size 1296x1824

Статистический анализ и визуализация алмазного фонда по системе GIA

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

В центре проекта стоит задача разобрать на понятные составляющие ценообразование мирового ювелирного рынка и составить объективный цифровой портрет драгоценных камней. Отправной точкой стал мой давний личный интерес к геммологии: я очень люблю разбираться в камнях, изучать их свойства, читать профессиональную литературу об их происхождении и внутренней структуре. При этом в массовой культуре бриллианты чаще всего окружены мифами, штампами и демонстративным потреблением, однако за их реальной стоимостью стоит строгая математическая модель. Мне стало любопытно, можно ли увидеть скрытые экономические закономерности и логику ценообразования через цифры и алгоритмы с помощью массива данных.


Я постараласьсобрать более широкий визуальный образ структуры мирового рынка драгоценных камней. Практическая ценность инфографики состоит в том, что она делает массив данных наглядным, помогая увидеть реальное распределение алмазного фонда.

Выбранный мной датасет с платформы Kaggle дает возможность детально рассмотреть физические свойства каждого минерала. Он содержит детальный аудит более 53 тысяч ювелирных алмазов по состоянию на 2022 год. Набор данных охватывает ключевые физические и коммерческие параметры каждого камня: вес в каратах, качество огранки, цвет, цену, геометрические размеры, а также степень чистоты.

Процесс создания

Итоговый проект был полностью реализован с помощью программирования на языке Python в среде разработки Google Colab. Способ визуализации выбирался в соответствии с объемом и типом информации, необходимой для исследования.

Original size 817x443

часть кода для визуализации графиков

Для начала я подготовила данные для удобства дальнейшей работы. На этапе обработки и анализа ключевым шагом стало внедрение международной системы геммологической классификации бриллиантов GIA (Геммологического института Америки). Без этой верификации первичные данные выглядели как хаотичный набор буквенных шифров. В рамках пайплайна была проведена расшифровка и логическое упорядочивание категорий.

Для параметра чистоты камня (clarity), определяющего наличие внутренних природных дефектов, была выстроена иерархия от худшего к лучшему:

  • I1 (Included) — дефекты видны невооруженным глазом;
  • SI2, SI1 (Slightly Included) — мелкие включения, заметные под лупой;
  • VS2, VS1 (Very Slightly Included) — незначительные микродефекты;
  • VVS2, VVS1 (Very Very Slightly Included) — мельчайшие, едва различимые включения;
  • IF (Internally Flawless): абсолютно чистые, идеальные камни.
Аналогичный порядок от удовлетворительного до идеального был задан для огранки: Fair (Удовлетворительно) → Good (Хорошо) → Very Good (Очень хорошо) → Premium (Премиально) → Ideal (Идеально).

макет с модульной сеткой и итоговый плакат

Все полученные визуализации автоматически сохранялись в векторном формате SVG, который позволял изменять изображения без потери качества. Финальная верстка постера производились в графическом редакторе Figma. Для идеальной композиции я выстроила модульную сетку 20×12 и полями 70: сначала спроектировала макет с помощью серых полупрозрачных прямоугольников, а затем вписала в эти ячейки векторные элементы. Генеративный ИИ Gemini привлекался для создания логических текстовых связок и поиска дизайн-решения, а также для создания обложки.

Визуализации и их описание

Диаграмма рассеяния / Scatter Plot наглядно показывает зависимость стоимости от веса бриллианта. На графике присутствует репрезентативная выборка из 5000 камней образует экспоненциальную кривую. Так, при переходе к крупным фракциям цена резко взмывает вверх, что доказывает главный принцип геммологии: крупные алмазы встречаются в природе реже, из-за чего их ценность возрастает в геометрической прогрессии.

гистограмма и диаграмма рассеивания

Чтобы оценить степень влияния работы ювелира на итоговую цену, я использовала Гистограмму / Bar Plot. График отражает среднюю стоимость бриллиантов, сгруппированных по пяти официальным категориям качества огранки GIA: по мере роста мастерства обработки от удовлетворительной (Fair) до безупречной (Ideal) средняя цена демонстрирует стабильный прирост. Так, диаграмма визуализирует добавленную стоимость, которую создает мастер: геометрически правильная огранка заставляет свет идеально преломляться, превращая невзрачный природный камень в дорогостоящий бриллиант премиум-класса.

Original size 2361x1548

круговая диаграмма

Круговая диаграмма / Pie Chart 
помогает определить процентное соотношение идеальных и дефектных камней в общем обороте. Она демонстрирует долевое распределение всей совокупности датасета по шкале чистоты GIA: сегмент абсолютно безупречных бриллиантов без внутренних дефектов (IF) занимает ничтожно малую долю (около 3-4% рынка). В то же время ювелирная индустрия и массовый оборот удерживаются за счет «середняков» — категорий SI1 и VS2. Визуализация наглядно подтверждает редкость идеальных природных минералов и объясняет, почему основная экономика ювелирных брендов строится на компромиссе между чистотой камня и его доступностью для потребителя.

Постер в среде

Original size 2778x1550
Original size 2268x1624
Original size 4500x3000

Заключение

В результате визуального исследования были математически обоснованы ключевые законы ювелирного рынка: диаграмма рассеяния подтвердила экспоненциальный характер роста цены бриллианта в зависимости от его веса, гистограмма средних стоимостей наглядно продемонстрировала прямую зависимость ценности камня от мастерства огранки ювелира, а круговая диаграмма вскрыла анатомию дефицита. Итоговый проект наглядно доказывает, как инструменты науки о данных очищают индустрию роскоши от маркетинговых мифов, обнажая за внешней эстетикой драгоценных камней строгие законы экономики и природы.

Источники

Датасет
 — Цены на бриллианты

Блокнот
— Драгоценные камни

Статистический анализ и визуализация алмазного фонда по системе GIA
Project created at 18.06.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more