Введение
В центре проекта стоит задача разобрать на понятные составляющие ценообразование мирового ювелирного рынка и составить объективный цифровой портрет драгоценных камней. Отправной точкой стал мой давний личный интерес к геммологии: я очень люблю разбираться в камнях, изучать их свойства, читать профессиональную литературу об их происхождении и внутренней структуре. При этом в массовой культуре бриллианты чаще всего окружены мифами, штампами и демонстративным потреблением, однако за их реальной стоимостью стоит строгая математическая модель. Мне стало любопытно, можно ли увидеть скрытые экономические закономерности и логику ценообразования через цифры и алгоритмы с помощью массива данных.
Я постараласьсобрать более широкий визуальный образ структуры мирового рынка драгоценных камней. Практическая ценность инфографики состоит в том, что она делает массив данных наглядным, помогая увидеть реальное распределение алмазного фонда.
Выбранный мной датасет с платформы Kaggle дает возможность детально рассмотреть физические свойства каждого минерала. Он содержит детальный аудит более 53 тысяч ювелирных алмазов по состоянию на 2022 год. Набор данных охватывает ключевые физические и коммерческие параметры каждого камня: вес в каратах, качество огранки, цвет, цену, геометрические размеры, а также степень чистоты.
Процесс создания
Итоговый проект был полностью реализован с помощью программирования на языке Python в среде разработки Google Colab. Способ визуализации выбирался в соответствии с объемом и типом информации, необходимой для исследования.
часть кода для визуализации графиков
Для начала я подготовила данные для удобства дальнейшей работы. На этапе обработки и анализа ключевым шагом стало внедрение международной системы геммологической классификации бриллиантов GIA (Геммологического института Америки). Без этой верификации первичные данные выглядели как хаотичный набор буквенных шифров. В рамках пайплайна была проведена расшифровка и логическое упорядочивание категорий.
Для параметра чистоты камня (clarity), определяющего наличие внутренних природных дефектов, была выстроена иерархия от худшего к лучшему:
- I1 (Included) — дефекты видны невооруженным глазом;
- SI2, SI1 (Slightly Included) — мелкие включения, заметные под лупой;
- VS2, VS1 (Very Slightly Included) — незначительные микродефекты;
- VVS2, VVS1 (Very Very Slightly Included) — мельчайшие, едва различимые включения;
- IF (Internally Flawless): абсолютно чистые, идеальные камни.
макет с модульной сеткой и итоговый плакат
Все полученные визуализации автоматически сохранялись в векторном формате SVG, который позволял изменять изображения без потери качества. Финальная верстка постера производились в графическом редакторе Figma. Для идеальной композиции я выстроила модульную сетку 20×12 и полями 70: сначала спроектировала макет с помощью серых полупрозрачных прямоугольников, а затем вписала в эти ячейки векторные элементы. Генеративный ИИ Gemini привлекался для создания логических текстовых связок и поиска дизайн-решения, а также для создания обложки.
Визуализации и их описание
Диаграмма рассеяния / Scatter Plot наглядно показывает зависимость стоимости от веса бриллианта. На графике присутствует репрезентативная выборка из 5000 камней образует экспоненциальную кривую. Так, при переходе к крупным фракциям цена резко взмывает вверх, что доказывает главный принцип геммологии: крупные алмазы встречаются в природе реже, из-за чего их ценность возрастает в геометрической прогрессии.
гистограмма и диаграмма рассеивания
Чтобы оценить степень влияния работы ювелира на итоговую цену, я использовала Гистограмму / Bar Plot. График отражает среднюю стоимость бриллиантов, сгруппированных по пяти официальным категориям качества огранки GIA: по мере роста мастерства обработки от удовлетворительной (Fair) до безупречной (Ideal) средняя цена демонстрирует стабильный прирост. Так, диаграмма визуализирует добавленную стоимость, которую создает мастер: геометрически правильная огранка заставляет свет идеально преломляться, превращая невзрачный природный камень в дорогостоящий бриллиант премиум-класса.
круговая диаграмма
Круговая диаграмма / Pie Chart помогает определить процентное соотношение идеальных и дефектных камней в общем обороте. Она демонстрирует долевое распределение всей совокупности датасета по шкале чистоты GIA: сегмент абсолютно безупречных бриллиантов без внутренних дефектов (IF) занимает ничтожно малую долю (около 3-4% рынка). В то же время ювелирная индустрия и массовый оборот удерживаются за счет «середняков» — категорий SI1 и VS2. Визуализация наглядно подтверждает редкость идеальных природных минералов и объясняет, почему основная экономика ювелирных брендов строится на компромиссе между чистотой камня и его доступностью для потребителя.
Постер в среде
Заключение
В результате визуального исследования были математически обоснованы ключевые законы ювелирного рынка: диаграмма рассеяния подтвердила экспоненциальный характер роста цены бриллианта в зависимости от его веса, гистограмма средних стоимостей наглядно продемонстрировала прямую зависимость ценности камня от мастерства огранки ювелира, а круговая диаграмма вскрыла анатомию дефицита. Итоговый проект наглядно доказывает, как инструменты науки о данных очищают индустрию роскоши от маркетинговых мифов, обнажая за внешней эстетикой драгоценных камней строгие законы экономики и природы.
Источники
Датасет — Цены на бриллианты
Блокнот — Драгоценные камни



