Original size 1140x1600

Стоит ли надеяться на победу Новака Джоковича?

PROTECT STATUS: not protected
The project is taking part in the competition

Описание

В своём проекте я сосредоточилась на профессиональном мужском теннисе и его статистике за последние полтора десятилетия.

big
Original size 640x358

В качестве основы был использован датасет ATP Tennis Data , собранный с платформы Kaggle и охватывающий период с 2008 по 2022 год. Эти данные были самыми свежими из предложенных. Теннис тех лет имеет особую эстетику для меня, так как именно там собраны все культовые спортсмены этого вида спорта. В наборе данных представлены сведения о матчах, игроках, количестве побед, коэффициентах ставок, а также игровых характеристиках спортсменов.

Работа позволяет рассмотреть теннис как систему, в которой спортивные достижения, стабильность формы и вероятностные модели тесно переплетаются. Центральной фигурой исследования стал Новак Джокович — один из самых доминирующих игроков современного тенниса. Мне было интересно проследить, как менялось количество его побед со временем, какие игроки составляли ему конкуренцию, а также проверить, насколько рациональной могла бы быть стратегия ставок, основанная на его стабильных результатах.

Типы графиков в проекте

1. Горизонтальная столбчатая диаграмма 2. Линейный график с заливкой 3. Линейный график временного ряда с логарифмической шкалой 4. Точечная диаграмма 5. Круговая диаграмма

Обложка и фото по теме сгенерированы через recraft.ai

Мне стало интересно, как может видеть мою тему нейросеть и поэтому я решила воспользоваться recraft.ai, составив запрос:

«Create a modern tennis data visualization inspired by professional sports analytics, focused on performance and competition.»

0

Цветовая палитра

Работая над визуальным стилем проекта, я хотела передать ощущение спортивной динамики и эстетики тенниса. Основой палитры стали приглушённые оттенки, которые ассоциируются с кортами, теннисными мячами и визуальной эстетикой спортивной статистики. Чтобы собрать нужную цветовую палитру я использовала Adobe Color. Эти цвета используются в графиках и общем визуальном решении проекта.

В набор вошли эти цвета: #E7E5D7 #65AAC2 #ADBA5E #869A69 #000000

Шрифт в графиках — Inter.

Original size 2632x983

Горизонтальная столбчатая диаграмма

График 1

Первый график посвящён сравнению теннисистов с наибольшим количеством побед за период с 2008 по 2022 год. Диаграмма показывает разрыв между лидерами тура и остальными игроками. Визуализация помогает оценить масштаб доминирования отдельных спортсменов и увидеть, насколько стабильно они удерживали высокие позиции на протяжении многих сезонов. Исходя из данных, меня заинтересовал игрок первой строки Новак Джокович, так как у него самый сильный показатель из всех. Его карьера стала главным фактором в моем интересе к данному виду спорта, поэтому далее более детально рассмотрим его спортивные достижения.

Original size 5120x3260
0

Линейный график с заливкой

График 2

Во второй визуализации я сосредоточилась на динамике побед Новака Джоковича. График отражает изменение количества выигранных матчей по годам и показывает, что успех игрока не является равномерным, а формируется волнообразно — с периодами подъёма и относительного спада. Тем не менее общий тренд остаётся восходящим, что подчёркивает исключительную устойчивость его карьеры.

Original size 5120x3260
0

Линейный график временного ряда с логарифмической шкалой

График 3

Третий график моделирует гипотетическую ситуацию: что произошло бы, если бы ставки всегда делались на победу Джоковича. Здесь используется логарифмическая шкала, так как значения банка могут расти экспоненциально. Визуализация показывает чередование резких скачков и затяжных периодов стагнации, подчёркивая, что даже стратегия, основанная на сильном фаворите, остаётся зависимой от серий побед и поражений, а не гарантирует стабильный рост.

Original size 1280x815
0

Точечная диаграмма

График 4

Заключительный график посвящён анализу характеристик игроков, которым удавалось обыгрывать Новака Джоковича. На нём сопоставляются различные параметры матчей и соперников, что позволяет предположить, какие факторы могут играть ключевую роль в победе над одним из сильнейших теннисистов в истории. Анализ смещает фокус с абсолютных результатов на условия и контекст отдельных матчей.

Original size 1280x815
0

Круговая диаграмма

График 5

График показывает распределение побед Новака Джоковича в зависимости от типа покрытия. Наибольшая доля выигрышей приходится на хард — почти две трети всех побед, что подчёркивает его стабильность и универсальность на этом покрытии. Грунт занимает второе место, демонстрируя уверенные, но менее доминирующие результаты. На траве доля побед минимальна, что объясняется меньшим количеством турниров на этом типе покрытия по сравнению с остальными.
Original size 1280x815
0

Выводы по результатам исследования

Заключение

Проведённый анализ данных ATP показывает, что современный теннис — это не только соревнование физических и технических навыков, но и сложная система, в которой важную роль играют стабильность, стратегия и вероятностные закономерности. Сравнение количества побед ведущих игроков подчёркивает масштаб доминирования отдельных фигур, а динамика карьеры Новака Джоковича демонстрирует редкое сочетание высокой результативности и долгосрочной стабильности. Моделирование ставок на основе его побед наглядно показывает ограничения даже самых очевидных стратегий и напоминает о рисках, присущих любым вероятностным моделям.

Анализ характеристик соперников, в свою очередь, подчёркивает, что даже самые сильные игроки могут быть уязвимы при определённом сочетании игровых факторов.

Дополнительный анализ распределения побед Джоковича по типам покрытий показывает, что его наибольшая эффективность приходится на хард, где сосредоточена основная часть турниров и матчей. Более высокая доля побед на этом покрытии подчёркивает его универсальность и способность адаптироваться к разным игровым условиям, тогда как результаты на грунте и траве отражают как специфику покрытий, так и различия в количестве проводимых соревнований.

Мой проект демонстрирует, как визуализация данных может помочь глубже понять спортивные процессы, выявить скрытые паттерны и по-новому взглянуть на привычные статистические показатели профессионального спорта.

Original size 640x358

Описание применения генеративной модели и вспомогательных инструментов

1. Kaggle — Платформа была использована для поиска и загрузки датасета.

2. Google Colab — Весь процесс работы: обработка данных и визуализация.

3. Библиотеки Python kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте.

4. Цветовая палитра (Adobe Color)

5. recraft.ai — Использовала для генерации обложки и иллюстраций.

6. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.

7. Tenor — для выбора GIF