
Описание
В своём проекте я сосредоточилась на профессиональном мужском теннисе и его статистике за последние полтора десятилетия.

В качестве основы был использован датасет ATP Tennis Data , собранный с платформы Kaggle и охватывающий период с 2008 по 2022 год. Эти данные были самыми свежими из предложенных. Теннис тех лет имеет особую эстетику для меня, так как именно там собраны все культовые спортсмены этого вида спорта. В наборе данных представлены сведения о матчах, игроках, количестве побед, коэффициентах ставок, а также игровых характеристиках спортсменов.
Работа позволяет рассмотреть теннис как систему, в которой спортивные достижения, стабильность формы и вероятностные модели тесно переплетаются. Центральной фигурой исследования стал Новак Джокович — один из самых доминирующих игроков современного тенниса. Мне было интересно проследить, как менялось количество его побед со временем, какие игроки составляли ему конкуренцию, а также проверить, насколько рациональной могла бы быть стратегия ставок, основанная на его стабильных результатах.
Типы графиков в проекте
1. Горизонтальная столбчатая диаграмма 2. Линейный график с заливкой 3. Линейный график временного ряда с логарифмической шкалой 4. Точечная диаграмма 5. Круговая диаграмма
Обложка и фото по теме сгенерированы через recraft.ai
Мне стало интересно, как может видеть мою тему нейросеть и поэтому я решила воспользоваться recraft.ai, составив запрос:
«Create a modern tennis data visualization inspired by professional sports analytics, focused on performance and competition.»
Цветовая палитра
Работая над визуальным стилем проекта, я хотела передать ощущение спортивной динамики и эстетики тенниса. Основой палитры стали приглушённые оттенки, которые ассоциируются с кортами, теннисными мячами и визуальной эстетикой спортивной статистики. Чтобы собрать нужную цветовую палитру я использовала Adobe Color. Эти цвета используются в графиках и общем визуальном решении проекта.
В набор вошли эти цвета: #E7E5D7 #65AAC2 #ADBA5E #869A69 #000000
Шрифт в графиках — Inter.
Горизонтальная столбчатая диаграмма
Первый график посвящён сравнению теннисистов с наибольшим количеством побед за период с 2008 по 2022 год. Диаграмма показывает разрыв между лидерами тура и остальными игроками. Визуализация помогает оценить масштаб доминирования отдельных спортсменов и увидеть, насколько стабильно они удерживали высокие позиции на протяжении многих сезонов. Исходя из данных, меня заинтересовал игрок первой строки Новак Джокович, так как у него самый сильный показатель из всех. Его карьера стала главным фактором в моем интересе к данному виду спорта, поэтому далее более детально рассмотрим его спортивные достижения.
Линейный график с заливкой
Во второй визуализации я сосредоточилась на динамике побед Новака Джоковича. График отражает изменение количества выигранных матчей по годам и показывает, что успех игрока не является равномерным, а формируется волнообразно — с периодами подъёма и относительного спада. Тем не менее общий тренд остаётся восходящим, что подчёркивает исключительную устойчивость его карьеры.
Линейный график временного ряда с логарифмической шкалой
Третий график моделирует гипотетическую ситуацию: что произошло бы, если бы ставки всегда делались на победу Джоковича. Здесь используется логарифмическая шкала, так как значения банка могут расти экспоненциально. Визуализация показывает чередование резких скачков и затяжных периодов стагнации, подчёркивая, что даже стратегия, основанная на сильном фаворите, остаётся зависимой от серий побед и поражений, а не гарантирует стабильный рост.
Точечная диаграмма
Заключительный график посвящён анализу характеристик игроков, которым удавалось обыгрывать Новака Джоковича. На нём сопоставляются различные параметры матчей и соперников, что позволяет предположить, какие факторы могут играть ключевую роль в победе над одним из сильнейших теннисистов в истории. Анализ смещает фокус с абсолютных результатов на условия и контекст отдельных матчей.
Круговая диаграмма
Выводы по результатам исследования
Проведённый анализ данных ATP показывает, что современный теннис — это не только соревнование физических и технических навыков, но и сложная система, в которой важную роль играют стабильность, стратегия и вероятностные закономерности. Сравнение количества побед ведущих игроков подчёркивает масштаб доминирования отдельных фигур, а динамика карьеры Новака Джоковича демонстрирует редкое сочетание высокой результативности и долгосрочной стабильности. Моделирование ставок на основе его побед наглядно показывает ограничения даже самых очевидных стратегий и напоминает о рисках, присущих любым вероятностным моделям.
Анализ характеристик соперников, в свою очередь, подчёркивает, что даже самые сильные игроки могут быть уязвимы при определённом сочетании игровых факторов.
Дополнительный анализ распределения побед Джоковича по типам покрытий показывает, что его наибольшая эффективность приходится на хард, где сосредоточена основная часть турниров и матчей. Более высокая доля побед на этом покрытии подчёркивает его универсальность и способность адаптироваться к разным игровым условиям, тогда как результаты на грунте и траве отражают как специфику покрытий, так и различия в количестве проводимых соревнований.
Мой проект демонстрирует, как визуализация данных может помочь глубже понять спортивные процессы, выявить скрытые паттерны и по-новому взглянуть на привычные статистические показатели профессионального спорта.
1. Kaggle — Платформа была использована для поиска и загрузки датасета.
2. Google Colab — Весь процесс работы: обработка данных и визуализация.
3. Библиотеки Python kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте.
4. Цветовая палитра (Adobe Color)
5. recraft.ai — Использовала для генерации обложки и иллюстраций.
6. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.
7. Tenor — для выбора GIF