
В этом проекте я проанализировала датасет с различной информацией о популярных южнокорейских сериалах XXI века (далее «дорамах»). В настоящее время существуют тысячи Дорам, однако далеко не все они полюбились зрителю. Как же тогда создать потенциально успешный проект? Этот вопрос я решила взять на себя, обратив внимание на такую информацию об уже популярных дорамах, как количество просмотров, год выхода, число серий, теги, каст.
Оформление

Мудборд
Несмотря на тот факт, что к дорамам, в целом, относится огромное количество различных жанров, начиная от комедии и заканчивая ужасами, огромную часть на данным рынке занимают именно романтические сериалы. Именно поэтому для оформления данного анализа была подобрана эстетика нежной и романтизированной Южной Кореи.

Цветовая палитра
Шрифт для оформления графиков подбирался исходя из нежного и меланхоличного настроение большинства сериалов.

Шрифт
Основная информация
За поиском датасета для выполнения данного проекта я обратилась к сайту Kaggle.com, предоставляющий различную информацию (в том числе и интересную) в области data science и анализа данных.
Выбранный мною датасет «100 Most Popular K-Dramas/Korean Dramas at 2025» предоставляет информацию о сотне самых популярных дорам и сравнивает их данные по следующим показателям: год выхода, рейтинг, число зрителей, количество и длина эпизодов, день выхода серий в Корее, теги, главные актеры.
Как упоминалось ранее, для моего анализа использовались такие данные, как: год выхода, число зрителей, количество серий, теги, главные актеры.
Проанализированые данные представлены в виде различных видов графиков для более наглядной демонстрации различных видов информации. В проекте присутствую столбчатые, круговые, линейные и точечные диаграммы.
Использование библиотек
В коде задействованы пять различных библиотек, использование которых направлена на визуализацию данных, а также их стилизацию. Так, numpy отвечает за работу с числами и массивам, pandas за обработку данных и анализ таблицы, matplotlib.pyplot строит графики и диаграммы, matplotlib.font_manager работает со шрифтами и matplotlib.patches создает дополнительные элементы.
Помимо этого, в коде уделено особое внимание красивому оформлению информации с помощью упомянутых цветов и шрифта.
Также я отдельно задавала размеры заголовков и подписей, угол их поворота и цвет фона у графиков.
В отдельных графиках оформление может слегка отличаться или иметь такие дополнительны элементы (и, соотвественно, команды для их оформления), как линии, сектора или точки. Однако, в любом случае, все графики и диаграммы, представленные в проекте, выдержаны в едином стиле.
Визуализация
В первой диаграмме, столбчатой, были проиллюстрированы 20 самы популярных Дорам из 100 представленных. Популярность сериалов определялась числом пользователей, посмотревших их. Для создания графика были проанализированы такие столбцы таблицы, как Name и Watchers.
Как видно на графике, значительно преобладают над другими в популярности только 2 дорамы, имея ± 250 тыс. посмотревших их пользователей. Далее просмотры плавно снижаются, что говорит о равно распределенном интересе у пользователей. Интересно, что всеми известная «Игра в Кальмара» находится лишь на 17 месте!
Во второй диаграмме, круговой, были рассмотри 5 самых распространенных вариантов количества серий в дорамах. Для графика были проанализированы такие данные, как Episodes.
Как видно, самый распространенный вариант — 16 серий, что явно является самым оптимальным вариантом. К примеру, 8 или 32 серии значительно менее популярны.
В третьем графике, точечном, я отобразила распространенность различных жанров среди всех 100 дорам из списка. Для создания диаграммы использовались такие данные, как Name и Genres.
Как очень четко видно из графика, самыми популярными жанрами являются романтика, комедия и драма. В то время, как музыка, еда и медицина почти не распространены. Если кто-то хочет создать новый шедевр кинематографа, который примет публика, явно лучше не смотреть в сторону последних жанров.
На четвертом графике, линейном, проиллюстрировано количество популярных дорам, выпускаемых в определенные года. Для создания графика были проанализированы данные Year.
Опять же, очень хорошо видно, что больше всего популярных дорам выходило в 2016 и 2020 году. Интересно, что после 2020 не очень большое количество популярных сериалов находятся в общем списке из 100 Дорам. При том, что среди людей распространено мнение об улучшении качества контента с ходом времени, т. е. чем новее, тем лучше.
Последний график, точечный, показывает взаимосвязь между количеством пользователей, посмотревших дораму и кастом. Рассмотрены не все актеры, упомянутые в таблице, а лишь 30 самых популярных. Также стоит обратить внимание на размер точек в диаграмме, чем она больше, тем в большем количеств сериалов, упомянутых в таблице снимался актер/актриса. Для анализа были взяты данные Main Actors и Watchers.
Самое большое количество просмотров имеют дорамы, в которых снимались Yoo In Na и Lee Dong Wook. Однако в большем количестве довольно популярных дорам снимался актер Park Seo Jong.
Вывод
Итак, как же создать новый южнокорейский шедевр?
Дорама обязательно должна иметь такие жанры, как романтика, драма и комедия. Допускаются еще варианты фантастики, повседневности и триллера, но первые варианты надежнее!
Предпочтительно расписать сюжет на 16 серий. Ни больше, ни меньше!
Явно стает хитом дорама со звездным дуэтом, состоящим из Yoo In Na и Lee Dong Wook. Если на последнего не хватит бюджета, то можно попробовать заменить его на Park Seo Jong.
Желательно каким-то образом оказаться в 2016 или 2020 году для релиза нового хита)