Пропустить до содержимого

Как использовать sankey diagram в Python?

[

Диаграмма Сэнки в Python

Введение

В этом руководстве мы рассмотрим, как создать диаграмму Сэнки в Python. Диаграмма Сэнки представляет собой графическую визуализацию потоков данных между различными категориями или узлами. Она особенно полезна для анализа потоков энергии, денежных средств или любых других типов данных, которые можно представить в виде потоков.

Установка необходимых библиотек

Прежде чем начать, убедитесь, что у вас установлены следующие библиотеки:

  • Matplotlib - библиотека для визуализации данных в Python.
  • Pandas - библиотека для анализа данных в Python.
  • Plotly - библиотека для создания интерактивных диаграмм и графиков в Python.
pip install matplotlib pandas plotly

Подготовка данных

Процесс создания диаграммы Сэнки включает подготовку данных в правильном формате. Данные должны быть представлены в виде таблицы с колонками, указывающими источник, цель и поток данных между ними. Ниже приведен пример такой таблицы:

ИсточникЦельПоток данных
Категория AКатегория B30
Категория AКатегория C50
Категория BКатегория C20
Категория CКатегория D10
Категория DКатегория B5

Создание диаграммы Сэнки

Импорт библиотек

import pandas as pd
import plotly.graph_objects as go

Загрузка данных

data = pd.read_csv('data.csv')

Создание диаграммы Сэнки

fig = go.Figure(data=[go.Sankey(
node = dict(
pad = 15,
thickness = 20,
line = dict(color = 'black', width = 0.5),
label = ['Категория A', 'Категория B', 'Категория C', 'Категория D'],
color = 'blue'
),
link = dict(
source = [0, 0, 1, 2, 3],
target = [1, 2, 2, 3, 1],
value = [30, 50, 20, 10, 5]
)
)])
fig.update_layout(title_text="Диаграмма Сэнки",
font_size=10)
fig.show()

Заключение

В этом руководстве мы рассмотрели, как создать диаграмму Сэнки в Python. Мы установили необходимые библиотеки, подготовили данные и создали визуализацию. Диаграмма Сэнки является мощным инструментом для анализа потоков данных и может применяться в различных областях, таких как энергетика, финансы и многое другое.

Если вы хотите узнать больше о возможностях Python для анализа данных и создания визуализаций, рекомендуется ознакомиться с дополнительными ресурсами и документацией по библиотекам, упомянутым в этом руководстве.