大数据可视化是计算机科学或深度学习新项目中十分特别的一环。一般,你需要在工程前期开展探究性的数据统计分析(EDA),进而对信息有一定的掌握,并且建立数据可视化的确能够使剖析的目的更清楚,更非常容易了解,尤其是针对规模性的高维空间数据。
蛛网图(Spider Plot)是表明一对多关联的**方案*。换来讲之,你能制作并查询好几个与某一自变量或类型相应的变量类型的值。在蛛网图上,一个自变量相对性于另一个自变量的显著性差异是清楚而突出的,由于在特殊的角度上,遮盖的范围和间距核心的长短越来越更高。假如你想看看运用这种自变量叙述的好多个不一样种类的目标有什么不一样,能够将他们并列制作。
在上面的图形中,大家非常容易较为复仇联盟的各种特性,并见到她们自身的优点所属!(一定要注意,这种数据信息是任意设定的,我对复仇联盟的组员们沒有成见。)
在这儿,我们可以同时应用「matplotlib」并非「seaborn」来建立数据可视化結果。大家*须 让每一个特性沿圆上定距遍布。大家将在4个边上设定标识,随后将值制作为一个点,它到核心的间距依赖于它的值/尺寸。最终,为了更好地表明更清楚,大家将应用透明色的色调来添充将特性点相互连接获得的弧线所围绕的地区。
# Import libs
import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
# Get the data
df=pd.read_csv("avengers_data.csv")
print(df)
"""
# Name Attack Defense Speed Range Health
0 1 Iron Man 83 80 75 70 70
1 2 Captain America 60 62 63 80 80
2 3 Thor 80 82 83 100 100
3 3 Hulk 80 100 67 44 92
4 4 Black Widow 52 43 60 50 65
5 5 Hawkeye 58 64 58 80 65
"""
# Get the data for Iron Man
labels=np.array(["Attack","Defense","Speed","Range","Health"])
stats=df.loc[0,labels].values
# Make some calculations for the plot
angles=np.linspace(0, 2*np.pi, len(labels), endpoint=False)
stats=np.concatenate((stats,[stats[0]]))
angles=np.concatenate((angles,[angles[0]]))
# Plot stuff
fig = plt.figure()
ax = fig.add_subplot(111, polar=True)
ax.plot(angles, stats, 'o-', linewidth=2)
ax.fill(angles, stats, alpha=0.25)
ax.set_thetagrids(angles * 180/np.pi, labels)
ax.set_title([df.loc[0,"Name"]])
ax.grid(True)
plt.show()
之上便是应用蛛网图完成Python大数据可视化的方式
免责协议:內容来自公布互联网,若涉及到侵权行为联络尽早删掉!