我们必须导入数据集,计算变量的相关矩阵,然后使用 Seaborn 热图函数生成热图来构建相关热图。热图显示一个矩阵,其颜色表示变量之间的相关程度。此外,用户还可以在热图上显示相关系数。
Seaborn 相关热图是一种有效的可视化技术,用于检查数据集中的模式和关系,可用于查明关键变量以进行进一步调查。
import seaborn as snssns.heatmap(data, cmap=None, annot=None)
Example 1
在此示例中,我们使用 Python 创建一个 seaborn 相关热图。首先,我们导入seaborn和matplotlib库,并使用Seaborn的加载数据集函数加载iris数据集。该数据集包含 SepalLength、SepalWidth、PetalLength 和 PetalWidth 变量。鸢尾花数据集包括鸢尾花的萼片长度、萼片宽度、花瓣长度和花瓣宽度的测量值。这是信息的示例 -
序号 | sepal_length | sepal_width | 花瓣长度 | 花瓣宽度 | 物种 | |
0 | 5.1 | 3.5 | 的中文翻译为:3.5 | 1.4 | 0.2 | 丝滑 |
1 | 4.9 | 3.0 | 1.4 | 0.2 | 丝滑 | |
2 | 4.7 | 3.2 | 1.3 | 0.2 | 丝滑 | |
3 | 4.6 | 的翻译为:4.6 | 3.1 | 1.5 | 0.2 | 丝滑 |
4 | 5.0 | 翻译成中文为:5.0 | 3.6 | 1.4 | 0.2 | 丝滑 |
用户可以使用Seaborn的load dataset方法将鸢尾花数据集加载到Pandas DataFrame中。然后使用Pandas数据帧的corr方法计算变量的相关矩阵,并保存在一个名为corr_matrix的变量中。我们使用Seaborn的heatmap方法生成热力图。我们将相关矩阵corr_matrix传递给函数,并将cmap参数设置为"coolwarm"以使用不同的颜色表示正负相关。最后,我们使用matplotlib的pyplot模块的show方法显示热力图。
# Required libraries import seaborn as snsimport matplotlib.pyplot as plt# Load the iris dataset into a Pandas dataframeiris_data = sns.load_dataset('iris')# Creating the correlation matrix of the iris datasetiris_corr_matrix = iris_data.corr()print(iris_corr_matrix)# Create the heatmap using the `heatmap` function of Seabornsns.heatmap(iris_corr_matrix, cmap='coolwarm', annot=True)# Display the heatmap using the `show` method of the `pyplot` module from matplotlib.plt.show()
sepal_length sepal_width petal_length petal_widthsepal_length 1.000000 -0.117570 0.871754 0.817941sepal_width -0.117570 1.000000 -0.428440 -0.366126petal_length 0.871754 -0.428440 1.000000 0.962865petal_width 0.817941 -0.366126 0.962865 1.000000
示例 2
在这个示例中,我们再次使用Python创建一个seaborn相关性热图。首先,我们导入seaborn和matplotlib库,并使用Seaborn的load dataset函数加载钻石数据集。钻石数据集包括钻石的成本和特征的详细信息,包括它们的克拉重量、切割、颜色和净度。这是一个信息的例子 −
序号 | 克拉 | cut | 的中文翻译为:cut | 颜色 | 清晰度 | depth | 的中文翻译为:深度 | 表 | 价格 | x | y | z | |
0 | 0.23 | Ideal | 的翻译为:Ideal | E | SI2 | 61.5 | 55.0 | 翻译成中文为:55.0 | 326 | 3.95 | 的中文翻译为:3.95 | 3.98 | 2.43 |
1 | 0.21 | 高级版 | E | SI1 | 59.8 | 61.0 | 326 | 3.89 | 3.84 | 2.31 | |||
2 | 0.23 | 好 | E | VS1 | 56.9 | 65.0 | 327 | 4.05 | 4.07 | 2.31 | |||
3 | 0.29 | 高级版 | I | 的中文翻译为:I | VS2 | 62.4 | 的中文翻译为:62.4 | 58.0 | 334 | 4.20 | 4.23 | 2.63 | |
4 | 0.31 | 好 | J | SI2 | 63.3 | 58.0 | 335 | 4.34 | 4.35 | 2.75 | 的中文翻译为:2.75 |
可以使用 Seaborn 的加载数据集函数将钻石数据集加载到 Pandas DataFrame 中。接下来,使用 Pandas 数据帧的 corr 方法,计算变量的相关矩阵并将其存储在名为 Diamond_corr_matrix 的变量中。为了利用不同的颜色来表示与函数的正相关和负相关,我们传递相关矩阵 corr 矩阵并将 cmap 选项设置为“coolwarm”。最后,我们使用 matplotlib 的 show 方法中的 pyplot 模块来显示热图。
# Required libraries import seaborn as snsimport matplotlib.pyplot as plt# Load the diamond dataset into a Pandas dataframediamonds_data = sns.load_dataset('diamonds')# Compute the correlation matrix of the variablesdiamonds_corr_matrix = diamonds_data.corr()print(diamonds_corr_matrix)# Create the heatmap using the `heatmap` function of Seabornsns.heatmap(diamonds_corr_matrix, cmap='coolwarm', annot=True)# Display the heatmap using the `show` method of the `pyplot` module from matplotlib.plt.show()
carat depth table price x y zcarat 1.000000 0.028224 0.181618 0.921591 0.975094 0.951722 0.953387depth 0.028224 1.000000 -0.295779 -0.010647 -0.025289 -0.029341 0.094924table 0.181618 -0.295779 1.000000 0.127134 0.195344 0.183760 0.150929price 0.921591 -0.010647 0.127134 1.000000 0.884435 0.865421 0.861249x 0.975094 -0.025289 0.195344 0.884435 1.000000 0.974701 0.970772y 0.951722 -0.029341 0.183760 0.865421 0.974701 1.000000 0.952006z 0.953387 0.094924 0.150929 0.861249 0.970772 0.952006 1.000000
热图是一种有益的图形表示形式,seaborn 使其变得简单易用。