Python数据处理从零开始----第四章(可视化)(3)散点图和误差棒

目录

Python数据处理从零开始—-第四章(可视化)①Matplotlib包
Python数据处理从零开始—-第四章(可视化)②图形和轴
Python数据处理从零开始—-第四章(可视化)③散点图和误差棒
Python数据处理从零开始—-第四章(可视化)④误差图
Python数据处理从零开始—-第四章(可视化)⑤(韦恩图)
Python数据处理从零开始—-第四章(可视化)⑥(画布设置)
Python数据处理从零开始—-第四章(可视化)⑦(多图合并)
Python数据处理从零开始—-第四章(可视化)⑧火山图
Python数据处理从零开始—-第四章(可视化)⑨线性相关曲线
Python数据处理从零开始—-第四章(可视化)⑩ROC曲线

Python数据处理从零开始—-第四章(可视化)①①多分类ROC曲线

=========================================================

正文

散点图

本节开始介绍用plt.plot和ax.plot画散点图

# In[*]
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
# In[*]
x = np.linspace(0,10,30)
y = np.sin(x)
plt.plot(x,y,'o',color='black')

《Python数据处理从零开始----第四章(可视化)(3)散点图和误差棒》

第三个参数‘o’是代表散点图中散点的形状,可以修改。

rng = np.random.RandomState(1234)
for marker in ['o','.',',','x','+','v','^','<','>','s','d']:
    plt.plot(rng.rand(5),rng.rand(5),marker,
             label="marker'='{0}'".format(marker))
    plt.legend(numpoints=1)
    plt.xlim(0,1.8)

《Python数据处理从零开始----第四章(可视化)(3)散点图和误差棒》

可以拟合成一条曲线,其中’-ok‘中直线(-),圆圈(o),黑色(k)

rng = np.random.RandomState(1234)
for marker in ['o','.',',','x','+','v','^','<','>','s','d']:
    plt.plot(rng.rand(5),rng.rand(5),marker,
             label="marker'='{0}'".format(marker))
    plt.legend(numpoints=1)
    plt.xlim(0,1.8)
    plt.plot(x,y,'-ok')

《Python数据处理从零开始----第四章(可视化)(3)散点图和误差棒》

用plt.scatter画散点图

plt.scatter相对于plt.plot的主要优势在于,前者在创建散点图时具有更高的灵活性,可以单独控制每个散点与数据匹配,也可以让每个散点具有不同的属性(大小,表面颜色,边框颜色等)

rng = np.random.RandomState(1234)
x = rng.randn(100)
y  = rng.randn(100)
colors = rng.rand(100)
sizes = 1000*rng.rand(100)
plt.scatter(x,y,c=colors,s=sizes,alpha=0.3,cmap='viridis')
plt.colorbar()

《Python数据处理从零开始----第四章(可视化)(3)散点图和误差棒》

# In[*]
from sklearn.datasets import load_iris
iris = load_iris()
features = iris.data.T
plt.scatter(features[0],features[1],alpha=0.2,
            s=100*features[3],c=iris.target,cmap='viridis')
plt.xlabel(iris.feature_names[0])
plt.ylab(iris.feature_names[1])

《Python数据处理从零开始----第四章(可视化)(3)散点图和误差棒》

当面对大型数据集时,plt.plot会在效率方面优于plt.scatter,这是因为plt.scatter会对每一个单独的散点进行大小或者颜色的设置,而plt.plot是一次性复制所有的设置。

绘制基本误差线

%reset -f
%clear
# In[*]
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

# In[*]
plt.style.use('seaborn-whitegrid')
x = np.linspace(0,10,50)
dy = np.linspace(0,1,50)
y = np.sin(x) + dy*np.random.randn(50)
plt.errorbar(x,y,yerr=dy,fmt='.k')

《Python数据处理从零开始----第四章(可视化)(3)散点图和误差棒》

一般来说,误差棒的颜色最好比数据点的颜色稍浅一点比较好,尤其当你的数据点非常多时。

# In[*]
plt.style.use('seaborn-whitegrid')
x = np.linspace(0,10,50)
dy = np.linspace(0,1,50)
y = np.sin(x) + dy*np.random.randn(50)
plt.errorbar(x,y,yerr=dy,fmt='o',
             color='black',ecolor='gray',elinewidth=3,capsize=0)

《Python数据处理从零开始----第四章(可视化)(3)散点图和误差棒》

误差棒还有一些比较少用的参数,例如水平方向的误差线(xerr),单侧误差线(one-sidederrorbar)。

    原文作者:左手柳叶刀右手小鼠标
    原文地址: https://www.jianshu.com/p/714836563c39
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞