假设我有三个数据集:
X = [1,2,3,4]
Y1 = [4,8,12,16]
Y2 = [1,4,9,16]
我可以画散点图:
from matplotlib import pyplot as plt
plt.scatter(X,Y1,color='red')
plt.scatter(X,Y2,color='blue')
plt.show()
我怎么能有10组?
我搜索了这个,可以找到任何参考我的问题。
编辑:澄清(希望)我的问题
如果我多次调用scatter,我只能在每个scatter上设置相同的颜色。此外,我知道我可以手动设置颜色数组,但我相信有更好的方法来做到这一点。
然后我的问题是,“我如何自动地分散绘制我的几个数据集,每个数据集都有不同的颜色。
如果这有帮助,我可以轻松地为每个数据集分配一个唯一的数字。
对于大数据集和有限数量的颜色,一个更快的解决方案是使用Pandas和groupby函数:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import time
# a generic set of data with associated colors
nsamples=1000
x=np.random.uniform(0,10,nsamples)
y=np.random.uniform(0,10,nsamples)
colors={0:'r',1:'g',2:'b',3:'k'}
c=[colors[i] for i in np.round(np.random.uniform(0,3,nsamples),0)]
plt.close('all')
# "Fast" Scatter plotting
starttime=time.time()
# 1) make a dataframe
df=pd.DataFrame()
df['x']=x
df['y']=y
df['c']=c
plt.figure()
# 2) group the dataframe by color and loop
for g,b in df.groupby(by='c'):
plt.scatter(b['x'],b['y'],color=g)
print('Fast execution time:', time.time()-starttime)
# "Slow" Scatter plotting
starttime=time.time()
plt.figure()
# 2) group the dataframe by color and loop
for i in range(len(x)):
plt.scatter(x[i],y[i],color=c[i])
print('Slow execution time:', time.time()-starttime)
plt.show()
简单的解决方法
如果你只有一种类型的集合(例如,没有错误条的分散),你也可以在绘制完它们之后改变颜色,这有时更容易执行。
import matplotlib.pyplot as plt
from random import randint
import numpy as np
#Let's generate some random X, Y data X = [ [frst group],[second group] ...]
X = [ [randint(0,50) for i in range(0,5)] for i in range(0,24)]
Y = [ [randint(0,50) for i in range(0,5)] for i in range(0,24)]
labels = range(1,len(X)+1)
fig = plt.figure()
ax = fig.add_subplot(111)
for x,y,lab in zip(X,Y,labels):
ax.scatter(x,y,label=lab)
你需要的唯一一段代码是:
#Now this is actually the code that you need, an easy fix your colors just cut and paste not you need ax.
colormap = plt.cm.gist_ncar #nipy_spectral, Set1,Paired
colorst = [colormap(i) for i in np.linspace(0, 0.9,len(ax.collections))]
for t,j1 in enumerate(ax.collections):
j1.set_color(colorst[t])
ax.legend(fontsize='small')
即使在同一个子图中有许多不同的散点图,输出也会提供不同的颜色。
这个问题在2013年1月和matplotlib 1.3.1(2013年8月)之前有点棘手,这是你可以在matpplotlib网站上找到的最古老的稳定版本。但在那之后就很琐碎了。
因为当前版本的matplotlib.pylab.scatter支持赋值:颜色名称字符串数组,带有颜色映射的浮点数数组,RGB或RGBA数组。
这个答案献给@Oxinabox在2015年纠正2013年版本的我的无尽热情。
你有两个选择使用分散命令与多个颜色在一个单一的调用。
pylab。散射命令支持使用RGBA阵列做任何你想要的颜色;
回到2013年初,没有办法这样做,因为命令只支持单一颜色的整个散点集合。当我在做10000行的项目时,我想出了一个绕开它的通解。所以它很俗气,但我可以做任何形状、颜色、大小和透明的。这个技巧也可以应用于绘制路径集合,线条集合....
该代码还受到pyplot源代码的启发。我只是复制了scatter的功能,没有触发它来绘制。
pyplot命令。scatter返回一个PatchCollection对象,在“matplotlib/collections.py”文件中,一个Collection类中的私有变量_facecolors和一个方法set_facecolors。
所以当你要画散点时,你可以这样做:
# rgbaArr is a N*4 array of float numbers you know what I mean
# X is a N*2 array of coordinates
# axx is the axes object that current draw, you get it from
# axx = fig.gca()
# also import these, to recreate the within env of scatter command
import matplotlib.markers as mmarkers
import matplotlib.transforms as mtransforms
from matplotlib.collections import PatchCollection
import matplotlib.markers as mmarkers
import matplotlib.patches as mpatches
# define this function
# m is a string of scatter marker, it could be 'o', 's' etc..
# s is the size of the point, use 1.0
# dpi, get it from axx.figure.dpi
def addPatch_point(m, s, dpi):
marker_obj = mmarkers.MarkerStyle(m)
path = marker_obj.get_path()
trans = mtransforms.Affine2D().scale(np.sqrt(s*5)*dpi/72.0)
ptch = mpatches.PathPatch(path, fill = True, transform = trans)
return ptch
patches = []
# markerArr is an array of maker string, ['o', 's'. 'o'...]
# sizeArr is an array of size float, [1.0, 1.0. 0.5...]
for m, s in zip(markerArr, sizeArr):
patches.append(addPatch_point(m, s, axx.figure.dpi))
pclt = PatchCollection(
patches,
offsets = zip(X[:,0], X[:,1]),
transOffset = axx.transData)
pclt.set_transform(mtransforms.IdentityTransform())
pclt.set_edgecolors('none') # it's up to you
pclt._facecolors = rgbaArr
# in the end, when you decide to draw
axx.add_collection(pclt)
# and call axx's parent to draw_idle()