在散点图的pyplot文档中:

matplotlib.pyplot.scatter(x, y, s=20, c='b', marker='o', cmap=None, norm=None,
                          vmin=None, vmax=None, alpha=None, linewidths=None,
                          faceted=True, verts=None, hold=None, **kwargs)

标记笔大小

史: 大小单位是点^2。它是与x和y长度相同的标量或数组。

点的平方是什么单位?这是什么意思?s=100是否意味着10像素x 10像素?

基本上我是在尝试用不同的标记大小来制作散点图,我想要弄清楚s数的含义。


当前回答

如果圆的大小对应于s=parameter中参数的平方,则为附加到size数组中的每个元素赋一个平方根,例如:s=[1, 1.414, 1.73, 2.0, 2.24],这样当它获取这些值并返回它们时,它们的相对大小增加将是平方级数的平方根,这将返回一个线性级数。

如果我在输出到绘图时对每一个进行平方:output=[1,2,3,4,5]。尝试列表解释:s=[numpy.sqrt(i) for i in s]

其他回答

这可能是一种有点令人困惑的定义大小的方式,但你基本上是在指定标记的区域。这意味着,要将标记的宽度(或高度)增加一倍,您需要将s增加4倍。[因为A = WH => (2W)(2H)=4A]

然而,标记的大小是这样定义的,这是有原因的。由于面积的缩放是宽度的平方,宽度翻倍实际上会使大小增加2倍以上(实际上是4倍)。要了解这一点,请考虑以下两个示例及其产生的输出。

# doubling the width of markers
x = [0,2,4,6,8,10]
y = [0]*len(x)
s = [20*4**n for n in range(len(x))]
plt.scatter(x,y,s=s)
plt.show()

给了

注意它的大小增加得非常快。如果我们有

# doubling the area of markers
x = [0,2,4,6,8,10]
y = [0]*len(x)
s = [20*2**n for n in range(len(x))]
plt.scatter(x,y,s=s)
plt.show()

给了

现在,标记的表观大小以直观的方式大致线性地增加。

至于“点”的确切含义,对于绘图目的来说是相当随意的,你可以将所有大小按常数缩放,直到它们看起来合理为止。

编辑:(回复@Emma的评论)

我的措辞可能有点混乱。问题是圆的宽度翻倍在第一张图中每个圆的宽度都是前一张的两倍所以对于面积来说这是一个以4为底的指数。类似地,第二个例子中每个圆的面积是最后一个圆的两倍它给出了一个以2为底的指数。

然而,在第二个例子中(我们正在缩放面积),加倍的面积似乎使圆在眼睛看来是两倍大。因此,如果我们想让一个圆看起来大n倍,我们将增加一个n倍的面积,而不是增加半径,这样表面大小就与面积成线性关系。

编辑以可视化@TomaszGandor的评论:

这是不同功能的标记大小:

x = [0,2,4,6,8,10,12,14,16,18]
s_exp = [20*2**n for n in range(len(x))]
s_square = [20*n**2 for n in range(len(x))]
s_linear = [20*n for n in range(len(x))]
plt.scatter(x,[1]*len(x),s=s_exp, label='$s=2^n$', lw=1)
plt.scatter(x,[0]*len(x),s=s_square, label='$s=n^2$')
plt.scatter(x,[-1]*len(x),s=s_linear, label='$s=n$')
plt.ylim(-1.5,1.5)
plt.legend(loc='center left', bbox_to_anchor=(1.1, 0.5), labelspacing=3)
plt.show()

在plot方法中,可以使用markersize来指定圆的大小

import numpy as np
import matplotlib.pyplot as plt

x1 = np.random.randn(20)
x2 = np.random.randn(20)
plt.figure(1)
# you can specify the marker size two ways directly:
plt.plot(x1, 'bo', markersize=20)  # blue circle with size 10 
plt.plot(x2, 'ro', ms=10,)  # ms is just an alias for markersize
plt.show()

从这里

如果圆的大小对应于s=parameter中参数的平方,则为附加到size数组中的每个元素赋一个平方根,例如:s=[1, 1.414, 1.73, 2.0, 2.24],这样当它获取这些值并返回它们时,它们的相对大小增加将是平方级数的平方根,这将返回一个线性级数。

如果我在输出到绘图时对每一个进行平方:output=[1,2,3,4,5]。尝试列表解释:s=[numpy.sqrt(i) for i in s]

它是标记的面积。我的意思是,如果s1 = 1000 s2 = 4000,每个圆的半径之间的关系是:r_s2 = 2 * r_s1。请看下面的情节:

plt.scatter(2, 1, s=4000, c='r')
plt.scatter(2, 1, s=1000 ,c='b')
plt.scatter(2, 1, s=10, c='g')

当我看到这篇文章时,我也有同样的怀疑,所以我做了这个例子,然后我用屏幕上的尺子来测量半径。

为了达到这个目的,我最初也尝试使用“散射”。在浪费了相当多的时间后,我确定了以下解决方案。

import matplotlib.pyplot as plt
input_list = [{'x':100,'y':200,'radius':50, 'color':(0.1,0.2,0.3)}]    
output_list = []   
for point in input_list:
    output_list.append(plt.Circle((point['x'], point['y']), point['radius'], color=point['color'], fill=False))
ax = plt.gca(aspect='equal')
ax.cla()
ax.set_xlim((0, 1000))
ax.set_ylim((0, 1000))
for circle in output_list:    
   ax.add_artist(circle)

这是基于对这个问题的回答