我要做一个柱状图,其中最大的柱状图离y轴最近,最短的柱状图离y轴最远。这有点像我的表格
Name Position
1 James Goalkeeper
2 Frank Goalkeeper
3 Jean Defense
4 Steve Defense
5 John Defense
6 Tim Striker
所以我试图建立一个条形图,根据位置显示球员的数量
p <- ggplot(theTable, aes(x = Position)) + geom_bar(binwidth = 1)
但是图表显示的是门将栏,然后是防守栏,最后是前锋栏。我希望图表的顺序是,防守条最靠近y轴,守门员条,最后是前锋条。
谢谢
由于我们只关注单个变量(“位置”)的分布,而不是两个变量之间的关系,那么直方图可能是更合适的图形。Ggplot有geom_histogram(),这使得它很容易:
ggplot(theTable, aes(x = Position)) + geom_histogram(stat="count")
使用geom_histogram ():
我认为geom_histogram()有点古怪,因为它对待连续数据和离散数据是不同的。
对于连续数据,可以只使用不带参数的geom_histogram()。
例如,如果我们添加一个数字向量“Score”……
Name Position Score
1 James Goalkeeper 10
2 Frank Goalkeeper 20
3 Jean Defense 10
4 Steve Defense 10
5 John Defense 20
6 Tim Striker 50
然后在“Score”变量上使用geom_histogram()…
ggplot(theTable, aes(x = Score)) + geom_histogram()
对于像“Position”这样的离散数据,我们必须指定一个由美学计算出来的统计数据,使用stat = "count"来给出条形高度的y值:
ggplot(theTable, aes(x = Position)) + geom_histogram(stat = "count")
注意:奇怪且令人困惑的是,你也可以使用stat = "count"来表示连续的数据,我认为它提供了一个更美观的图形。
ggplot(theTable, aes(x = Score)) + geom_histogram(stat = "count")
编辑:对DebanjanB的有用建议的扩展回答。
排序的关键是按照您想要的顺序设置因子的级别。不需要有序因子;一个有序因子中的额外信息是不必要的,如果这些数据被用于任何统计模型中,可能会导致错误的参数化——多项式对比不适用于这样的名义数据。
## set the levels in order we want
theTable <- within(theTable,
Position <- factor(Position,
levels=names(sort(table(Position),
decreasing=TRUE))))
## plot
ggplot(theTable,aes(x=Position))+geom_bar(binwidth=1)
在最一般的意义上,我们只需要将因子级别设置为所需的顺序。如果不指定,因子的级别将按字母顺序排序。您还可以如上所述在因子调用中指定级别顺序,也可以采用其他方法。
theTable$Position <- factor(theTable$Position, levels = c(...))
library(ggplot2)
library(magrittr)
dd <- tibble::tribble(
~Name, ~Position,
"James", "Goalkeeper",
"Frank", "Goalkeeper",
"Jean", "Defense",
"John", "Defense",
"Steve", "Defense",
"Tim", "Striker"
)
dd %>% ggplot(aes(x = forcats::fct_infreq(Position))) + geom_bar()
于2022-08-30使用reprex v2.0.2创建
你只需要指定Position列为一个有序因子,其中级别是按它们的计数排序的:
theTable <- transform( theTable,
Position = ordered(Position, levels = names( sort(-table(Position)))))
(请注意,表(Position)产生了Position列的频率计数。)
然后,您的ggplot函数将以计数递减的顺序显示条形图。
我不知道在geom_bar中是否有一个选项可以在不显式地创建有序因子的情况下做到这一点。