在R中赋值运算符=和<-之间有什么区别?

我知道操作符略有不同,如本例所示

x <- y <- 5
x = y = 5
x = y <- 5
x <- y = 5
# Error in (x <- y) = 5 : could not find function "<-<-"

但这是唯一的不同吗?


当前回答

这也有助于理解这两个操作符之间的区别:

df <- data.frame(
      a = rnorm(10),
      b <- rnorm(10)
)

对于第一个元素R有赋值和专有名称,而第二个元素的名称看起来有点奇怪。

str(df)
# 'data.frame': 10 obs. of  2 variables:
#  $ a             : num  0.6393 1.125 -1.2514 0.0729 -1.3292 ...
#  $ b....rnorm.10.: num  0.2485 0.0391 -1.6532 -0.3366 1.1951 ...

R版本3.3.2 (2016-10-31);macOS Sierra 10.12.1

其他回答

根据John Chambers的说法,操作符=只允许在“顶层”,这意味着它不允许在像if这样的控制结构中,这使得下面的编程错误是非法的。

> if(x = 0) 1 else x
Error: syntax error

正如他所写的,“在控制表达式中禁止新的赋值形式[=]可以避免编程错误(如上面的例子),与其他S赋值相比,相等操作符更有可能出现这种错误。”

如果它“通过大括号或一对额外的圆括号与周围的逻辑结构隔离”,则可以做到这一点,因此if ((x = 0)) 1否则x就可以工作。

参见http://developer.r-project.org/equalAssign.html

来自官方R文档:

操作符<-和=赋值到它们所处的环境 进行了评估。操作符<-可以在任何地方使用,而 操作符=只允许在顶层(例如,在 在命令提示符处键入的完整表达式)或作为 带括号的表达式列表中的子表达式。

X = y = 5等价于X = (y = 5),因为赋值操作符从右向左“分组”,这是可行的。含义:将5赋给y,保留数字5;然后把5赋值给x。

这和(x = y) = 5不一样,不成立!含义:将y的值赋给x,保留y的值;然后把5赋给,嗯…,到底是什么?

当混合使用不同类型的赋值操作符时,<-比=绑定得更紧。所以x = y <- 5可以解释为x = (y <- 5)这样就说得通了。

不幸的是,x <- y = 5被解释为(x <- y) = 5,这种情况是行不通的!

有关优先级(绑定)和分组规则,请参阅?Syntax和?assignOps。

这也有助于理解这两个操作符之间的区别:

df <- data.frame(
      a = rnorm(10),
      b <- rnorm(10)
)

对于第一个元素R有赋值和专有名称,而第二个元素的名称看起来有点奇怪。

str(df)
# 'data.frame': 10 obs. of  2 variables:
#  $ a             : num  0.6393 1.125 -1.2514 0.0729 -1.3292 ...
#  $ b....rnorm.10.: num  0.2485 0.0391 -1.6532 -0.3366 1.1951 ...

R版本3.3.2 (2016-10-31);macOS Sierra 10.12.1

在函数调用中使用赋值操作符来设置实参值时,赋值操作符之间的区别更加明显。例如:

median(x = 1:10)
x   
## Error: object 'x' not found

在本例中,x是在函数的作用域内声明的,因此它不存在于用户工作区中。

median(x <- 1:10)
x    
## [1]  1  2  3  4  5  6  7  8  9 10

在本例中,x是在用户工作区中声明的,因此可以在函数调用完成后使用它。


为了兼容(非常)老版本的S-Plus, R社区普遍倾向于使用<-进行赋值(函数签名除外)。注意,空格有助于阐明情况,如

x<-3
# Does this mean assignment?
x <- 3
# Or less than?
x < -3

大多数R ide都有快捷键,使<-更容易输入。Architect中的Ctrl + =, RStudio中的Alt + - (macOS下的Option + -), emacs+ESS中的Shift + -(下划线)。


如果你更喜欢写=而不是<-,但想要为公开发布的代码(例如在CRAN上)使用更常见的赋值符号,那么你可以使用formatR包中的tidy_*函数之一自动将=替换为<-。

library(formatR)
tidy_source(text = "x=1:5", arrow = TRUE)
## x <- 1:5

对于“为什么x <- y = 5抛出错误而x <- y <- 5没有抛出错误?”这个问题的答案是“这取决于解析器中包含的魔法”。R的语法包含许多必须以某种方式解决的模糊情况。解析器根据是否使用=或<-来选择以不同的顺序解析表达式的位。

为了理解发生了什么,您需要知道赋值函数会默默地返回被赋值的值。通过显式打印可以更清楚地看到这一点,例如print(x <- 2 + 3)。

其次,如果我们使用前缀表示法进行赋值,会更清楚。所以

x <- 5
`<-`(x, 5)  #same thing

y = 5
`=`(y, 5)   #also the same thing

解析器将x <- y <- 5解释为

`<-`(x, `<-`(y, 5))

我们可以期望x <- y = 5

`<-`(x, `=`(y, 5))

但实际上它被解释为

`=`(`<-`(x, y), 5)

这是因为=的优先级低于<-,请参见?语法帮助页面。