编辑:哈德利·维克汉姆指出我说错了。R CMD检查抛出NOTES,而不是警告。非常抱歉给您造成了混乱。这是我的疏忽。
简短的版本
每次在ggplot2中使用合理的绘图创建语法时,R CMD检查都会抛出以下提示:
no visible binding for global variable [variable name]
我理解为什么R CMD检查这样做,但它似乎是犯罪的整个脉络,否则明智的语法。我不确定要采取什么步骤来让我的包通过R CMD检查并进入CRAN。
背景
Sascha Epskamp之前也发表过类似的文章。我认为,区别在于子集()的manpage说它是为交互使用而设计的。
在我的例子中,问题不在于子集(),而是在于ggplot2的一个核心特性:data =参数。
我编写的生成这些注释的代码示例
下面是我的包中的子函数,它将点添加到一个plot中:
JitteredResponsesByContrast <- function (data) {
return(
geom_point(
aes(
x = x.values,
y = y.values
),
data = data,
position = position_jitter(height = 0, width = GetDegreeOfJitter(jj))
)
)
}
R CMD检查,在解析这段代码时,会说
granovagg.contr : JitteredResponsesByContrast: no visible binding for
global variable 'x.values'
granovagg.contr : JitteredResponsesByContrast: no visible binding for
global variable 'y.values'
为什么R CMD检查是正确的
这张支票在技术上是正确的。x值和y值
在函数JitteredResponsesByContrast()中没有局部定义 不是预先定义在x.values <- [something]的形式中,无论是全局的还是调用者的。
相反,它们是先前定义的数据帧中的变量,并传递给JitteredResponsesByContrast()函数。
为什么ggplot2很难安抚R CMD检查
Ggplot2似乎鼓励使用数据参数。data参数大概是执行这段代码的原因
library(ggplot2)
p <- ggplot(aes(x = hwy, y = cty), data = mpg)
p + geom_point()
但是这段代码将产生一个object-not-found错误:
library(ggplot2)
hwy # a variable in the mpg dataset
有两个变通办法,为什么我一个都不满意
排除策略
Matthew Dowle建议先将有问题的变量设置为NULL,在我的情况下看起来像这样:
JitteredResponsesByContrast <- function (data) {
x.values <- y.values <- NULL # Setting the variables to NULL first
return(
geom_point(
aes(
x = x.values,
y = y.values
),
data = data,
position = position_jitter(height = 0, width = GetDegreeOfJitter(jj))
)
)
}
我欣赏这个解决方案,但我不喜欢它有三个原因。
除了安抚R CMD检查之外,它没有其他用途。 它没有反映出意图。它提高了aes()调用将看到我们现在的null变量的期望(它不会),同时模糊了真正的目的(使R CMD检查意识到它显然不知道被绑定的变量) 1和2的问题是加倍的,因为每次编写返回plot元素的函数时,都必须添加一个令人困惑的NULLing语句
with()策略
可以使用with()显式地表示可以在更大的环境中找到相关变量。在我的例子中,使用with()看起来像这样:
JitteredResponsesByContrast <- function (data) {
with(data, {
geom_point(
aes(
x = x.values,
y = y.values
),
data = data,
position = position_jitter(height = 0, width = GetDegreeOfJitter(jj))
)
}
)
}
这个解决方案是可行的。但是,我不喜欢这个解决方案因为它甚至不像我期望的那样工作。如果with()真的解决了将解释器指向变量位置的问题,那么我甚至不需要data =参数。但是,with()不是这样工作的:
library(ggplot2)
p <- ggplot()
p <- p + with(mpg, geom_point(aes(x = hwy, y = cty)))
p # will generate an error saying `hwy` is not found
因此,我再次认为这个解决方案与NULLing策略有类似的缺陷:
我仍然必须遍历每个plot元素函数,并将逻辑封装在with()调用中 with()调用具有误导性。我仍然需要提供一个data =参数;所有with()正在做的是安抚R CMD检查。
结论
在我看来,我有三个选择:
游说CRAN忽略这些注释,理由是它们是“虚假的”(根据CRAN的政策),每次我提交一个包时都这样做 用两种不受欢迎的策略之一(NULLing或使用()块)修复代码 大声哼唱,希望问题消失
这三种方法都不能让我满意,我想知道人们建议我(以及其他想利用ggplot2的包开发人员)应该做什么。