还在试着进入R逻辑…什么是解包(在LHS上)一个函数返回多个值的结果的“最佳”方法?
显然我不能这么做:
R> functionReturningTwoValues <- function() { return(c(1, 2)) }
R> functionReturningTwoValues()
[1] 1 2
R> a, b <- functionReturningTwoValues()
Error: unexpected ',' in "a,"
R> c(a, b) <- functionReturningTwoValues()
Error in c(a, b) <- functionReturningTwoValues() : object 'a' not found
我真的必须做以下事情吗?
R> r <- functionReturningTwoValues()
R> a <- r[1]; b <- r[2]
或者R程序员会这样写:
R> functionReturningTwoValues <- function() {return(list(first=1, second=2))}
R> r <- functionReturningTwoValues()
R> r$first
[1] 1
R> r$second
[1] 2
——被编辑来回答谢恩的问题——
我真的不需要给结果值部分命名。我将一个聚合函数应用于第一个组件,另一个应用于第二个组件(最小值和最大值)。如果这两个组件是相同的函数,我就不需要拆分它们了)。
我组装了一个R包热机来解决这个问题。Zeallot包含一个多重赋值或解包赋值操作符%<-%。运算符的LHS是要赋值的任意数量的变量,通过调用c()构建。操作符的RHS是一个向量、列表、数据帧、日期对象或任何具有已实现的解构方法的自定义对象(参见?zeallot::destructure)。
以下是一些基于原始帖子的例子,
library(zeallot)
functionReturningTwoValues <- function() {
return(c(1, 2))
}
c(a, b) %<-% functionReturningTwoValues()
a # 1
b # 2
functionReturningListOfValues <- function() {
return(list(1, 2, 3))
}
c(d, e, f) %<-% functionReturningListOfValues()
d # 1
e # 2
f # 3
functionReturningNestedList <- function() {
return(list(1, list(2, 3)))
}
c(f, c(g, h)) %<-% functionReturningNestedList()
f # 1
g # 2
h # 3
functionReturningTooManyValues <- function() {
return(as.list(1:20))
}
c(i, j, ...rest) %<-% functionReturningTooManyValues()
i # 1
j # 2
rest # list(3, 4, 5, ..)
有关更多信息和示例,请查看软件包插图。
如果你想将函数的输出返回给全局环境,你可以使用list2env,如下例所示:
myfun <- function(x) { a <- 1:x
b <- 5:x
df <- data.frame(a=a, b=b)
newList <- list("my_obj1" = a, "my_obj2" = b, "myDF"=df)
list2env(newList ,.GlobalEnv)
}
myfun(3)
这个函数将在全局环境中创建三个对象:
> my_obj1
[1] 1 2 3
> my_obj2
[1] 5 4 3
> myDF
a b
1 1 5
2 2 4
3 3 3
我将发布一个函数,以向量的方式返回多个对象:
Median <- function(X){
X_Sort <- sort(X)
if (length(X)%%2==0){
Median <- (X_Sort[(length(X)/2)]+X_Sort[(length(X)/2)+1])/2
} else{
Median <- X_Sort[(length(X)+1)/2]
}
return(Median)
}
这是我用来计算中位数的函数。我知道R中有一个内置函数叫做median(),但尽管如此,我还是编写了它来构建其他函数,通过使用我刚刚编写的median()函数来计算数值数据集的四分位数。Median()函数是这样工作的:
如果数值向量X有偶数个元素(即length(X)%%2==0),则通过将元素sort(X)[length(X)/2]和sort(X)[(length(X)/2+1)]求平均值来计算中位数。
如果X没有偶数个元素,则中位数为sort(X)[(length(X)+1)/2]。
关于QuartilesFunction():
QuartilesFunction <- function(X){
X_Sort <- sort(X) # Data is sorted in ascending order
if (length(X)%%2==0){
# Data number is even
HalfDN <- X_Sort[1:(length(X)/2)]
HalfUP <- X_Sort[((length(X)/2)+1):length(X)]
QL <- Median(HalfDN)
QU <- Median(HalfUP)
QL1 <- QL
QL2 <- QL
QU1 <- QU
QU2 <- QU
QL3 <- QL
QU3 <- QU
Quartiles <- c(QL1,QU1,QL2,QU2,QL3,QU3)
names(Quartiles) = c("QL (1)", "QU (1)", "QL (2)", "QU (2)","QL (3)", "QU (3)")
} else{ # Data number is odd
# Including the median
Half1DN <- X_Sort[1:((length(X)+1)/2)]
Half1UP <- X_Sort[(((length(X)+1)/2)):length(X)]
QL1 <- Median(Half1DN)
QU1 <- Median(Half1UP)
# Not including the median
Half2DN <- X_Sort[1:(((length(X)+1)/2)-1)]
Half2UP <- X_Sort[(((length(X)+1)/2)+1):length(X)]
QL2 <- Median(Half2DN)
QU2 <- Median(Half2UP)
# Methods (1) and (2) averaged
QL3 <- (QL1+QL2)/2
QU3 <- (QU1+QU2)/2
Quartiles <- c(QL1,QU1,QL2,QU2,QL3,QU3)
names(Quartiles) = c("QL (1)", "QU (1)", "QL (2)", "QU (2)","QL (3)", "QU (3)")
}
return(Quartiles)
}
该函数通过以下三种方法返回数值向量的四分位数:
当数值向量x的元素数为奇数时,丢弃计算四分位数的中位数。
当数值向量x的元素个数为奇数时,保持四分位数计算的中位数。
对方法1和方法2得到的结果求平均值。
当数字向量X的元素个数为偶数时,三种方法重合。
QuartilesFunction()的结果是一个向量,它描述了使用上述三种方法计算出的第一和第三个四分位数。
(一)
如果foo和bar都是一个数字,那么c(foo,bar)没有问题;你也可以命名这些组件:c(Foo= Foo,Bar= Bar)。所以你可以访问结果res的组件res[1] res[2];或在命名的情况下,如res["Foo"], res["BAR"]。
[B]
如果foo和bar是相同类型和长度的向量,那么返回cbind(foo,bar)或rbind(foo,bar)也没有问题;同样值得注意的。在'cbind'情况下,您将访问foo和bar为res[,1], res[,2]或res[," foo "], res[," bar "]。你可能更喜欢返回一个数据框架而不是一个矩阵:
data.frame(Foo=foo,Bar=bar)
并访问它们为res$Foo res$Bar如果foo和bar的长度相同但类型不同(例如,foo是一个数字向量,bar是一个字符串向量),这也可以很好地工作。
[C]
如果foo和bar完全不同,不能像上面那样方便地组合,那么你肯定应该返回一个列表。
例如,你的函数可能适合线性模型
还要计算预测值,这样你就可以
LM<-lm(....) ; foo<-summary(LM); bar<-LM$fit
然后你会返回list(Foo= Foo, Bar= Bar),然后访问摘要res$Foo,预测值res$Bar
来源:http://r.789695.n4.nabble.com/How-to-return-multiple-values-in-a-function-td858528.html