我有一个R脚本,我希望能够提供几个命令行参数(而不是在代码本身硬编码参数值)。该脚本运行在Windows系统上。

我找不到关于如何将命令行上提供的参数读到我的R脚本的信息。如果这不能做到,我会感到惊讶,所以也许我只是没有在我的谷歌搜索中使用最好的关键字…

有什么建议吗?


当前回答

你需要little(发音为'little r')

Dirk将在大约15分钟后来详细说明;)

其他回答

由于optparse在回答中已经提到过几次,并且它为命令行处理提供了一个全面的工具包,这里有一个简短的简化示例,说明如何使用它,假设输入文件存在:

脚本。接待员:

library(optparse)

option_list <- list(
  make_option(c("-n", "--count_lines"), action="store_true", default=FALSE,
    help="Count the line numbers [default]"),
  make_option(c("-f", "--factor"), type="integer", default=3,
    help="Multiply output by this number [default %default]")
)

parser <- OptionParser(usage="%prog [options] file", option_list=option_list)

args <- parse_args(parser, positional_arguments = 1)
opt <- args$options
file <- args$args

if(opt$count_lines) {
  print(paste(length(readLines(file)) * opt$factor))
}

给定任意文件blah.txt,有23行。

在命令行中:

Rscript脚本。R -h输出

Usage: script.R [options] file


Options:
        -n, --count_lines
                Count the line numbers [default]

        -f FACTOR, --factor=FACTOR
                Multiply output by this number [default 3]

        -h, --help
                Show this help message and exit

Rscript脚本。R -n blah.txt输出[1]"69"

Rscript脚本。R -n -f 5 blah.txt输出[1]"115"

在bash中,您可以构造如下所示的命令行:

$ z=10
$ echo $z
10
$ Rscript -e "args<-commandArgs(TRUE);x=args[1]:args[2];x;mean(x);sd(x)" 1 $z
 [1]  1  2  3  4  5  6  7  8  9 10
[1] 5.5
[1] 3.027650
$

你可以看到变量$z被bash shell替换为“10”,这个值被commandArgs取走并输入args[2],范围命令x=1:10被R成功执行,等等。

我只是把一个漂亮的数据结构和处理链放在一起来生成这种切换行为,不需要库。我相信它已经被实现过无数次了,并且在这个帖子中寻找例子-我想我应该分享一下。

我甚至不需要特别的标志(这里唯一的标志是调试模式,创建一个变量,我检查作为启动下游函数的条件,如果(!exists(debug.mode)){…} else {print(variables)})。下面的标志检查lapply语句产生的结果与:

if ("--debug" %in% args) debug.mode <- T
if ("-h" %in% args || "--help" %in% args) 

其中args是从命令行参数中读入的变量(一个字符向量,相当于c('——debug','——help'),例如当你提供这些时)

它可用于任何其他标志,你避免了所有的重复,没有库,所以没有依赖:

args <- commandArgs(TRUE)

flag.details <- list(
"debug" = list(
  def = "Print variables rather than executing function XYZ...",
  flag = "--debug",
  output = "debug.mode <- T"),
"help" = list(
  def = "Display flag definitions",
  flag = c("-h","--help"),
  output = "cat(help.prompt)") )

flag.conditions <- lapply(flag.details, function(x) {
  paste0(paste0('"',x$flag,'"'), sep = " %in% args", collapse = " || ")
})
flag.truth.table <- unlist(lapply(flag.conditions, function(x) {
  if (eval(parse(text = x))) {
    return(T)
  } else return(F)
}))

help.prompts <- lapply(names(flag.truth.table), function(x){
# joins 2-space-separatated flags with a tab-space to the flag description
  paste0(c(paste0(flag.details[x][[1]][['flag']], collapse="  "),
  flag.details[x][[1]][['def']]), collapse="\t")
} )

help.prompt <- paste(c(unlist(help.prompts),''),collapse="\n\n")

# The following lines handle the flags, running the corresponding 'output' entry in flag.details for any supplied
flag.output <- unlist(lapply(names(flag.truth.table), function(x){
  if (flag.truth.table[x]) return(flag.details[x][[1]][['output']])
}))
eval(parse(text = flag.output))

注意,在flag.details中,命令被存储为字符串,然后用eval(parse(text = '…'))进行计算。对于任何严肃的脚本来说,Optparse显然都是可取的,但功能很少的代码有时也很好。

样例输出:

$ Rscript check_mail.Rscript --help
--debug Print  variables rather than executing function XYZ...

-h  --help  Display flag definitions

供您参考:有一个函数args(),它检索R个函数的参数,不要与名为args的参数向量混淆

Try library(getopt)…如果你想让事情变得更好。例如:

spec <- matrix(c(
        'in'     , 'i', 1, "character", "file from fastq-stats -x (required)",
        'gc'     , 'g', 1, "character", "input gc content file (optional)",
        'out'    , 'o', 1, "character", "output filename (optional)",
        'help'   , 'h', 0, "logical",   "this help"
),ncol=5,byrow=T)

opt = getopt(spec);

if (!is.null(opt$help) || is.null(opt$in)) {
    cat(paste(getopt(spec, usage=T),"\n"));
    q();
}