如何制作一个伟大的R可重复示例

在与同事讨论绩效、教学、发送错误报告或搜索邮件列表和Stack Overflow上的指导时，经常会询问一个可重复的示例，并且总是很有用。

你有什么建议来创建一个优秀的例子？如何以文本格式粘贴r中的数据结构？您还应包括哪些其他信息？

除了使用dput（）、dump（）或structure（）之外，还有其他技巧吗？什么时候应该包含library（）或require（）语句？除了c、df、data等之外，应该避免哪些保留字。？

如何做出一个伟大的、可重复的例子？

当前回答

（这是我如何写一个可复制的例子的建议。我试图让它简短而甜蜜）。

如何编写可复制的示例

如果你提供了一个可重复的例子，你最有可能在R问题上得到很好的帮助。一个可复制的示例允许其他人通过复制和粘贴R代码来重新创建您的问题。

为了使示例具有可复制性，您需要包括四个方面：所需的包、数据、代码和R环境的描述。

包应该在脚本的顶部加载，因此很容易看看示例需要哪些。在电子邮件或堆栈溢出问题中包含数据的最简单方法是使用dput（）生成R代码以重新创建它。例如，要在R中重新创建mtcars数据集，我将执行以下步骤：在R中运行dput（mtcars）复制输出在我的可复制脚本中，键入mtcars<-然后粘贴。花一点时间确保您的代码易于其他人使用内容如下：确保使用了空格，变量名称简洁，但是提供有用信息的使用注释指出问题所在尽最大努力删除与问题无关的所有内容。代码越短，越容易理解。在代码的注释中包含sessionInfo（）的输出。这总结了您的R环境，并使其易于检查您是否使用了过时的包裹

您可以通过启动一个新的R会话并粘贴脚本来检查是否确实制作了一个可复制的示例。

在将所有代码放入电子邮件之前，请考虑将其放在Gistgithub上。它会给你的代码提供很好的语法高亮显示，你不必担心任何东西会被电子邮件系统破坏。

2011-05-11 13:57:51

其他回答

R-help邮件列表有一个发布指南，包括提问和回答问题，包括生成数据的示例：

示例：有时提供一个小例子实际上可以运行。例如：如果我有如下矩阵x：

  > x <- matrix(1:8, nrow=4, ncol=2,
                dimnames=list(c("A","B","C","D"), c("x","y"))
  > x
    x y
  A 1 5
  B 2 6
  C 3 7
  D 4 8
  >

如何将其转换为数据帧具有8行和3列“row”、“col”和“value”，它们具有维度名称为“row”和“col”的值，如下所示：

  > x.df
     row col value
  1    A   x      1

...（答案可能是：

  > x.df <- reshape(data.frame(row=rownames(x), x), direction="long",
                    varying=list(colnames(x)), times=colnames(x),
                    v.names="value", timevar="col", idvar="row")

)

“小”这个词特别重要。您应该以最小的可重复示例为目标，这意味着数据和代码应该尽可能简单地解释问题。

编辑：漂亮的代码比难看的代码更容易阅读。使用样式指南。

2011-05-11 13:17:38

您可以使用reprex执行此操作。

正如mt1022所指出的，“……生产最小、可重复示例的好包装是tidyverse的“reprex”。”。

根据Tidyverse的说法：

“reprex”的目标是以这样一种方式打包您的问题代码，使其他人可以运行它并感受到您的痛苦。

tidyverse网站上给出了一个示例。

library(reprex)
y <- 1:4
mean(y)
reprex()

我认为这是创建可复制示例的最简单方法。

2017-08-18 19:02:43

从R.2.14开始（我猜），您可以将数据文本表示直接输入read.table：

 df <- read.table(header=TRUE, 
  text="Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa
")

2012-06-29 08:32:04

最初的帖子指的是现已退役的数据营的小提琴演奏服务。它已被重新命名为数据营灯，不能像我的回答所示的那样容易嵌入。

我想知道http://old.r-fiddle.org/链接可能是分享问题的一种非常简单的方式。它接收一个唯一的ID，比如，甚至可以考虑将其嵌入SO中。

2015-01-09 13:11:48

以下是我的一些建议：

尝试使用默认的R数据集如果您有自己的数据集，请将其包含在dput中，这样其他人可以更轻松地帮助您除非确有必要，否则不要使用install.package（），人们会理解您是否只使用require或library尽量简明扼要，有一些数据集尽量简单地描述您需要的输出问问题之前自己做上传图片很容易，所以如果你有还包括您可能遇到的任何错误

所有这些都是可复制示例的一部分。

2016-04-09 18:15:19

如何制作一个伟大的R可重复示例

推荐文章

最新文章

标签