下载整个S3存储桶?

我注意到似乎没有从AWS管理控制台下载整个s3桶的选项。

有什么简单的方法可以把所有东西都装进我的桶里吗?我正在考虑使根文件夹公共，使用wget抓取它，然后再次使它私有，但我不知道是否有更简单的方法。

当前回答

正如Neel Bhaat在这篇博客中解释的那样，有许多不同的工具可以用于此目的。有些是AWS提供的，大多数是第三方工具。所有这些工具都要求您将AWS帐户密钥和秘密保存在工具本身。在使用第三方工具时要非常谨慎，因为你保存的凭证可能会让你失去全部价值，让你完蛋。

因此，我总是建议为此使用AWS CLI。您可以从这个链接简单地安装它。接下来，运行以下命令并在AWS CLI中保存密钥和秘密值。

aws configure

并使用以下命令将AWS S3 Bucket同步到本地计算机。(本地机器应该安装了AWS CLI)

aws s3 sync <source> <destination>

例子:

1)用于AWS S3到本地存储

aws s3 sync <S3Uri> <LocalPath>

2)从本地存储到AWS S3

aws s3 sync <LocalPath> <S3Uri>

3)从AWS s3桶到另一个桶

aws s3 sync <S3Uri> <S3Uri>

其他回答

我使用了几种不同的方法将Amazon S3数据复制到本地机器，包括s3cmd，到目前为止最简单的方法是Cyberduck。

你所需要做的就是输入你的亚马逊凭证，然后使用简单的界面来下载、上传、同步你的存储桶、文件夹或文件。

如果桶相当大，有一个叫做s4cmd的命令可以进行并行连接，提高下载时间:

把它安装在Debian上就像

apt install s4cmd

如果你有pip:

pip install s4cmd

它将读取~/。s3cfg文件(如果没有安装s3cmd并运行s3cmd——configure)，或者您可以在命令上指定——access-key=ACCESS_KEY——secret-key=SECRET_KEY。

命令行类似于s3cmd。在这种情况下，建议同步，因为您可以取消下载并重新启动，而不必重新下载文件。

s4cmd [--access-key=ACCESS_KEY --secret-key=SECRET_KEY] sync s3://<your-bucket> /some/local/dir

如果你下载了很多数据(>1TB)，这可能会影响你的账单，先计算一下这将是成本

使用awscli下载/上传文件到s3总是更好。同步将帮助您恢复没有任何麻烦。

aws s3 sync s3://bucketname/ .

试试这个命令:

aws s3同步您的bucketnamedirectory您的localdirectory

例如，如果你的桶名是myBucket，本地目录是c:\local，那么:

aws s3 sync s3://myBucket c:\local

有关awscli的更多信息，请查看这个 Aws cli安装

我已经为S3做了一些开发，我还没有找到一个简单的方法来下载整个存储桶。

如果您想用Java编写代码，那么jets3t库很容易用于创建存储桶列表并遍历该列表以下载它们。

首先，从AWS管理咨询器获取一个公共私钥集，这样您就可以创建一个S3service对象:

AWSCredentials awsCredentials = new AWSCredentials(YourAccessKey, YourAwsSecretKey);
s3Service = new RestS3Service(awsCredentials);

然后，获取bucket对象的数组:

S3Object[] objects = s3Service.listObjects(YourBucketNameString);

最后，遍历该数组，每次下载一个对象:

S3Object obj = s3Service.getObject(bucket, fileName);
            file = obj.getDataInputStream();

我把连接代码放在线程安全的单例中。由于显而易见的原因，省略了必要的try/catch语法。

如果你更愿意用Python编写代码，你可以使用Boto。

在查看BucketExplorer之后，“下载整个桶”可能会满足你的需要。

推荐文章