考虑以下场景:

我在自己的Git repo中开发了一个小型实验项目a。它现在已经成熟,我希望A成为更大的项目B的一部分,该项目有自己的大仓库。现在我想将A添加为B的子目录。

我如何将A合并为B,而不丢失任何方面的历史?


当前回答

几天来我一直在尝试做同样的事情,我使用的是git2.7.2。子树不会保留历史。

如果不再使用旧项目,可以使用此方法。

我建议你先在B分支机构工作,然后在该分支机构工作。

以下是没有分支的步骤:

cd B

# You are going to merge A into B, so first move all of B's files into a sub dir
mkdir B

# Move all files to B, till there is nothing in the dir but .git and B
git mv <files> B

git add .

git commit -m "Moving content of project B in preparation for merge from A"


# Now merge A into B
git remote add -f A <A repo url>

git merge A/<branch>

mkdir A

# move all the files into subdir A, excluding .git
git mv <files> A

git commit -m "Moved A into subdir"


# Move B's files back to root    
git mv B/* ./

rm -rf B

git commit -m "Reset B to original state"

git push

如果您现在在分区A中记录任何文件,您将获得完整的历史记录

git log --follow A/<file>

这是帮助我做到这一点的帖子:

http://saintgimp.org/2013/01/22/merging-two-git-repositories-into-one-repository-without-losing-file-history/

其他回答

如果您试图简单地将两个存储库粘合在一起,那么子模块和子树合并是错误的工具,因为它们不能保留所有的文件历史记录(正如人们在其他答案中所指出的)。请参阅此处的答案,了解简单而正确的方法。

如果您想单独维护项目,子模块方法是很好的。然而,如果您真的想将两个项目合并到同一个存储库中,那么您还有更多的工作要做。

第一件事是使用gitfilter分支将第二个存储库中所有内容的名称重写到您希望它们结束的子目录中。因此,您将使用projb/foo.c和projb/bar.html代替foo.c和bar.html。

然后,您应该能够执行以下操作:

git remote add projb [wherever]
git pull projb

git pull将执行git fetch,然后执行git merge。如果您要拉到的存储库还没有projb/目录,那么应该不会有冲突。

进一步搜索表明,在将gitk合并为git时也做了类似的操作。Junio C Hamano在这里写道:http://www.mail-archive.com/git@vger.kernel.org/msg03395.html

我稍微手动合并项目,这使我可以避免处理合并冲突。

首先,从另一个项目中复制文件,无论您需要什么。

cp -R myotherproject newdirectory
git add newdirectory

历史上的下一次拉力

git fetch path_or_url_to_other_repo

告诉git在上次获取的历史记录中合并

echo 'FETCH_HEAD' > .git/MERGE_HEAD

现在按您通常的方式提交

git commit

在我的例子中,我有一个插件存储库和一个主项目存储库,我想假装我的插件一直是在主项目的插件子目录中开发的。

基本上,我重写了我的插件存储库的历史,使其看起来所有的开发都发生在插件/我的插件子目录中。然后,我将插件的开发历史添加到主项目历史中,并将两棵树合并在一起。由于主项目存储库中没有插件/my插件目录,所以这是一个简单的无冲突合并。生成的存储库包含两个原始项目的所有历史,并且有两个根。

TL;博士

$ cp -R my-plugin my-plugin-dirty
$ cd my-plugin-dirty
$ git filter-branch -f --tree-filter "zsh -c 'setopt extended_glob && setopt glob_dots && mkdir -p plugins/my-plugin && (mv ^(.git|plugins) plugins/my-plugin || true)'" -- --all
$ cd ../main-project
$ git checkout master
$ git remote add --fetch my-plugin ../my-plugin-dirty
$ git merge my-plugin/master --allow-unrelated-histories
$ cd ..
$ rm -rf my-plugin-dirty

长版本

首先,创建我的插件存储库的副本,因为我们将重写这个存储库的历史。

现在,导航到我的插件库的根目录,检查您的主分支(可能是主分支),然后运行以下命令。当然,你应该替换我的插件和插件,无论你的实际名称是什么。

$ git filter-branch -f --tree-filter "zsh -c 'setopt extended_glob && setopt glob_dots && mkdir -p plugins/my-plugin && (mv ^(.git|plugins) plugins/my-plugin || true)'" -- --all

现在来解释一下。git-filter-branch--tree-filter(…)HEAD对可以从HEAD访问的每个提交运行(…)命令。请注意,这直接对为每次提交存储的数据进行操作,因此我们不必担心“工作目录”、“索引”、“暂存”等概念。

如果您运行的filter branch命令失败,它将在.git目录中留下一些文件,下次尝试filter branch时,它将对此进行投诉,除非您为filter branch提供-f选项。

至于实际的命令,我没有太多的运气让bash执行我想要的,所以我使用zsh-c来让zsh执行一个命令。首先,我设置了extended_glob选项,这是启用mv命令中的^(…)语法的选项,以及glob_dots选项,它允许我使用glob(^(……))选择点文件(例如.gitignore)。

接下来,我使用mkdir-p命令同时创建插件和plugins/my插件。

最后,我使用zsh“negative glob”特性^(.git |插件)来匹配存储库根目录中的所有文件,但.git和新创建的插件文件夹除外。(此处可能不需要排除.git,但尝试将目录移动到自身是错误的。)

在我的存储库中,初始提交不包含任何文件,因此mv命令在初始提交时返回了一个错误(因为没有可移动的内容)。因此,我添加了一个||true,这样gitfilter分支就不会中止。

-all选项告诉filter-branch重写存储库中所有分支的历史记录,而额外的--则需要告诉git将其解释为分支重写选项列表的一部分,而不是filter-branch本身的一个选项。

现在,导航到您的主项目存储库并检查您要合并到的任何分支。添加我的插件存储库的本地副本(已修改其历史记录)作为主项目的远程副本:

$ git remote add --fetch my-plugin $PATH_TO_MY_PLUGIN_REPOSITORY

现在,您的提交历史中将有两个不相关的树,您可以使用以下方法很好地可视化它们:

$ git log --color --graph --decorate --all

要合并它们,请使用:

$ git merge my-plugin/master --allow-unrelated-histories

注意,在2.9.0之前的Git中,--allow unrelated history选项不存在。如果您使用的是这些版本中的一个,只需省略选项:2.9.0中还添加了--allow unrelated histories prevent的错误消息。

您不应该有任何合并冲突。如果您这样做了,这可能意味着filter branch命令无法正常工作,或者主项目中已经存在plugins/my插件目录。

确保为任何未来的贡献者输入一个解释性的提交消息,让他们知道如何进行黑客操作来创建一个具有两个根的存储库。

您可以使用上面的gitlog命令可视化新的提交图,它应该有两个根提交。请注意,只有主分支将被合并。这意味着,如果你在其他我的插件分支上有重要的工作要合并到主项目树中,那么在完成这些合并之前,你应该避免删除我的插件远程。如果您不这样做,那么来自这些分支的提交仍将在主项目存储库中,但有些将无法访问,并且容易受到最终垃圾收集的影响。(此外,您必须通过SHA引用它们,因为删除远程会删除其远程跟踪分支。)

可选地,在您合并了我的插件中要保留的所有内容后,您可以使用以下方法删除我的插件远程:

$ git remote remove my-plugin

现在,您可以安全地删除您更改了其历史记录的插件存储库的副本。在我的例子中,在合并完成并推送后,我还向真正的插件存储库添加了一个弃用通知。


在Mac OS X El Capitan上测试了git版本2.9.0和zsh版本5.2。您的里程数可能有所不同。

参考文献:

https://git-scm.com/docs/git-filter-branchhttps://unix.stackexchange.com/questions/6393/how-do-you-move-all-files-including-hidden-from-one-directory-to-anotherhttp://www.refining-linux.org/archives/37/ZSH-Gem-2-Extended-globbing-and-expansion/从Git repo清除文件失败,无法创建新备份git,过滤所有分支上的分支

此函数将远程repo克隆到本地repo目录中,合并后将保存所有提交,git日志将显示原始提交和正确路径:

function git-add-repo
{
    repo="$1"
    dir="$(echo "$2" | sed 's/\/$//')"
    path="$(pwd)"

    tmp="$(mktemp -d)"
    remote="$(echo "$tmp" | sed 's/\///g'| sed 's/\./_/g')"

    git clone "$repo" "$tmp"
    cd "$tmp"

    git filter-branch --index-filter '
        git ls-files -s |
        sed "s,\t,&'"$dir"'/," |
        GIT_INDEX_FILE="$GIT_INDEX_FILE.new" git update-index --index-info &&
        mv "$GIT_INDEX_FILE.new" "$GIT_INDEX_FILE"
    ' HEAD

    cd "$path"
    git remote add -f "$remote" "file://$tmp/.git"
    git pull "$remote/master"
    git merge --allow-unrelated-histories -m "Merge repo $repo into master" --edit "$remote/master"
    git remote remove "$remote"
    rm -rf "$tmp"
}

如何使用:

cd current/package
git-add-repo https://github.com/example/example dir/to/save

如果进行一些更改,您甚至可以将合并的repo的文件/目录移动到不同的路径中,例如:

repo="https://github.com/example/example"
path="$(pwd)"

tmp="$(mktemp -d)"
remote="$(echo "$tmp" | sed 's/\///g' | sed 's/\./_/g')"

git clone "$repo" "$tmp"
cd "$tmp"

GIT_ADD_STORED=""

function git-mv-store
{
    from="$(echo "$1" | sed 's/\./\\./')"
    to="$(echo "$2" | sed 's/\./\\./')"

    GIT_ADD_STORED+='s,\t'"$from"',\t'"$to"',;'
}

# NOTICE! This paths used for example! Use yours instead!
git-mv-store 'public/index.php' 'public/admin.php'
git-mv-store 'public/data' 'public/x/_data'
git-mv-store 'public/.htaccess' '.htaccess'
git-mv-store 'core/config' 'config/config'
git-mv-store 'core/defines.php' 'defines/defines.php'
git-mv-store 'README.md' 'doc/README.md'
git-mv-store '.gitignore' 'unneeded/.gitignore'

git filter-branch --index-filter '
    git ls-files -s |
    sed "'"$GIT_ADD_STORED"'" |
    GIT_INDEX_FILE="$GIT_INDEX_FILE.new" git update-index --index-info &&
    mv "$GIT_INDEX_FILE.new" "$GIT_INDEX_FILE"
' HEAD

GIT_ADD_STORED=""

cd "$path"
git remote add -f "$remote" "file://$tmp/.git"
git pull "$remote/master"
git merge --allow-unrelated-histories -m "Merge repo $repo into master" --edit "$remote/master"
git remote remove "$remote"
rm -rf "$tmp"

通知路径将通过sed替换,因此请确保在合并后将其移动到正确的路径中。--allow非相关历史参数仅在git>=2.9之后存在。