Tree是如何生成的

有了前几章的知识，我们知道每一个Commit都维护着一棵树（Tree），那么这些树是如何生成的呢，本节我们就来详细讨论这个问题。我们首先要知道，把文件的内容存储在Git仓库中，这就生成了一个Blob，而树“拥有”着一些blob。但我们还不知道这些包含着blob的树是如何被创建的，或者说，这些树是如何链接到他们对应的commit的。

让我们再以一个小例子来开始这一节，我们重新创建一个Git仓库，但这回我们使用底层命令手动构造树，这样可以让读者更清楚的明白这些操作背后发生了什么：

$ rm -fr greeting .git
$ echo 'Hello, world!' > greeting
$ git init
$ git add greeting

当你把一个文件放入index（也就是这里的git add命令）以后，所有的一切就开始了。当我把greeting文件加入到index的时候，我的仓库中发生了一些变化。虽然我暂时还不能把这种变化看做是一个Commit，我们可以用下面的方法来看看在我的仓库中究竟发生了什么：

$ git log # 这条命令将会报错，因为到此为止我们还没有做任何提交
fatal: bad default revision 'HEAD'
$ git ls-files --stage # 把index中引用的所有blob列出来
100644 af5626b4a114abcb82d63db7c8082c3c4756e51b 0 greeting

令人疑惑的是，既然我还没有使用git commit命令向我的这个仓库提交任何东西，那么仓库中为什么已经生成了一些blob呢？而且如果读者还有印象的话，这个Hash码与我们之前几章中greeting的Hash码完全一致。因此我知道这个blob其实就代表了我们的greeting文件。这个时候我可以使用cat-file -t HASHID命令查看这个blob的类型其实是一个blob，事实上这个blob也就和我们前几章创建的一样的。而正如我们之前一直强调的，相同的文件在Git中总是使用同样的blog和hashid来表示。（原谅我我不厌其烦的强调这个知识点）

不过这个blob现在还不是一棵树，而且我们现在也没有任何Commit，准确的说，此刻这个blob只是存在.git/index中，这个目录是用来暂存我们的工作目录的内容，里面的blob组成了我们当前的索引（index），OK，我们现在可以开始生成一棵真正的树了：

$ git write-tree # record the contents of the index in a tree
0563f77d884e4f79ce95117e2d686d7d6e282887

这个Hash码大家应该很熟悉，就是我们上一章也见过同样的Hash（不记得的同学可以翻到上一章去看看），和blob一样，包含了同样的blob的树也会使用同样的Hash编码表示，这也是我们之前提到的。我们还没有创建Commit，但是在Index里面，已经有了一个包含了greeting这个blob的tree对象了，因此我们使用write-tree这条底层命令来手动创建一棵树，这条命令会把当前Index中的所有内容打包成一棵新的树，以便后续Git使用这棵树来构造一个新的Commit。

我们现在使用commit-tree命令，将刚才生成的这一棵树打包成一个真正的Commit：

$ echo "Initial commit" | git commit-tree 0563f77
5f1bc85745dcccce6121494fdd37658cb4ad441f

commit-tree命令获取树这棵树的哈希id并生成一个Commit对象来保存它。如果想指定这个Commit的父节点，也可以使用-p选项显式指定父节点的的哈希码。需要注意的是，如果读者也和我一起执行了上面的命令，可能会得到不同的哈希码：这是因为一个Commit不仅仅包含了其对应的树的哈希码，同时也包含了我的用户名和创建Commit的日期（译者注：其实在commit中也包含了commit message，即上面的“Initial commit”，但如果读者执行的是完全一样的命令，那么这部分是相同的，因此就只有用户名和日期是不同的）到此为止，我们的任务还没有结束，因为我还没有把刚生成的这个commit更新为当前的HEAD指针，我们可以用下面的命令来更新：

$ echo 5f1bc85745dcccce6121494fdd37658cb4ad441f > .git/refs/heads/master

这条命令将告诉Git，我们创建的分支名字叫做“master”，另外还有一条更加安全的命令——update-ref也可以完成同样的工作：

$ git update-ref refs/heads/master 5f1bc857

在我们创建了master分支以后，我们需要将他与当前的工作目录树相关联，一般来说，在用户每次执行检出分支（git checkout）的时候，Git就会将检出的分支对应的commit关联到我们当前的工作目录树上。

$ git symbolic-ref HEAD refs/heads/master

上面的命令将HEAD指针指向了master分支，这个操作非常重要，因为这意味着接下来我们创建的其他commit将会自动更新为新的master分支的引用值。

难以置信的是一个完整的Commit创建过程是如此简单，但是确实如此，我们现在可以使用日志命令（git log）来查看刚才创建的这个提交了：

$ git log
commit 5f1bc85745dcccce6121494fdd37658cb4ad441f
Author: John Wiegley <johnw@newartisans.com>
Date:   Mon Apr 14 11:14:58 2008 -0400
        Initial commit

笔者注：如果我没有将refs/heads/master关联到刚创建的commit上，那么这个commit就会被Git认为是一个“不可达”的commit，因为没有任何对象引用了他，同时他也不是任何“可达”对象的父节点（通常我们可以通过一个可达的对象找到他的父节点，例如HEAD^，因此其父节点也是可达的）。当这种情况发生的时候，Git将会在某个时间点清理掉这些不可达的对象，当然包括他们所对应的树和相关的blob（用户可以通过执行gc命令来手动进行垃圾清理，但是一般很少人这么做）当你将ref/heads关联到某一个commit以后（就像我们上面做的一样），他就变成了一个可达的commit，这样，从这时候开始，这个commit将会被长时间的保存在我们的仓库中（除非你删除他或者将他变成一个不可达对象）。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

how-trees-are-made.md

how-trees-are-made.md

Tree是如何生成的

Files

how-trees-are-made.md

Latest commit

History

how-trees-are-made.md

File metadata and controls

Tree是如何生成的