Skip to content

Latest commit

 

History

History
73 lines (51 loc) · 6.07 KB

how-trees-are-made.md

File metadata and controls

73 lines (51 loc) · 6.07 KB

Tree是如何生成的

有了前几章的知识,我们知道每一个Commit都维护着一棵树(Tree),那么这些树是如何生成的呢,本节我们就来详细讨论这个问题。我们首先要知道,把文件的内容存储在Git仓库中,这就生成了一个Blob,而树“拥有”着一些blob。但我们还不知道这些包含着blob的树是如何被创建的,或者说,这些树是如何链接到他们对应的commit的。

让我们再以一个小例子来开始这一节,我们重新创建一个Git仓库,但这回我们使用底层命令手动构造树,这样可以让读者更清楚的明白这些操作背后发生了什么:

$ rm -fr greeting .git
$ echo 'Hello, world!' > greeting
$ git init
$ git add greeting

当你把一个文件放入index(也就是这里的git add命令)以后,所有的一切就开始了。当我把greeting文件加入到index的时候,我的仓库中发生了一些变化。虽然我暂时还不能把这种变化看做是一个Commit,我们可以用下面的方法来看看在我的仓库中究竟发生了什么:

$ git log # 这条命令将会报错,因为到此为止我们还没有做任何提交
fatal: bad default revision 'HEAD'
$ git ls-files --stage # 把index中引用的所有blob列出来
100644 af5626b4a114abcb82d63db7c8082c3c4756e51b 0 greeting

令人疑惑的是,既然我还没有使用git commit命令向我的这个仓库提交任何东西,那么仓库中为什么已经生成了一些blob呢?而且如果读者还有印象的话,这个Hash码与我们之前几章中greeting的Hash码完全一致。因此我知道这个blob其实就代表了我们的greeting文件。这个时候我可以使用cat-file -t HASHID命令查看这个blob的类型其实是一个blob,事实上这个blob也就和我们前几章创建的一样的。而正如我们之前一直强调的,相同的文件在Git中总是使用同样的blog和hashid来表示。(原谅我我不厌其烦的强调这个知识点)

不过这个blob现在还不是一棵树,而且我们现在也没有任何Commit,准确的说,此刻这个blob只是存在.git/index中,这个目录是用来暂存我们的工作目录的内容,里面的blob组成了我们当前的索引(index),OK,我们现在可以开始生成一棵真正的树了:

$ git write-tree # record the contents of the index in a tree
0563f77d884e4f79ce95117e2d686d7d6e282887

这个Hash码大家应该很熟悉,就是我们上一章也见过同样的Hash(不记得的同学可以翻到上一章去看看),和blob一样,包含了同样的blob的树也会使用同样的Hash编码表示,这也是我们之前提到的。我们还没有创建Commit,但是在Index里面,已经有了一个包含了greeting这个blob的tree对象了,因此我们使用write-tree这条底层命令来手动创建一棵树,这条命令会把当前Index中的所有内容打包成一棵新的树,以便后续Git使用这棵树来构造一个新的Commit。

我们现在使用commit-tree命令,将刚才生成的这一棵树打包成一个真正的Commit:

$ echo "Initial commit" | git commit-tree 0563f77
5f1bc85745dcccce6121494fdd37658cb4ad441f

commit-tree命令获取树这棵树的哈希id并生成一个Commit对象来保存它。如果想指定这个Commit的父节点,也可以使用-p选项显式指定父节点的的哈希码。 需要注意的是,如果读者也和我一起执行了上面的命令,可能会得到不同的哈希码:这是因为一个Commit不仅仅包含了其对应的树的哈希码,同时也包含了我的用户名和创建Commit的日期(译者注:其实在commit中也包含了commit message,即上面的“Initial commit”,但如果读者执行的是完全一样的命令,那么这部分是相同的,因此就只有用户名和日期是不同的) 到此为止,我们的任务还没有结束,因为我还没有把刚生成的这个commit更新为当前的HEAD指针,我们可以用下面的命令来更新:

$ echo 5f1bc85745dcccce6121494fdd37658cb4ad441f > .git/refs/heads/master

这条命令将告诉Git,我们创建的分支名字叫做“master”,另外还有一条更加安全的命令——update-ref也可以完成同样的工作:

$ git update-ref refs/heads/master 5f1bc857

在我们创建了master分支以后,我们需要将他与当前的工作目录树相关联,一般来说,在用户每次执行检出分支(git checkout)的时候,Git就会将检出的分支对应的commit关联到我们当前的工作目录树上。

$ git symbolic-ref HEAD refs/heads/master

上面的命令将HEAD指针指向了master分支,这个操作非常重要,因为这意味着接下来我们创建的其他commit将会自动更新为新的master分支的引用值。

难以置信的是一个完整的Commit创建过程是如此简单,但是确实如此,我们现在可以使用日志命令(git log)来查看刚才创建的这个提交了:

$ git log
commit 5f1bc85745dcccce6121494fdd37658cb4ad441f
Author: John Wiegley <johnw@newartisans.com>
Date:   Mon Apr 14 11:14:58 2008 -0400
        Initial commit

笔者注:如果我没有将refs/heads/master关联到刚创建的commit上,那么这个commit就会被Git认为是一个“不可达”的commit,因为没有任何对象引用了他,同时他也不是任何“可达”对象的父节点(通常我们可以通过一个可达的对象找到他的父节点,例如HEAD^,因此其父节点也是可达的)。当这种情况发生的时候,Git将会在某个时间点清理掉这些不可达的对象,当然包括他们所对应的树和相关的blob(用户可以通过执行gc命令来手动进行垃圾清理,但是一般很少人这么做)当你将ref/heads关联到某一个commit以后(就像我们上面做的一样),他就变成了一个可达的commit,这样,从这时候开始,这个commit将会被长时间的保存在我们的仓库中(除非你删除他或者将他变成一个不可达对象)。