git对象
1、对象类型
git对象库是Git版本库实现的核心,它包含了原始数据文件和所有的日志信息、作者信息、日期,已经其他用来重建项目任意版本或者分支的信息。位于.git/objects目录下。
├── HEAD├── branches├── config├── description├── hooks│ ├── pre-commit.sample│ ├── pre-push.sample│ └── ...├── info│ └── exclude├── objects│ ├── info│ └── pack└── refs ├── heads └── tags
git对象库中有四种类型:块(blob)、目录树(tree)、提交(commit)、标签(tag)。这四种原子对象构成了Git高层数据结构的基础。
git对象的寻址使用40位的16进制数表示,也就是SHA1或者散列码,例如7f8aacaddffe009fff75b81187527c35a51f3eac。为了管理方便在文件系统中前两位作为文件夹的名字,后38为作为文件名字。
你可能感觉用40位作为git对象的寻址ID,可能会存在不同的内容但是散列码相同的情况,你的感觉是正确的,但是这种情况出现的概率肯定可以忽略不计了。
其对象的关系如下:
2、blob 块
blob对象存储文件的时间内容,实际为工作空间的文件内容。具体为对文件内容使用zlib算法压缩,然后对得到的字节取hash算法。因此相同的文件内容,得到的blob对象肯定是相同的。
示例:
git init temp -----初始化一个空的git仓库cd tempecho "Welcome to git">hello.txtgit add hello.txt ------添加到暂存器
此时我们查看.git/objects的目录如下:
此时我们可以通过git cat-file命令查看git对象的内容。注意cat-file命令可以查看所有的git对象。这个命令可以查看所有的git对象。
git cat-file -p b08a2810d8a4542f350f650435f506c6c81ca9b2Welcome to git
由于git对文件内容使用压缩然后对内容取hash作为文件名的特性,因此不管文件系统中同样文件内容有几份,在git对象中都仅仅存一份。
3. 目录树 tree
git目录树对象映射操作系统中工作空间的目录,不同的是工作空间的目录下是文件和文件夹的集合,而目录树对象则为blob对象和目录树对象的集合。
mkdir srccd srccp ../hello.txt hello.txtgit add hello.txtgit write-tree -----git的内部命令,commit命令基本等于write-tree 和commit-tree命令
此时我们使用write-tree命令返回的hash值使用cat命令
从图中可以看出内容相同的文件,blob是相同的,命令树tree对象是对应文件系统的文件夹的一个映射。
4.commit提交
提交是我们使用git的时候经常的动作,每一个提交都执行了一个目录树对象。同时提交也有一个或者多个父提交。我们现在使用commit-tree命令来关联目录树对象吧(一般使用commit命令来自动创建树对象和关联父提交)。
我们可以使用git $command --help来查看命令的资料文档,例如git commit --help 、git pull --help
git commit-tree 5657a3b1d1454667d51f8c64c1fe9830276cdcea -m "1 commit" ----初次提交所以没有指定父提交7df70363051681bdd078b6a1a3fc9fe3d1595325 ----返回commit对象的HASH值git cat-file -p 7df70363051681bdd078b6a1a3fc9fe3d1595325tree 5657a3b1d1454667d51f8c64c1fe9830276cdceaauthor xxxxxxx 1516538936 +0800committer xxxx 1516538936 +08001 commit
注意此时当我们使用git log命令并不会显示刚刚的提交,需要使用 git merge 7df70363051681bdd078b6a1a3fc9fe3d1595325命令合并到master分支。可以看出git commit命令基本等于write-tree commit-tree merge命令。
现在我们修改工作空间中的hello.txt命令,然后提交查看目录树的内容。
注意看tree对象和第一次提交队对应的tree对象相同,都是e15a40c68bd15301b60d21c204a5e7a87d62d8a1,而本身我们也没有修改其文件夹下面的任何内容。而blob对象32690ead83f3b77ad763e9e2c2e60ce3706cf117的内容是两行,说明git对象内部提交指定的tree对象是工作空间的一个快照,而不是存储的增量(否则内容就是刚刚添加的一行了)。
5.标签 tag
标签仅仅是一个提交的快照,而且不允许修改其内容。
$ git tag 1.0$ git cat-file -p 1.0tree f935b24b9a688ba5050fda30d70801c9092caeaaparent 7df70363051681bdd078b6a1a3fc9fe3d1595325author xxx 1516542403 +0800committer xxx 1516542403 +08002 commit
6.F&Q
1.git的编码方式
git的blob对象使用字节流进行存储,因此不存在编码问题。
对于目录树对象对应的路径、commit对应的message注释,默认都使用UTF-8编码。
如果想修改编码格式请参照(除非有特别的理由):https://git-scm.com/docs/git-commit/1.8.0.1#_discussion