欢迎访问昆山宝鼎软件有限公司网站! 设为首页 | 网站地图 | XML | RSS订阅 | 宝鼎邮箱 | 后台管理


新闻资讯

MENU

软件开发知识

world blob8c01d89ae06311834ee4b1fab2f0414d35f 次  来源:劳务派遣管理系统 时间:2018-06-27

原文出处: 彭金金

在Git内部道理之Git工具哈希中,讲授了Git工具hash的道理,接下来的这篇文章讲一讲Git工具如何存储。

道理

数据工具、树工具和提交工具都是存储在.git/objects目次下,目次的布局如下:

.git
|-- objects
    |-- 01
    |   |-- 55eb4229851634a0f03eb265b69f5a2d56f341
    |-- 1f
    |   |-- 7a7a472abf3dd9643fd615f6da379c4acb3e3a
    |-- 83
        |-- baae61804e65cc73a7201a7252750c76066a30

从上面的目次布局可以看出,Git工具的40位hash分为两部门:头两位作为文件夹,后38位作为工具文件名。所以一个Git工具的存储路径法则为:

.git/objects/hash[0, 2]/hash[2, 40]

这里就发生了一个疑问:为什么Git要这么设计目次布局,而不直接用Git工具的40位hash作为文件名?原因是有两点:

1.有些文件系统对目次下的文件数量有限制。譬喻,FAT32限制单目次下的最大文件数量是65535个,假如利用U盘拷贝Git文件就大概呈现问题。
2.有些文件系统会见文件是一个线性查找的进程,劳务派遣管理系统,目次下的文件越多,昆山软件开发,会见越慢。

在Git内部道理之Git工具哈希中,我们知道Git工具会在原内容前加个一个头部:

store = header + content

Git工具在存储前,会利用zlib的deflate算法举办压缩,即扼要描写为:

zlib_store = zlib.deflate(store)

压缩后的zlib_store凭据Git工具的路径法则存储到.git/objects目次下。

总结下Git工具存储的算法步调:

  1. 计较content长度,结构header;
  2. 将header添加到content前面,结构Git工具;
  3. 利用sha1算法计较Git工具的40位hash码;
  4. 利用zlib的deflate算法压缩Git工具;
  5. 将压缩后的Git工具存储到.git/objects/hash[0, 2]/hash[2, 40]路径下;

Nodejs实现

接下来,我们利用Nodejs来实现git hash-object -w的成果,即计较Git工具的hash值并存储到Git文件系统中:

const fs = require('fs')
const crypto = require('crypto')
const zlib = require('zlib')
function gitHashObject(content, type) {
  // 结构header
  const header = `${type} ${Buffer.from(content).length}\0`
  // 结构Git工具
  const store = Buffer.concat([Buffer.from(header), Buffer.from(content)])
  // 计较hash
  const sha1 = crypto.createHash('sha1')
  sha1.update(store)
  const hash = sha1.digest('hex')
  // 压缩Git工具
  const zlib_store = zlib.deflateSync(store)
  // 存储Git工具
  fs.mkdirSync(`.git/objects/${hash.substring(0, 2)}`)
  fs.writeFileSync(`.git/objects/${hash.substring(0, 2)}/${hash.substring(2, 40)}`, zlib_store)
  console.log(hash)
}
// 挪用进口
gitHashObject(process.argv[2], process.argv[3])

最后,测试下可否正确存储Git工具:

$ node index.js 'hello, world' blob
8c01d89ae06311834ee4b1fab2f0414d35f01102
$ git cat-file -p 8c01d89ae06311834ee4b1fab2f0414d35f01102
hello, world

由此可见,我们生成了一个正当的Git数据工具,劳务派遣管理系统,证明算法是正确的。