Git的内部数据结构是一个数据对象树,其中每个对象只指向它的前一个对象。每个数据块都是散列的。当保存的哈希值与实际哈希值偏离时,修改中间块(比特错误或攻击)将被注意到。
这个概念与区块链有何不同? Git并没有被列为区块链的例子,但至少在摘要中,这两个数据结构的描述看起来很相似:数据块、单向反向链接、哈希等等)。
那么区别在哪里,Git不被称为区块链?
Git的内部数据结构是一个数据对象树,其中每个对象只指向它的前一个对象。每个数据块都是散列的。当保存的哈希值与实际哈希值偏离时,修改中间块(比特错误或攻击)将被注意到。
这个概念与区块链有何不同? Git并没有被列为区块链的例子,但至少在摘要中,这两个数据结构的描述看起来很相似:数据块、单向反向链接、哈希等等)。
那么区别在哪里,Git不被称为区块链?
当前回答
Git和区块链之所以看起来相似,是因为它们都使用默克尔树作为底层数据结构。merkle树是一种树,其中每个节点都用其内容的加密散列值标记,其中包括其子节点的标签。
Git的有向无环图就是这样,一个merkle树,其中每个节点(标签、提交、树或blob对象)都用其内容的散列及其“子”的标签进行标记。注意,对于提交,“子”术语与Git对父提交的理解有点冲突:父提交是提交的子提交,您只需要将图看作是一棵通过重新根来不断生长的树。
区块链与此非常相似,因为它们也在以这种方式增长,并且它们也在使用其默克尔树属性来确保数据完整性。但通常情况下,区块链不仅仅被理解为默克尔树,这是它们与“愚蠢的内容跟踪器”Git分开的地方。例如,区块链通常还意味着在区块级别上拥有一个高度分散的系统(并非所有的区块都需要在同一个地方)。
理解区块链有点困难(就我个人而言,我还远远没有理解它的一切),但我认为理解Git内部是理解默克尔树的好方法,这肯定有助于理解区块链的基本部分。
其他回答
区块链和git的目标是不同的,尽管它们都使用默克尔树作为数据结构。
区块链通常由遵循节点间通信和验证新块协议的点对点网络管理。一旦记录,任何给定区块中的数据都不能在不改变所有后续区块的情况下进行追溯修改,这需要网络大多数人的共识。
根据比特币白皮书:
A purely peer-to-peer version of electronic cash would allow online payments to be sent directly from one party to another without going through a financial institution. Digital signatures provide part of the solution, but the main benefits are lost if a trusted third party is still required to prevent double-spending. We propose a solution to the double-spending problem using a peer-to-peer network. The network timestamps transactions by hashing them into an ongoing chain of hash-based proof-of-work, forming a record that cannot be changed without redoing the proof-of-work. The longest chain not only serves as proof of the sequence of events witnessed, but proof that it came from the largest pool of CPU power. As long as a majority of CPU power is controlled by nodes that are not cooperating to attack the network, they'll generate the longest chain and outpace attackers. The network itself requires minimal structure. Messages are broadcast on a best effort basis, and nodes can leave and rejoin the network at will, accepting the longest proof-of-work chain as proof of what happened while they were gone
而Git是一个分布式版本控制系统,用于跟踪软件开发过程中源代码的变化。它是为协调程序员之间的工作而设计的,但它也可以用于跟踪任何一组文件中的更改。它的目标包括速度、数据完整性和对分布式、非线性工作流的支持。
根据Linus Torvalds的说法:
在许多方面,您可以将git视为一个文件系统—它是 内容可寻址,它有版本控制的概念,但我真的 从文件系统的角度对问题进行了设计 人(嘿,我就是做玉米粒的),我实际上绝对有 对创建传统SCM系统毫无兴趣。
像比特币这样的网络货币,使用分布式共识加密区块链(默克尔树)。常用的缩写是'区块链'
虽然git使用区块链(默克尔树),但它缺乏术语“区块链”所暗示的分布式共识加密组件。
没有理由不认为Git是区块链。Git专注于一组非常特殊(也非常重要)的资产:源代码。在这种情况下,共识是手动的,我们可以认为事务(提交)在合并到发布分支时被接受。 实际上,考虑到事务(提交)的数量,Git是迄今为止最成功的区块链。
摘自:https://arxiv.org/pdf/1803.00892.pdf ”……我们定义了“区块链”和“区块链网络”,然后讨论了两种非常不同的、众所周知的区块链网络:加密货币和Git存储库……”
请参见下一篇文章,解释为什么谷歌使用一个单一的monorepo作为单一的真相来源(基本上,作为区块链)。 https://research.google/pubs/pub45424/
区块链不是任意区块的任意链。
区块链是指当两个或多个主链被转移时,有一种方法可以确定主链,并且不需要中央机构来确定主链。
正如poke所说:
Git和区块链看起来很相似,因为它们都使用默克尔树来存储有序的带时间戳的交易。merkle树是一种树数据结构,其中每个节点都用其内容的加密散列值标记,其中包括其子节点的标签。
第一个区别是哈希函数:区块链有一个非常昂贵的哈希函数,因此每个块都必须被挖掘,而Git“块”可以用一个简单的提交消息创建。
比特币的目的是为交易秩序增加信任。重点是最长的链,因为它的计算成本最高,因此最有可能是真理。
Bitcoin accomplishes this by requiring that the hash meets certain parameters (begins with a specific number of 0s), by incrementing a value ("nonce") in the message until a satisfactory hash is found. This takes effort to find, but only 1 calculation to verify for a nonce; and if multiple nonces produce a satisfactory hash, then one will be lower and taken as the truth. Other authentication schemes make the hash trustworthy by centralizing the issuing of the hash to an authority, perhaps voted by network agreement, or some other method.
区块链数据仅限于事务,必须符合验证。事务必须有效,才能包含在下一个块中。比特币交易对应于现实世界中一些重要的事情,这些事情证明了使用昂贵的区块来记录这种转移,比如货币价值的交换。我们实际上并不关心最终的总账,它是对现实世界中某些事物的一种隐喻。
相比之下,Git块是任意的,因为一次提交可以包含任意数量的数据。它的价值在于将数据组织到git树中的变化,因为我们关心最终产品,它由git存储库的存在进行验证。
The purpose of Git is to allow cheap "ledgers" to track multiple product alternatives. The "ledger" in Git is what we care about, it's our final product; the transactions data just record how the product was built. We want to make it very cheap to make multiple versions of final products, just enough overhead to require the creator to record how they built this product. No explicit validation is done on the data, you maintain the end-product if it looks good, and that existence makes it useful to have the chain of this product's creation. If the end-product is bad or the order of commits is invalid, this "ledger" gets deleted during garbage collection.
第二个区别是,区块链事务必须来自先前的有效源。在Git中,我们不关心使用什么数据来扩展树。在区块链中,事务必须来自先前的有效源。从这个意义上说,Git跟踪我们环境的扩展,而区块链跟踪封闭环境中的价值交换。