通用压缩器对意义视而不见。它们只看到字节、重复与熵——而对于单笔 Ethereum 交易,这几乎没有任何可挖掘的空间:孤立的交易只能被压缩极为有限的幅度。机会不在单笔交易内部,而在它们之间。
区块链的交易流并非随机。相同的合约调用、相同的 calldata 形态、相同的收款方与选择器,在成千上万笔交易之间、以及随时间反复出现。Tau 正是围绕这一观察构建的。它是一台语料库表示引擎:建模的是交易历史的结构,而非单条负载的字节。这就是为什么孤立交易几乎纹丝不动,而批量语料库却能达到数倍的体积缩减——这一收益是一种跨交易效应,Tau 对此坦诚相告。
对基础设施买家而言,关键并不在于更小的文件。排序器、索引器、分析系统与归档系统真正关心的,是压缩后的数据能否在没有运营不确定性的前提下被验证、流式处理、查询与重建。因此 Tau 是无损的,恢复时逐字节精确,携带一个恒定大小的包含性见证,并支持无需完整解压即可查询。它逐字节符合公开的 Ethereum 测试向量。
Tau 不是什么:它不是通用压缩器,不是 blob 的替代品,也不是 Merkle 的替代品。它不要求市场去相信——它发布可复现的结果,并邀请你在自己的语料库上验证。引擎保持封存;证据不会。
包含不等于表示。可用性不等于压缩。