じゃんぬさんのところで話題のクラスで思い出しました。本題のアーカイブとは関係ない話です。

ちなみに単純に考えるならHTTPで圧縮転送する Content-Encoding: gzip あるいは deflate のためにあるんじゃないかなというところなのですね。

私の場合ですがApacheのログを処理することがあるので使っています。大抵のWindows以外のWebサーバではログを溜め込むときにgzipで圧縮して保存されてたりします。そのログを解析する必要があるとき前処理としてツールを通すのですが、そのツールは自分で作ったものなのでGZipStreamを使っています。

ログの場合gzipを展開すると大体20倍ぐらいに膨れ上がるので小さいまま処理できてI/Oが減るし、ディスクも食わなくてとても便利です。よかったよかった。

ただ実はというかドキュメントに普通に書いてあるのですけど「サイズが 4GB を超えるファイルを扱えない」(ただし圧縮できないとしか書いてないケド)のです。あるときこれに引っかかってしまったのです。一日分のCombined Log Formatなgzファイルを展開して4GBを超えるなんて想像してなかったわけで……。そのときはgunzipで展開して処理するという羽目になりました。4GBを超えた時点で死んだのは悲しいです。

まあ、4GBを超えるWebサーバのログなんて滅多にないのでいいですけど。気にはかけておくべきですね。

ともかくGZipStreamにはいつもお世話になっております。ということで、できればtarをgzじゃなくてgzをtarしてください>誰とはなく。