わんくまに参加するときに中さんからいただいたドキュメント類
全部 Word2007 形式なので拡張子も.docx
で、Word, Excel, PowerPoint は OpenXML 形式の XML ファイル群を ZIP 圧縮したものと聞いていたので拡張子を .zip に変えてレッツ解凍
本当に全部 XML なんですねぇ(当たり前だけど)
テキストと画像だけのドキュメントなのに 10 数個の XML ファイルがでてきました
ファイル名のディレクトリ
├ _rels
│ └ .rels
├ docProps
│ ├ app.xml
│ └ core.xml
├ word
│ ├ _rels
│ │ └ document.xml.rels
│ ├ media
│ │ └ 各種メディアファイル(画像など)
│ ├ theme
│ │ └ theme1.xml
│ ├ document.xml
│ ├ endnotes.xml
│ ├ fontTable.xml
│ ├ footnotes.xml
│ ├ settings.xml
│ ├ styles.xml
│ └ webSettings.xml
└ [Content_Types].xml
こんな感じ
もっとも、マクロが設定してあったり、他の Office オブジェクトが挿入してあったりするとまた変わってくるとは思いますが
今回はXML の中身までは詳しく見てはいませんが、とても手で作るようなものではないなぁという印象
# 拡張子を zip にしなくてもそのまま解凍できた
# しかし、おかげで単一ファイルを圧縮しようとしても勝手に解凍しやがった
# Noah をお使いの方は、動作モードを"圧縮優先"にすることをオススメします