なかなか復帰できないぞ の続き。
ざっくし書けたとこで実データもらって試運転。
...ありゃ? URL毎に集計すんだけど ぜーんぶ ..../index.html でやんの。
なんでかなーって調べてみたら、
ログにあるデータが .../index.html?%E7%A8... みたく ?に続くパラメータ
で各ページに飛ばしてました。
ε 「なんすかコレ?」
ボ 「あー、wiki使ってこさえたってゆー」
ε 「…パラメータんとこで集計するっきゃないっしょね」
ボ 「んじゃよろしくね」
ったくもー。 %E7%A8... のとこ、どうやらeuc-jpみたい。
なのでバイナリに変換、さらにeuc-jp→shift_jis変換かけてごにょごにょ。
あーマンドクセー
ふー。立て続けに「やっつけ仕事」が舞い込んでばたばたしてますわぁ。
ボス@隣の部署:「あのね、Web-pageのアクセス・ログを解析したいんだけど」
επιστημη:「大量?」
ボ 「うん、かなり。生ログはベタなテキストファイル」
ε 「さくさくーとパースしてテケトーなデータベースに溜め込んだらえぇですわ」
ボ 「うーん、そんだけのためにDBサーバ立てるのもなー」
ε 「サーバ要らずのDBありますょ?」
ボ 「…そなの? んじゃ一本書いてよ」
ε 「ぅぁー...まいっか。昼メシおごってくださいね」
ボ 「んじゃおねがいね。あ、ショボいマシンしか空いてないから.NET勘弁」
ε 「ヒギィ」
なんてな。
で、C++ネイティブでSQLite使って書きました。
ベタテキストのパースは正規表現が楽そうだったけど
むりくり strほげほげ 関数群でごりごり。
てかさー、こんくらいテメェんとこの新人君に食わせてやんなよー
# テイルズ・オブ・ヴェスペリア がそろそろ終盤。
# エステリーゼ様はどぉなっちゃうのでしょうかドチドチ♪