2009-09-26 北陸Scala第1回開催
2009-04-04 第十四回java-ja勉強会 - 第1回チキチキ地方巡業withひがやすを飲み会in富山開催
2009-03-20 わんくま大阪勉強会#28 「ジェネリクスを使おう！」
2008-11-08 わんくま富山勉強会#1 開催
2008-08-09 わんくま東京勉強会#23 「C#登場前夜」
2008-04-01 *で始まるタイトルはエイプリルフールネタです
2008-01-26 わんくま東京勉強会#16
「ライブプログラミング」
2007-12-08 わんくま名古屋勉強会#1
「わんくま初めてのJava」
2007-07-28 開店

Java開発者募集中
経歴不問
腕に自信のある方
富山市内
(株)凪瀬アーキテクツ

アクセサリ

凪瀬悠輝(なぎせゆうき)

Java技術者
お茶好き。カクテル好き。
所属は(株)凪瀬アーキテクツ
Twitter:@nagise

書庫

日記カテゴリ

システム開発において、その規模や複雑さを測ることが難しいことは皆さんよくご承知のことかと思います。
見積もりの不正確さはデスマーチの元にもなりますし、契約金の多寡にも関わりますからシステム開発をする人間してみれば悲願のようなものであると思います。

大阪勉強会#12の帰りの電車で考えていたことなのですが、うまくやればStep数にくらべ精度の高いシステム規模を示す数値が得られるかもしれません。

Step数とシステム規模は確かに正の相関性があるのですが、誤差が大きく、見積もりに使えないという見解でした。では、その誤差の元になるものはなんなのでしょうか？

ひとつは、コードクローンの存在です。構造化がなされていないプログラムでは随所にコピー＆ペーストで作られたコードクローンが存在します。
コードクローンは、システム規模の見積もりに深刻な影を落としています。 Step数が多いほど規模は大きいと思われるわけですが、構造化の程度がよいほどStep数は減るという背反関係にあるためです。

もうひとつは自動生成コードの存在です。Javaの場合、構造体的な使い方をされるBeanと呼ばれるクラスには大量のSetter, getterが存在し、コード量を水増ししています。
また、EclipseのプラグインのVisualEditorなどのGUIデザイン支援ツールを使うと、これまた自動生成コードが大量に吐き出されます。こういったコードは手作業で記述するコードと同列の尺度で工数を測れません。

圧縮してみてはどうか？

ふと閃いたアイデアは、辞書式の圧縮アルゴリズムを用いてclassファイルを圧縮したらどうか？というものでした。

コードクローンが多いほど、辞書式の圧縮が効きやすく、純粋なシステム規模に近い値を出せるのではないだろうか―。
自動生成コードに対して、アノテーションによるマーキングを施し、除外するようにした上で、ロジック部分に対して一度辞書式の圧縮を掛けるのです。

圧縮は例えば既存のZIPなどの圧縮方式を利用してもそれなりの値は出るかもしれません。このあたりは実際のコードを用意して実験しないとなんとも言えないですね。
クラス名やメソッド名などのシンボルは辞書式に圧縮すれば嵩が減るため、名前の長短は結果に大きな影響は与えないのではないかと考えています。しかし、問題になるとすれば文字列リテラルなのではないかと思っています。

classファイルを対象に処理をするか、あるいは抽象構文木を対象に処理をすれば求める値がでる気がします。その際に、クラス名などのシンボルを捨てる、文字列リテラルを捨てる、とすれば精度のよいシステム規模のモノサシが得られるのかもしれませんね。

投稿日時 : 2007年8月19日 19:01

タイトル		タイトルを入力してください
名前		名前を入力してください
Url
コメントコメントを入力してください
名前をブラウザに記憶する

目次

書庫

日記カテゴリ

圧縮してみてはどうか？