忘れたころに再燃させる（日本語コードについて）

本ブログは更新を停止しました。Aerieをよろしくお願いいたします。

忘れたころに再燃させる（日本語コードについて）

変数名とかに日本語を使うことについて、ちょっと違った切り口から。

日本語を使うことを容認して、中国語やアラビア語を使ってはならないというのは不公平であろう。
もちろん、敢えて日本で使う理由はないが、中国やアラブのプログラマは、当然使ってよい。
そうすると、変数名やメソッド名などの名前に使える文字列は、任意のUnicode文字列でなければならない。

Unicodeとなるとついて回るのが、合成文字の扱いである。
変数を定義するところでは合成済み文字（単一のUnicode文字）を使っていて、参照するところでは複数の文字が書いてあったらどうだろうか。
これは同じ変数名とみなすべきか否か。
もし同じ変数名としなければならないとしたら、合成文字を解釈するエンジンを処理系に内蔵しなければならない。
OSが持つエンジンを利用すると、処理系を走らせるOSによって、コンパイルできたりできなかったりするコードができてしまうからだ。
これは、OSでさえ完全な文字処理を実装できていないところ、処理系実装者に大きな負担となってのしかかる。

なお、この問題は、コメントと文字列定数にUnicode文字を使う場合には発生しない。
コメントは他の文字と照合する必要はないし、文字列比較の場合にはOSが提供するエンジンを使ってよいからである（その場合、コンパイルした後のプログラムが動くOSと動かないOSが出てくることになる）。
コンパイルと実行を常に同時に行うインタプリタ系言語処理系では、変数名のマッチングも実行時にやるのだから、OSの機構を使っても良いかもしれないが。

とは言うものの。
処理系実装者がどれだけ苦労しようが、使う側としては知ったこっちゃないのは確かである。
我々プログラマが、既存の処理系を使って日本語コードを書いたからといって、それが今から処理系製作者の負担としてフィードバックされるわけではない。
だからこれは、変数名等に日本語を使うべきか否かという問題に対するコメントではないし、英語を使えということでもない。この文脈で言えば、ローマ字は構わないのだから。
だが、これから登場する、あるいはバージョンアップする処理系に対して、任意のUnicode文字のサポートを要求すると、中の人は大変だろうなぁ、と思うだけだ。

投稿日時 : 2008年1月15日 11:24

Feedback

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 12:08 Mr.T

Mr.Tです、こんにちは。

アラビア語って、右から左に読むんじゃ
なかったでしたっけ？
変数名だけ逆読みってw

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 12:11 シャノン

> アラビア語って、右から左に読むんじゃ
> なかったでしたっけ？

そうそう。
そのあたりは国際化対応するときにも問題になりそうです。

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 13:24 凪瀬

右から左なんてまだ可愛いほうですよ。
日本人がもうちょっと自国文化を強く主張するなら、
テキストエディタには縦書き機能も備える必要が出るわけで。

> もし同じ変数名としなければならないとしたら、
> 合成文字を解釈するエンジンを処理系に内蔵しなければならない。

同じ変数名とはしないでしょうな。
似て非なる話に、全角アルファベットというのがありますね。
AとＡは意味的には一緒なんだけど、歴史的事情から別の文字コードの
別の文字として扱われるわけですが、これを同じ変数としなければならないか？

もし、そのあたりを同一視したいのであれば、プログラム言語に
シソーラス検索のような機能を持たせる必要が出てくる。
これは、ロジックを明確に表現するというプログラミング言語の
要件からすれば、不要な機能といえるのではないでしょうか。
むしろ、こんな機能性を持たせると曖昧なプログラミング言語になってしまう。

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 13:46 シャノン

> AとＡは意味的には一緒なんだけど、歴史的事情から別の文字コードの
> 別の文字として扱われるわけですが、これを同じ変数としなければならないか？

そのくらいなら構わないでしょうけど、やりはじめるとキリがないですからね。1 と一と壱とか。果ては one も、とか？
ただ、大文字と小文字を区別しない言語はありますね。
大文字と小文字を区別しない言語を肯定するならば、日本人としては、ひらがなとカタカナを区別しない言語をぜひ、とか言い出すと泥沼。

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 14:44 凪瀬

日本には半角カタカナという鬼っ子がいますしねぇ。
歴史的に存在しちゃってるから残っているけど消し去りたい物のひとつですな。

タイトル		タイトルを入力してください
名前		名前を入力してください
Url
コメントコメントを入力してください
名前をブラウザに記憶する

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 12:08 Mr.T

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 12:11 シャノン

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 13:24 凪瀬

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 13:46 シャノン

# re: 忘れたころに再燃させる（日本語コードについて） 2008/01/15 14:44 凪瀬

Out of Memory

目次

Blog 利用状況

ニュース

カレンダー

中の人

リンク

書庫

日記カテゴリ

忘れたころに再燃させる（日本語コードについて）

Feedback