東方算程譚

Oriental Code Talk ── επιστημηが与太をこく、弾幕とは無縁のシロモノ。

目次

Blog 利用状況

ニュース

著作とお薦めの品々は

著作とお薦めの品々は
東方熱帯林へ。

あわせて読みたい

わんくま

  1. 東京勉強会#2
    C++/CLI カクテル・レシピ
  2. 東京勉強会#3
    template vs. generics
  3. 大阪勉強会#6
    C++むかしばなし
  4. 東京勉強会#7
    C++むかしばなし
  5. 東京勉強会#8
    STL/CLRによるGeneric Programming
  6. TechEd 2007 @YOKOHAMA
    C++・C++/CLI・C# 適材適所
  7. 東京勉強会#14
    Making of BOF
  8. 東京勉強会#15
    状態遷移
  9. 名古屋勉強会#2
    WinUnit - お気楽お手軽UnitTest

CodeZine

  1. Cで実現する「ぷちオブジェクト指向」
  2. CUnitによるテスト駆動開発
  3. SQLiteで組み込みDB体験(2007年版)
  4. C++/CLIによるCライブラリの.NET化
  5. C# 1.1からC# 3.0まで~言語仕様の進化
  6. BoostでC++0xのライブラリ「TR1」を先取りしよう (1)
  7. BoostでC++0xのライブラリ「TR1」を先取りしよう (2)
  8. BoostでC++0xのライブラリ「TR1」を先取りしよう (3)
  9. BoostでC++0xのライブラリ「TR1」を先取りしよう (4)
  10. BoostでC++0xのライブラリ「TR1」を先取りしよう (5)
  11. C/C++に対応した、もうひとつのUnitTestFramework ─ WinUnit
  12. SQLiteで"おこづかいちょう"
  13. STL/CLRツアーガイド
  14. マージ・ソート : 巨大データのソート法
  15. ヒープソートのアルゴリズム
  16. C++0xの新機能「ラムダ式」を次期Visual Studioでいち早く試す
  17. .NETでマンデルブロ集合を描く
  18. .NETでマンデルブロ集合を描く(後日談)
  19. C++/CLI : とある文字列の相互変換(コンバージョン)
  20. インテルTBBによる選択ソートの高速化
  21. インテルTBB3.0 によるパイプライン処理
  22. Visual C++ 2010に追加されたSTLアルゴリズム
  23. Visual C++ 2010に追加されたSTLコンテナ「forward_list」
  24. shared_ptrによるObserverパターンの実装
  25. .NETでマンデルブロ集合を描く(番外編) ── OpenCLで超並列コンピューティング
  26. StateパターンでCSVを読む
  27. 状態遷移表からStateパターンを自動生成する
  28. 「ソートも、サーチも、あるんだよ」~標準C++ライブラリにみるアルゴリズムの面白さ
  29. インテルTBBの同期メカニズム
  30. なぜsetを使っちゃいけないの?
  31. WPFアプリケーションで腕試し ~C++でもWPFアプリを
  32. C++11 : スレッド・ライブラリひとめぐり
  33. Google製のC++ Unit Test Framework「Google Test」を使ってみる
  34. メールでデータベースを更新するココロミ
  35. Visitorパターンで遊んでみたよ
  36. Collection 2題:「WPFにバインドできる辞書」と「重複を許す検索set」
  37. Visual C++ 2012:stateless-lambdaとSQLiteのぷち拡張
  38. 「Visual C++ Compiler November 2012 CTP」で追加された6つの新機能

@IT

  1. Vista時代のVisual C++の流儀(前編)Vista到来。既存C/C++資産の.NET化を始めよう!
  2. Vista時代のVisual C++の流儀(中編)MFCから.NETへの実践的移行計画
  3. Vista時代のVisual C++の流儀(後編) STL/CLRによるDocument/Viewアーキテクチャ
  4. C++開発者のための単体テスト入門 第1回 C++開発者の皆さん。テスト、ちゃんとしていますか?
  5. C++開発者のための単体テスト入門 第2回 C++アプリケーションの効率的なテスト手法(CppUnit編)
  6. C++開発者のための単体テスト入門 第3回 C++アプリケーションの効率的なテスト手法(NUnit編)

AWARDS


Microsoft MVP
for Visual Developer - Visual C++


Wankuma MVP
for いぢわる C++


Nyantora MVP
for こくまろ中国茶

Xbox

Links

記事カテゴリ

書庫

日記カテゴリ

夏も初めのけだるい朝は 趣味のコードとたわむれる

なぜかマージソート。

メモリを食わずにファイルIOだけでもソートできる優れもののアルゴリズム。時間計算量はΟ(logN)。

データの振り分けと併合を繰り返してソートを行います。
元データ: 1 3|2 5|4 7|6 9|8|0 13|12|11
※ | はその位置で昇順になっていないことを表します。
ファイルを二本用意し、| の位置で出力先を切り替えながら出力します:
ファイル1: 1 3 4 7 8|12
ファイル2: 2 5 6 9|0 13|11
次にこの二本を読み、より小さいほうを取り出して一本の元データに出力します:
元データ: 1 2 3 4 5 6 7 8 9|0 12 13|11
| で区切られた要素列(これを'連'という)はソートされてて、
振り分けと併合によって連の数が減っていきます。
最終的に連の数が1になればソート完了。

C#で書いてみた。ファイルIOはめんどっちーのでBCLコレクションで:
using System;
using System.Collections.Generic;

  class Program {

    // 二つのキューをマージ(併合)して一つにする
    private static void merge<T>(Queue<T> in_q1, Queue<T> in_q2, ICollection<T> out_c) where T : IComparable<T> {
      // 入力である二つのキューが共に要素を持っている間
      while ( in_q1.Count != 0 && in_q2.Count != 0 ) {
        // より小さい要素を取り出して出力する
        out_c.Add(( in_q1.Peek().CompareTo(in_q2.Peek()) < 0 )? in_q1.Dequeue():in_q2.Dequeue());
      }
      // キューに残る(取り出されなかった)要素を出力する
      while ( in_q1.Count != 0 ) { out_c.Add(in_q1.Dequeue()); }
      while ( in_q2.Count != 0 ) { out_c.Add(in_q2.Dequeue()); }
    }

    // 一つの入力列を二つのキューに分割する
    private static bool split<T>(ICollection<T> in_c, Queue<T> out_c1, Queue<T> out_c2) where T : IComparable<T> {
      T last = default(T);
      Queue<T> out_c = out_c1;
      bool switched = false;
      foreach ( T current in in_c ) {
        // 直前の要素より小さな要素を読み込んだら出力キューを切り替える
        if ( last != null && current.CompareTo(last) < 0 ) {
          out_c = (out_c == out_c1) ? out_c2 : out_c1;
        }
        out_c.Enqueue(last = current);
        // 一度でも切り替えが起こったらswitchedをtrueにする
        if ( !switched ) switched = (out_c == out_c2);
      }
      return switched;
    }

    public static void print<T>(string head, IEnumerable<T> collection) {
      Console.Write("{0} : ", head);
      foreach ( T item in collection ) {
        Console.Write("{0} ", item);
      }
      Console.WriteLine();
    }

    public static void merge_sort<T>(ICollection<T> data) where T : IComparable<T> {
      Queue<T> q1 = new Queue<T>();
      Queue<T> q2 = new Queue<T>();
      while ( split(data, q1, q2) ) {
        Console.WriteLine("--------------------------------");
        print("input  ", data);
        Console.WriteLine("split:");
        print("queue1 ", q1);
        print("queue2 ", q2);
        data.Clear();
        merge(q1, q2, data);
        Console.WriteLine("merge:");
        print("output ", data);
        q1.Clear();
        q2.Clear();
      }
    }

    public static void Main() {
      List<int> data = new List<int>(new int[] { 1, 3, 2, 5, 4, 7, 6, 9, 8, 0, 13, 12, 11 });
      merge_sort(data);
      Console.WriteLine("--------------------------------");
      print("result ", data);
    }

  }

...のんちゃんがVBがんがってるらしいから、
僕もグチこぼしてばっかじゃなくVBでも書いてみる:
Imports System
Imports System.Collections.Generic

Module Program

    ' 二つのキューをマージ(併合)して一つにする
    Private Sub merge(Of T As IComparable(Of T))(ByVal in_q1 As Queue(Of T), ByVal in_q2 As Queue(Of T), ByVal out_c As ICollection(Of T))
      ' 入力である二つのキューが共に要素を持っている間
      While in_q1.Count <> 0 AndAlso in_q2.Count <> 0
        ' より小さい要素を取り出して出力する
        If in_q1.Peek().CompareTo(in_q2.Peek()) < 0 Then
          out_c.Add(in_q1.Dequeue())
        Else
          out_c.Add(in_q2.Dequeue())
        End If
      End While
      ' キューに残る(取り出されなかった)要素を出力する
      While in_q1.Count <> 0
        out_c.Add(in_q1.Dequeue())
      End While
      While in_q2.Count <> 0
        out_c.Add(in_q2.Dequeue())
      End While
    End Sub

    ' 一つの入力列を二つのキューに分割する
    Private Function split(Of T As IComparable(Of T))(ByVal in_c As ICollection(Of T), ByVal out_q1 As Queue(Of T), ByVal out_q2 As Queue(Of T)) As Boolean
      Dim last As T = Nothing
      Dim out_q As Queue(Of T) = out_q1
      Dim switched As Boolean = False
      For Each current As T In in_c
        ' 直前の要素より小さな要素を読み込んだら出力キューを切り替える
        If last IsNot Nothing AndAlso current.CompareTo(last) < 0 Then
          If out_q Is out_q1 Then
            out_q = out_q2
            ' 一度でも切り替えが起こったらswitchedをtrueにする
            switched = True
          Else
            out_q = out_q1
          End If
        End If
        last = current
        out_q.Enqueue(current)
      Next
      Return switched
    End Function

    Public Sub print(Of T)(ByVal head As String, ByVal collection As IEnumerable(Of T))
      Console.Write("{0} : ", head)
      For Each item As T In collection
        Console.Write("{0} ", item)
      Next
      Console.WriteLine()
    End Sub

    Public Sub merge_sort(Of T As IComparable(Of T))(ByVal data As ICollection(Of T))
      Dim q1 As New Queue(Of T)
      Dim q2 As New Queue(Of T)
      While split(data, q1, q2)
        Console.WriteLine("-------------------------")
        print("input  ", data)
        Console.WriteLine("split:")
        print("queue1 ", q1)
        print("queue2 ", q2)
        data.Clear()
        merge(q1, q2, data)
        Console.WriteLine("merge:")
        print("output ", data)
        q1.Clear()
        q2.Clear()
      End While
    End Sub

    Sub Main()
      Dim data As New List(Of Integer)(New Integer() {1, 3, 2, 5, 4, 7, 6, 9, 8, 0, 13, 12, 11})
      merge_sort(data)
      Console.WriteLine("-------------------------")
      print("result ", data)
    End Sub

End Module

投稿日時 : 2008年7月5日 12:02

コメントを追加

# re: 夏も初めのけだるい朝は 趣味のコードとたわむれる 2008/07/05 12:21 bleis-tift

log(N)じゃなくてN log(N)ですね

# re: 夏も初めのけだるい朝は 趣味のコードとたわむれる 2008/07/05 12:26 επιστημη

20年ほど前のデキゴトにインスパイアされたネタです。

その昔、UNIX上で数十万レコード(固定長)のバイナリデータを可及的速やかにソートしろって案件がありまして。
とにかく速くが至上命令。

もうね、シークランプ点きっぱでカリカリカリカリやってんだけど10分たっても終わらねえ。
納期間際でこの問題だけが残り、マネージャ連中が頭抱えて僕んとこに相談しにきました。

そこの担当呼びつけてコード読ませてもらったんですけどね。
その阿呆、早いソートと聞いて延髄反射し、ディスク上でクイックソートやってやがった。
あのさ、クイックソートは確かに速いけどディスクにランダムアクセスさせちゃあかんでしょ。

ってわけで、数百行のコードを捨ててマージソートに書き直しました。
できるだけメモリに読み込んでソートし、連を減らしておくんですけどね。
...10秒でソート完了、と。

# re: 夏も初めのけだるい朝は 趣味のコードとたわむれる 2008/07/05 12:29 επιστημη

> N log(N)

ですです。
一回の振り分け/併合で連が約半分になるんで O(logN),
振り分け/併合がO(N)、その積っすねー

# re: 夏も初めのけだるい朝は 趣味のコードとたわむれる 2008/07/05 15:28 ゆーち

ディスク上でクイックソート
ある意味すごい。(・∀・)

あちきもDOS時代、ソート作ってNECのアプリ本で販売してましたw
一本しか売れなかったwww
#どこぞの臨床試験データで使われた模様。

可変長テキストファイルで、24ビットレコード数まで対応してました。
自前のメモリアロケータと仮想メモリこさえてました
なつかしす。(遠い目
わりと速かったっす。(^-^)

# re: 夏も初めのけだるい朝は 趣味のコードとたわむれる 2008/07/05 18:15 non

うお!!!!
ぱぱがVB書いてる!!!
のんもパパに負けてられません(にやにや

# re: 夏も初めのけだるい朝は 趣味のコードとたわむれる 2008/07/05 18:24 επιστημη

ふっふっふ、そう簡単には負けませんよ(立場上)♪

# re: 夏も初めのけだるい朝は 趣味のコードとたわむれる 2008/07/05 19:12 ネタ好き未記入

C++/CLI「επιστημηさんまで私を忘れたのですか?」

# re: 夏も初めのけだるい朝は 趣味のコードとたわむれる 2008/07/05 19:16 επιστημη

C#で書けたんならいぃぢゃーん...
# ま、やってはみるけどさ

タイトル
名前
URL
コメント