何となく Blog by Jitta
Microsoft .NET 考


Blog 利用状況
  • 投稿数 - 761
  • 記事 - 18
  • コメント - 36228
  • トラックバック - 222
  • IE7以前では、表示がおかしい。div の解釈に問題があるようだ。
    IE8の場合は、「互換」表示を OFF にしてください。
  • 検索エンジンで来られた方へ:
    お望みの情報は見つかりましたか? よろしければ、コメント欄にどのような情報を探していたのか、ご記入ください。
It's ME!
  • はなおか じった
  • 世界遺産の近くに住んでます。
  Microsoft MVP for Visual Developer ASP/ASP.NET 10, 2004 - 9, 2011









ネタもと→インテル スレッディング・ビルディング・ブロックの概要


さてさて。何でもかんでもマルチ スレッドに出来るか、というと、そうでもありません。マルチ スレッドの、向き不向きがあります。それをまず、検証するのが、今回のエントリ。

ちょっと考えたのですが、Quick Sort のアルゴリズムが説明しやすいかな?


{ 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, 34, 67, 11, 41, 99, 75, 21 }


{ { 1, 8, 4, 10, 65, 3, 5, 52, 31, 45, 9, 34, 67, 11, 41, 21 }, [75], { 87, 90, 78, 99 } }



と、ここで、考えます。これから行う事は、「1.ひとつの数値を選ぶ。」「2.その数値と全ての数値を比べ、大小によって分類する(ここでは、あえてソートと言わない)。」「3.分類された項目の数が1つになるまで、分類結果に対して1と2を繰り返す。」です。分類しなければならない範囲は異なりますが、しなければならない作業は同じです。つまり、for や while による繰り返し、あるいは再帰構文によって、表現できることがわかります。

マルチ スレッドが効率的に機能する(箇所のひとつ)のは、ここです。マルチで作業することが、互いに影響を及ぼしあわない。そして、それがそれなりに時間がかかるとき、です。


遅いけれども、アルゴリズムの説明によく用いられる、バブル ソートというソート方法があります。これは、マルチ スレッドで行う事で、高速化が見込めるでしょうか。検証します。

まず、アルゴリズムの確認です。バブル ソートは、配列の終端(あるいは始端)から2つの要素を比較し、より小さい方(大きい方)を配列の始端(終端)の方へ入れ替えます。1度配列の要素を全て比較すると、一番小さいものが始端にきています。これを、何度も繰り返します。

{ 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, 34, 67, 11, 41, 99, [ 75, 21 ] }


{ 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, 34, 67, 11, 41, [ 99, 21 ], 75 }
{ 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, 34, 67, 11, [ 41, 21 ], 99, 75 }
{ 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, 34, 67, [ 11, 21] , 41, 99, 75 }
{ 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, 34, [ 67, 11] , 21, 41, 99, 75 }
{ 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, [ 34, 11 ], 67, 21, 41, 99, 75 }
{ 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, [ 9, 11 ], 34, 67, 21, 41, 99, 75 }


{ 1, 8, 4, 10, 65, 3, 87, [ 5, 9 ], 90, 52, 31, 78, 45, 11, 34, 67, 21, 41, 99, 75 }
{ 1, 8, 4, 10, 65, [ 3, 5 ], 87, 9, 90, 52, 31, 78, 45, 11, 34, 67, 21, 41, 99, 75 }
{ [ 1, 3 ], 8, 4, 10, 65, 5, 87, 9, 90, 52, 31, 78, 45, 11, 34, 67, 21, 41, 99, 75 }


バブル ソートは、二重のループが使われます。ループするのだから、マルチ スレッドにすると速くなるでしょうか。

残念ながら、バブル ソートは、マルチ スレッド化出来ません。2回目のループで比較するのは、1回目のループで比較した結果だからです。内側のループも、外側のループも、ひとつ手前の回の結果が必要なので、順次処理するしかないのです。

このように、ある処理をするために、別の処理の結果が必要な場合、マルチ スレッド化することは出来ません。「必要」な処理が済むまで、出来ないのですから。



どの様なところに、マルチ スレッドが活きるか。それを見極めるために、まず、分析ということですね。実行するべき事同士が、結果に依存しないなら、並行に処理させられます。結果に依存するなら、平行には出来ません。やるべき事を把握していれば、何も難しくはありません。

投稿日時 : 2009年12月16日 22:40
  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/17 1:24


  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/17 7:05

    はい、1回目のループが済んだ所に2回目のループを適用する、というのは、考えました。少し前に、MSDN-F に行列の計算で、そのような物があり、1回目の計算(本エントリーのバブル ソートでは1回目のソート)をループの外でやっておく、というのも考えました。
    しかし、「後からの処理が、先の処理を追い越さない」ことを保証しなければなりません。TBB や OpenMP に、そういう機構が用意されているでしょうか。OpenMP は、MSDN Library にもリファレンスがあります。ざっと見て、そういったものを見つけられませんでした。
    処理順を設ける。ワーク バッファを用意する。バッファからは、処理順に取り出す。

  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/17 10:03

  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/17 13:50

  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/17 16:41

  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/17 22:09



  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/17 22:22
    OpenMP では、ordered ディレクティブにて、for ループに限っては、順序を指定できるようです。

    先行している比較入れ替えが n だとすると、n+2を後追いで実施できるわけですが、まぁ、やったとしたら、O(n(n-1)/2)が、O((n-t)(n-1)/2)になるのかな(tはスレッド数)。nとtが十分に近いなら効果があると思われますが、あまり効果なさそう...
  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/18 0:37
  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/18 10:55
    > winnyの件は、いい加減ではないですよ。現在、資料を調査中です。書けるだけまとまったら、また書きます。過去にも、そういうことしていますし。

    # 指摘するだけで、責めてはないです。そもそもそんな資格ないし

  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/18 22:14
    > 直列と並列で計算量って変わるのでしょうか?
    だから、Order 出したのが間違い。単位が違うやんorz





    > ソートの例でいうと「バブルソートを並列化できるか?」ではなく「並列化できるように、マージソートを採用する」といったように。

    最初に、「何でもかんでもマルチ スレッドに出来るか、というと、そうでもありません。マルチ スレッドの、向き不向きがあります。それをまず、検証するのが、今回のエントリ。」と、あるのですが。
    今回、バブル ソートを例にして、マルチ スレッドに向かないアルゴリズムがあることを示しました。

  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/19 1:09
    > 「計算量」じゃなくて、「1スレッドあたりの計算量」でした。



  • # マルチスレッドに向かないバブルソートを無理くり…
    Posted @ 2009/12/19 4:15
  • # マルチスレッドに向かないバブルソートを無理くり…
    Posted @ 2009/12/19 4:16
  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/19 6:24
    > 最初に、「何でもかんでもマルチ スレッドに出来るか、というと、そうでもありません。マルチ スレッドの、向き不向きがあります。それをまず、検証するのが、今回のエントリ。」と、あるのですが。

    # 私が心配性なだけですが

    しかしこんな時間でも Service Unavailable になるのか…orz
  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/20 23:02
    > バブルソートを並列化(ひとつの配列に対して、複数のスレッドがそれぞれバブルソートを実行)したら、ソート全体の計算量はn倍に増えますが、入れ換えの回数は変わらず、入れ換えを並列で処理できる分だけ、ソート全体の処理時間は短くなるように思います。

    ところが、実際には、スレッドの切り替えにはコストがかかります。また、実際に並列動作するのは、CPU のパイプライン並列化と違って、コア数の数に限られます。前のエントリーで検証したように、コア数+1~2を超えると、スレッド切り替えのコストの方が多くなることがあります。

    > 自分がわからないのは、その検証をどこまでまじめにやろうとしているのか、です。

    今回のエントリは、「マルチ スレッドでやる」ことを前提としておらず、「マルチ スレッドにむかないアルゴリズムがある」ことを検証することです。何らかの処理を、処理スピードを上げる必要があるなら、ほかのアプローチをすると思います。
    つまり、「マルチ スレッドにむかないアルゴリズムは、何かあるかな?バブル ソートなんてどうだろう」というアプローチでした。これが、「ソートを、できるだけ速く、CPU を効率的に使ってやりたい」であれば、他のアルゴリズムを探すでしょう。

    > しかしこんな時間でも Service Unavailable になるのか…orz

    ほかのエントリーに、海外からスパム コメントがついているので、そういう関係かとorz
  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/20 23:05

    > なので考える方向は逆ですね。

  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/21 1:39
    > コア数+1~2を超えると、スレッド切り替えのコストの方が多くなることがあります


  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/21 9:28


  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/22 2:42
    > ひとつの配列に対して、複数のスレッドがそれぞれバブルソートを実行


    > ただ並列にする処理の1つ1つがとても小さいので、有意な差は出るかどうかは謎。




  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/22 11:31

  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/23 21:46
    > ソートの話題につき、大前提として「コア数≧スレッド数」と思っていました。


    > どこまでをバブルソートと呼ぶかにもよるけど、交換の仕方を調整すると並列にできますよ、という例。

    バブル ソートの派生/改良版とは、ちょっと思えない...

    > ただ並列にする処理の1つ1つがとても小さいので、有意な差は出るかどうかは謎。

  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/24 22:09
  • # re: Multi-Core と Multi-Thread
    Posted @ 2009/12/24 22:27
    > ウチの非力なマシンでバブルソートしたところ以下の通り。


    { 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, 34, 67, 11, 41, 99, 75, 21 }

    スレッド1を [] で、スレッド2を <> で表すとします。

    { 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, 34, 67, 11, 41, [ 99, < 75, ] 21 > }

    このように比較してしまうと、なちゃさんがおっしゃる、「交換が混ざる」状態になります。そのため、必ず <> が [] の後追いにならなければなりません。

    { 1, 8, 4, 10, 65, 3, 87, 5, 90, 52, 31, 78, 45, 9, 34, 67, 11, [ 41, 99, ]< 75, 21 > }


    { [ 1, 8, ][ 4, 10, ][ 65, 3, ][ 87, 5, ][ 90, 52, ][ 31, 78, ][ 45, 9, ][ 34, 67, ][ 11, 41, ][ 99, 75, ] 21 }
    { 1, < 8, 4, >< 10, 65, >< 3, 87, >< 5, 90, >< 52, 31, >< 78, 45, >< 9, 34, >< 67, 11, >< 41, 99, >< 75, 21 > }

    奇数回目は [] を並列で、偶数回目は <> を並列でやれば、それぞれは交換範囲が重なっていません。ですから、安全に交換ができます。
  • # re: Multi-Core と Multi-Thread
    Posted @ 2010/06/24 19:09


  • # re: Multi-Core と Multi-Thread
    Posted @ 2010/07/04 16:51
    >しかし、「後からの処理が、先の処理を追い越さない」ことを保証しなければなりません。TBB や OpenMP に、そういう機構が用意されているでしょうか。


  • # It was dark when I w
    Posted @ 2018/11/04 18:36
    It was dark when I woke. This is a ray of sunhsine.