東方算程譚

Oriental Code Talk ── επιστημηが与太をこく、弾幕とは無縁のシロモノ。

目次

Blog 利用状況

ニュース

著作とお薦めの品々は

著作とお薦めの品々は
東方熱帯林へ。

あわせて読みたい

わんくま

  1. 東京勉強会#2
    C++/CLI カクテル・レシピ
  2. 東京勉強会#3
    template vs. generics
  3. 大阪勉強会#6
    C++むかしばなし
  4. 東京勉強会#7
    C++むかしばなし
  5. 東京勉強会#8
    STL/CLRによるGeneric Programming
  6. TechEd 2007 @YOKOHAMA
    C++・C++/CLI・C# 適材適所
  7. 東京勉強会#14
    Making of BOF
  8. 東京勉強会#15
    状態遷移
  9. 名古屋勉強会#2
    WinUnit - お気楽お手軽UnitTest

CodeZine

  1. Cで実現する「ぷちオブジェクト指向」
  2. CUnitによるテスト駆動開発
  3. SQLiteで組み込みDB体験(2007年版)
  4. C++/CLIによるCライブラリの.NET化
  5. C# 1.1からC# 3.0まで~言語仕様の進化
  6. BoostでC++0xのライブラリ「TR1」を先取りしよう (1)
  7. BoostでC++0xのライブラリ「TR1」を先取りしよう (2)
  8. BoostでC++0xのライブラリ「TR1」を先取りしよう (3)
  9. BoostでC++0xのライブラリ「TR1」を先取りしよう (4)
  10. BoostでC++0xのライブラリ「TR1」を先取りしよう (5)
  11. C/C++に対応した、もうひとつのUnitTestFramework ─ WinUnit
  12. SQLiteで"おこづかいちょう"
  13. STL/CLRツアーガイド
  14. マージ・ソート : 巨大データのソート法
  15. ヒープソートのアルゴリズム
  16. C++0xの新機能「ラムダ式」を次期Visual Studioでいち早く試す
  17. .NETでマンデルブロ集合を描く
  18. .NETでマンデルブロ集合を描く(後日談)
  19. C++/CLI : とある文字列の相互変換(コンバージョン)
  20. インテルTBBによる選択ソートの高速化
  21. インテルTBB3.0 によるパイプライン処理
  22. Visual C++ 2010に追加されたSTLアルゴリズム
  23. Visual C++ 2010に追加されたSTLコンテナ「forward_list」
  24. shared_ptrによるObserverパターンの実装
  25. .NETでマンデルブロ集合を描く(番外編) ── OpenCLで超並列コンピューティング
  26. StateパターンでCSVを読む
  27. 状態遷移表からStateパターンを自動生成する
  28. 「ソートも、サーチも、あるんだよ」~標準C++ライブラリにみるアルゴリズムの面白さ
  29. インテルTBBの同期メカニズム
  30. なぜsetを使っちゃいけないの?
  31. WPFアプリケーションで腕試し ~C++でもWPFアプリを
  32. C++11 : スレッド・ライブラリひとめぐり
  33. Google製のC++ Unit Test Framework「Google Test」を使ってみる
  34. メールでデータベースを更新するココロミ
  35. Visitorパターンで遊んでみたよ
  36. Collection 2題:「WPFにバインドできる辞書」と「重複を許す検索set」
  37. Visual C++ 2012:stateless-lambdaとSQLiteのぷち拡張
  38. 「Visual C++ Compiler November 2012 CTP」で追加された6つの新機能

@IT

  1. Vista時代のVisual C++の流儀(前編)Vista到来。既存C/C++資産の.NET化を始めよう!
  2. Vista時代のVisual C++の流儀(中編)MFCから.NETへの実践的移行計画
  3. Vista時代のVisual C++の流儀(後編) STL/CLRによるDocument/Viewアーキテクチャ
  4. C++開発者のための単体テスト入門 第1回 C++開発者の皆さん。テスト、ちゃんとしていますか?
  5. C++開発者のための単体テスト入門 第2回 C++アプリケーションの効率的なテスト手法(CppUnit編)
  6. C++開発者のための単体テスト入門 第3回 C++アプリケーションの効率的なテスト手法(NUnit編)

AWARDS


Microsoft MVP
for Visual Developer - Visual C++


Wankuma MVP
for いぢわる C++


Nyantora MVP
for こくまろ中国茶

Xbox

Links

記事カテゴリ

書庫

日記カテゴリ

TBBであそんでみたよ

インテル・ソフトウェア・カンファレンスに行ってきたので、
ものは試しに Intel Threading Building Blocks 2.2 for Open Source ゆーのんで
ちょびっとだけ遊んでみた。

/*
 cl -EHsc -openmp -MD -I<TBB_INC_DIR> sort.cpp -link -libpath:<TBB_LIB_DIR>
 */

#include <windows.h> // GetTickCount
#include <algorithm> // std::sort
#include <iostream>  // std::cout,endl
#include <tbb/parallel_sort.h> // tbb::parallel_sort

void execute(int N) {
  std::cout << "N = " << N << std::endl;
  int *data = new int[N];
  long sum = 0;
  // 地味に単スレッド
  {
  srand(1);
  std::cout << "std::sort ..." << std::flush;
  for ( int j = 0; j < 10; ++j ) {
    for ( int i = 0; i < N; ++i ) data[i] = std::rand();
    long t = GetTickCount();
    std::sort(data, data+N);
    t = GetTickCount() - t;
    sum += t;
  }
  std::cout << sum/10.0 << std::endl;
  sum = 0;
  }

  // 派手に複スレッド
  {
  srand(1);
  std::cout << "tbb::parallel_sort ..." << std::flush;
  for ( int j = 0; j < 10; ++j ) {
    for ( int i = 0; i < N; ++i ) data[i] = std::rand();
    long t = GetTickCount();
    tbb::parallel_sort(data, data+N);
    t = GetTickCount() - t;
    sum += t;
  }
  std::cout << sum/10.0 << std::endl;
  sum = 0;
  }
  delete[] data;
}

int main() {
  int N[] = { 100000, 200000, 400000, 800000, 1600000, 3200000, 6400000 };
  std::for_each(N, N+7, &execute);
}

僕とこの Athlon dual-core では
N = 6400000
std::sort ...1667.7
tbb::parallel_sort ...1180.9
30パーほど速いポ。

parallel_sortがスケーラブルなら quad-core とか quad-core/HT とかだと
さらに速くなるハズ。 遊び方メモ/ソース/runtime-DLL などなど、
SkyDriveに置いたので試してくれると嬉しいわ > Phenom, Core2Quad, i7 なひと

投稿日時 : 2009年10月3日 0:39

コメントを追加

# re: TBBであそんでみたよ 2009/10/03 21:20

// Phenom II 940(4[cores],3.0[GHz])
// WOW64, SkyDriveビルド済みsort.exeにて
N = 6400000
std::sort ...1090.3
tbb::parallel_sort ...471.1

TBBのビルド済みライブラリは"IA32","IA64"向けしかないみたいで、
AMD64ではライブラリからビルドせんとネイティブなテストはできなさそうでした。
gmakeとか用意してないのでとりあえずはこれだけペタリ(´・ω・`)

# re: TBBであそんでみたよ 2009/10/03 22:13 επιστημη

↑ありがとさんです。

おぉ、ちゃんとスケーラブルに速くなってるですねー♪

# re: TBBであそんでみたよ 2009/10/05 2:54

お詫びと訂正(´・ω・`)
TBBのビルド済みzipに入ってるの、IA64じゃなくてIntel 64(=EM64T)でした…。
# EM64T→Intel 64に名前変えてたのを知らずにIntel 64をIA64の事かと誤解してました。

と、いうわけで同環境にてVS2010(x64)で
sort.exeをmemo.txtのコマンドラインのみでビルドして…
N = 6400000
std::sort ...1393.2
tbb::parallel_sort ...574

ついでに-Oxを付けてみると
N = 6400000
std::sort ...450.7
tbb::parallel_sort ...159.2

とな結果でした。
# tbb.dllはtbb22_20090809ossのvc9ビルド済みを使っちゃいました=w=;
# IA64がどうとか嘘書いてごめんなさいorz

# This can be a good deal quicker when compared with trying to click on the X. 2017/09/06 22:18 This can be a good deal quicker when compared with

This can be a good deal quicker when compared with trying to
click on the X.

タイトル
名前
URL
コメント