2021/4/28 に東京大学で開催された<AIセミナーシリーズ> 「ArmCPUにおけるSIMDを用いた高速計算入門」講演会で使用した資料になります。 2014年6月に開催されたSSII2014(http://www.ssii.jp/)のチュートリアル講演用資料です. 使用したコード等はこちら. https://github.com/norishigefukushima/SSII2014 アブストラクト 「CPUのクロック数が年月とともに増加する時代は終わり、プログラムの高速化をCPUの性能向上に任せることのできるフリーランチの時代は終わりを迎えています。しかしムーアの法則はいまだに続いており、CPUはマルチコア化、SIMD化という形で高性能化が続いています。本チュートリアルでは、計算コストの高い画像処理を高速化するために、CPUの能力をあますことなく引き出す、マルチコアプログラミング
Juliaでの並列計算に関する調査メモ。Juliaでの並列計算の概要Juliaでのマルチプロセッシング環境は、メッセージパッシングに基づいている。MPIなどの通常のメッセージパッシングは、プロセス間でデータや命令などを相互にやりとりする。しかし、Juliaのメッセージパッシングの実装はあるプロセスから他のプロセスへの一方通行であることが特色となっている。そのため、ユーザは片方のプロセスの管理だけを行えば良い。 あるプロセスから他のプロセスへのメッセージとして重要なのが、"remote call"(remotecall関数)と"remote reference"(fetch関数)である。これらはそれぞれ、「あるプロセスから他のプロセスへの処理の指示」、「指示された処理を行ったプロセスでの処理結果を指示を出したプロセスが参照」に対応する。 remote call(remotecall関数)
http://peercast.kymt.me/ Peercastって、Peercastをインストールしないと見れないのでどんな配信やってんだよって思うこと多いし、実際そのせいでPeercastリスナーの大部分が失われてる気がする。これは機会損失だ。そこで各配信の映像情報をキャプチャして一覧してくれるサイト作ってみた。 仕組み 4つのスレッドで最大4つの配信にPeercastのプロトコルでアクセスし、先頭8秒後の1フレームを取得する。こうしたのは最初の8秒ぐらいはバッファのせいで映像情報が乱れていることが多かったから。 実装Rubyのparallelライブラリがすごく便利だった。こんな感じにするだけで並列実行できる。 require 'parallel' Parallel.each([1,2,3,4,5], :in_threads => 2){ |number| # no operati
BSPlib related papers This page contains references to papers concerning the implementation of the Oxford BSP toolset. The papers are grouped as follows: Introductory papers on BSP Papers on the implementation of the toolset Papers on the Oxford BSP toolsetprofiling tools High-level libraries built upon BSPlib A large collection of BSP related papers from colleagues at Oxford can also be found in
The bulk synchronous parallel (BSP) abstract computer is a bridging model for designing parallel algorithms.It issimilar to the parallel random accessmachine (PRAM) model, but unlike PRAM, BSP does not take communication and synchronization for granted. In fact, quantifying the requisite synchronization and communication is an important part of analyzing a BSP algorithm. The BSP model was devel
どうも,実は今年から開発チームにjoinしていた中川です.可愛い犬の写真がなかったので,可愛いマスコットの画像を貼っておきます. 最近MapReduceとかその実装であるHadoopとかをよく聞くようになりました.これはつまり,それだけ大量のデータをなんとか処理したいという要望があるからだと思います.しかし当たり前ですが,MapReduceは銀の弾丸ではありません. ということで,最近気になっているMapReduceとは違ったアプローチを取っている分散処理基盤について,社内のTechTalkで話した内容を簡単にまとめて紹介したいと思います. Bulk Sychronous Parallel このアルゴリズム自体は1990年に誕生したものです.長いのでBSPと書きます.さて,グラフから最短経路を求める時,MapReduceは使えるでしょうか?このような論文が出るくらいですから出来ないことはあ

GNU parallel is a shell tool for executing jobs in parallel using one or more computers. A job can be a single command or a small script that has to be run for each of thelines in the input. The typical input is a list of files, a list of hosts, a list of users, a list of URLs, or a list of tables. A job can also be a command that reads from a pipe. GNU parallel can then split the input and pipe
NASA Advanced Supercomputing (NAS) Division World-class modeling,simulation, and supercomputing in support of theNASA mission TheNAS Parallel Benchmarks (NPB) are a small set of programs designed to help evaluate the performance of parallel supercomputers. The benchmarks are derived from computational fluid dynamics (CFD) applications and consist of five kernels and three pseudo-applications in
The OpenCL registry contains formatted specifications of the OpenCLAPI, OpenCL Cprogramming language, OpenCL SPIR-V environment, and OpenCL extensions. The OpenCL registry also includes header files, links to reference pages, reference cards, and other related documentation. Theasciidoctor source for the specifications in this registry is available in the OpenCL-DocsGitHub repository. This reg

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く