IBSwitchGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバ構成{ (GPUサーバ x16 + IB SW x 2) x 2 } x 4 + IB SW x 2IBSwitchIBSwitchIBSwitchIBSwitchIBSwitchFDR (56Gbps)GPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバGPUサーバグループ
24.
ベンチマーク LINPACK Benchmarkhttps://www.preferred-networks.jp/ja/news/pr20171114「Preferred Networksのプライベート・スーパーコンピュータがTop 500リストのIndustry領域で国内1位に認定」 ImageNet in 15 min. https://www.preferred-networks.jp/ja/news/pr20171110「深層学習の学習速度において世界最速を実現」
Accurate, Large MinibatchSGD: TrainingImageNet in 1 Hour [Goyal et.al 2017]With these simple techniques, our Caffe2-based system trains ResNet- 50with a minibatch size of 8192 on 256 GPUs in one hour, while matchingsmall minibatch accuracy. Using commodity hardware, ourimplementation achieves ∼90% scaling efficiency when moving from 8to 256 GPUs.