紹介論文• Core VectorMachines: Fast SVM Training on Very Large Data Sets – Ivor V. Tsang, James T. Kwok, Pak-Ming Cheung – [JMLR ’05]• 要旨 – SVMの最適化問題を計算幾何学の問題(MEB)に 帰着 – コアセットを用いたMEBの高速近似解法を流用 – SVMの高速化を実現 2
SVMの計算量・αについての凸二次計画問題通常の内点法を用いると各ステップで Kの逆行列が必要となる データ数をm とすると 、Kは m × m の行列 時間計算量 , 空間計算量 激重 激重・機械学習ではデータ数 m が大きい場合がほとんど。内点法を用いた最適化は 実用的には使えない。・様々な高速化が提案されている Ex. Chunking, SMO , RSVM ,…. 実験的に time 程度・紹介論文では 近似アルゴリズムでprovableに time 11
参考文献年代順1. M. Bãdoiu& K. L. Clarkson. “Optimal core sets for balls”, Computational Geometry, 2002.2. I. W. Tsang, J. T. Kwok & P. Cheung. “Core Vector Machines: Fast SVM Training on Very Large Data Sets”, JMLR,2005.3. I. W. Tsang, J. T. Kwok & KT. Lai. “Core Vector Regression for Very Large Regression Problems”, ICML, 2005.4. I. W. Tsang, A. Kocsor, J. T. Kwok. “Simpler core vector machines with enclosing balls”, ICML, 2007.5. P. Rai, H. Daum´e III, S. Venkatasubramanian. “Streamed Learning: One-Pass SVMs” , IJCAI , 2009 41