Movatterモバイル変換

はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数！

アプリで開く

はてなブックマーク

閉じる

タグ

関連タグで絞り込む (5)

タグの絞り込みを解除

強化学習に関するwrssのブックマーク (2)

AlphaGo Zeroの論文の要約 : ブログ
Alpha Go Zeroが自己学習のみで過去最強になったというニュースが出たのでその元論文を読み、要約をしました。まず感想を述べると、過去数千年にわたって蓄積してきた知識をAIが数時間で発見することに対する気持ち良さがありました。人間などクソ食らえと思っておりますので、こう言うニュースはとてもスッキリします。そして人間の発見していない打ち筋の発見にも感動しました。これこそがAIの真髄だと信じています。人間が見えていないものをAIが見つける、僕もいつかそんなことをしてみたいと思いながら生きています。あともう一つ重要だと思ったのは、とてもネットワーク構造および学習過程が簡素化されたことです。マシンパワーも過去に比べて非常に少なく済み、個人でもすぐに再現実験ができそうなくらいです。AIが強くなることと、構造および学習のsimplerが同時に達成できていることが本質的だと思います。一応、下記
wrss2017/10/21
“マシンパワーも過去に比べて非常に少なく済み、個人でもすぐに再現実験ができそう”←個人開発者が、同じ実験して強さを同等にするのに1台のワークステーションだと何百年もかかると言ってたのでまだまだ大変そう
AlphaGo
強化学習
コンピュータ囲碁
リンク
「DQN」とその3種のバリエーションの強化学習アルゴリズムを人工知能の研究団体「OpenAI」が公開 - GIGAZINE
テスラやSpaceXの創業者として知られるイーロン・マスク氏は、人工知能(AI)の非営利団体「OpenAI」の設立にも携わっています。このOpenAIが、強化学習アルゴリズム(RLアルゴリズム)の高品質な実装である「OpenAI Baselines」のうち、Deep Q-Learning(DQN)と3種類のバリエーションを公開しました。OpenAI Baselines: DQN https://blog.openai.com/openai-baselines-dqn/ We're releasingOpenAI Baselines, reliable implementations of RL algorithms. Today: DQN & 3 variants: https://t.co/Mw0gCIwv1Z—OpenAI (@OpenAI) 2017年5月24日「DQN」とい
wrss2017/05/27
人工知能
強化学習
DQN
Google
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

処理を実行中です

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025Hatena. All Rights Reserved.

設定を変更しましたx

[8]ページ先頭

©2009-2025 Movatter.jp