Nature ハイライト

Cover Story:学習曲線:自己教示学習する人工知能ソフトウエアがビデオゲームで人間並みの成果を挙げる

Nature 518, 7540

表紙は、コート内のレトロなスプライトからの攻撃が、「ディープQネットワーク」というエージェント(自律的に各種処理を行う仮想代理人ソフトウエア)が操作するパドルコントローラーによって跳ね返される様子をエージェントの側から見たように描いたものである。このような人工エージェントが本当に知力を持つと見なされるには、人間にとって難しいと考えられるさまざまなタスクに抜きんでた才能を示さなくてはならない。しかし現在、エージェントができるのは単一の分野をマスターできる個々のアルゴリズムを作り出すことだけで、例えばIBMの「ディープブルー」はチェスでは人間のチャンピオンに勝つが、その他のことは全くできない。今回、グーグルの子会社であるディープマインド社のチームが、ディープQネットワークという名の人工エージェントを開発した。このエージェントは、米国のビデオゲーム会社アタリ(Atari)の家庭用ゲーム機Atari 2600の49種の古典的な「アーケード」ゲームのやり方を知覚経験から直接学習して、熟練した人間ゲーマーと同程度の成績を達成している。強化学習(この場合は得点という報酬が最大になるような行動を選ぶ)と深層学習(この場合はピクセルという高次元データからの特徴抽出を多階層的に行う)とを組み合わせることで、ゲームプレイヤーであるこのエージェントは、さまざまな難課題を無から始めて学習できるシステムという目標に、人工知能を一歩近づけたことになる。

目次へ戻る

プライバシーマーク制度