AI(人工知能)で頑張っているのは、アメリカばかりではありません。日本企業もAIで色々な取り組みを行っています。先週金曜、サンノゼ国際空港にほど近いNTTのオフィスで、Preferred NetworksのCTO(Chief Technology Officer)、久保田展行氏のIoTに深層学習(deep learning)を活用した講演がありました。
深層学習とは人工知能の分野の一つである機械学習で用いられる手法の一つです。Preferred Networksは今年1月のラスベガスでのCESで、トヨタのブースの中で 複数の車のロボットがぶつからないように自動走行で学習した例を参加者に見せました。人間があらゆる道路などの状況に対し、車の動きを設計するのは大変で、軌道変更もできなくなります。人が設計する制御プログラムは一切なく、自走する車に道に沿って早く動いた時はプラスの報酬を、壁や他の車に ぶつかるとマイナスの報酬を与える強化学習で、車自体が制御方法を学びました。
車はセンサーを使って、自分の現在の状況を認識し、近距離と遠距離のセンサーからの情報を統合して、アクセル、ブレーキ、左右ハンドル、後退など適切な判断を次第に強化学習していきます。そのアルゴリズムはQ-learning + ε-greedyというアルゴリズムだそうです。Preferred Networks の松元氏によれば、Q-learningでは、ある状態sである行動aを取った時、どのくらい報酬が得られそうかを表す関数Q(s,a)を学習するそうです。深層学習技術が最近、とても進んできたので、大掛かりなニューラルネットワークの学習ができる要因あったそうです。
強化学習で得られた走行技術は、人が考えている以上のケースがあったそうです。 交差点で、ロボット車は 交差点では車両間隔をあけるために後ろがあいているなら少し後ろに下がるそうです。なぜなら、ロボット車は周り全部同時に見れるからだそうです。 将来、強化学習や機械学習を利用することで、実装を部分的に自動化ができたり、AIがプログラムやプログラミングというタスクを置き換ってやる可能性があるかもしれない。プログラマーではなく、報酬設計職人という新しい職業が出てくるのではと、久保田氏は思い描いていらっしゃいました。