TensorFlowはマシーン・ラーニング(機械学習)のためのオープンソースのソフトウエアのライブラリ(汎用性の高い複数のプログラムを再利用可能な形でまとめたもの)です。アンドロイドの音声認識、検索のランキング、Google Photosの画像分類、自然言語処理などに使われており、グーグル製品やリサーチにも使われています。開発はグーグル・ブレイン・チームで、昨年の11月に最初のリリースがありました。使われている言語はPython やC++で、プラットフォームはリナックス、Mac OSXです。
TensorFlowは一夜にして出来た訳ではなく、エボルーションではないですが、機械学習のシステムの前身(第一世代)DistBeliefがありました。グーグルマップ、グーグルの広告、ストリートビュー、YouTubeなどグーグルのコマーシャル製品には、ディープ・ラーニングのDistBeliefが使われております。コンピューター・サイエンティストのジェフリー・ヒントン博士やジェフ・ディーン博士らが率いるチームが、コードのベースを簡素化し、高速化を図り、ニューラルネットワークの誤差を減らしました。例えばグーグルの音声認識ソフトのエラーを少なくとも25%減らすことに成功したそうです。
ディープ・ラーニングの第2世代、TensorFlowは、リナックスやMac OSXのパソコンやサーバーだけでなく、アンドロイドやアップルのiOSなど、モバイル上でも動作します。人間がトライ&エラーで推論し、試して学習していくように、行列演算を繰り返し、機械が自分で自動調整し、学んでいくニューラルネットワークです。パターンや相関を検出して解読していき、認識結果を得ます。
シリコンバレーでは多次元配列を扱う数値演算フレームワークのTensorFlowをダウンロードし(https://www.tensorflow.org)、それを基にアルゴリズムを書くディベロッパーが増えています。グーグル本社でTensorFlowの講演を昨晩行ったディビッド・クラーク(David Clark)さんもパロアルト・サイエンテフィックというスタートアップで働くデータ・サイエンティストです。
カリフォルニア大学アーバイン校のマシーン・ラーニングのワインに関するデータセットを使い(http://archive.ics.uci.edu/ml/)、TensorFlowの使い方を皆に見せました。デイビッドさんは「Employing routines from the Python libraries Pandas and Seaborn, I model the data using logistic regression in Skflow. Talking about TensorFlow, where I use a softmax regression model and cross entropy to minimize the gradient descent. 」そして最後にデイビッドさんはTensorFlowのモデリングをビジュアル化するツールのTensorboardのデモンストレーションを行い、会場の皆から拍手と声援を浴びてめでたく講演を終えました。彼のスライド他の情報は以下のギットハブをご覧ください。https://github.com/dmclark53/tensorflow-and-machine-learning