2016.03.30更新

 技術書で知られるO'Reillyがシリコンバレーの著名な企業と一緒に、この月曜(3月28日)から木曜31日まで、サンノゼのコンベンション・センターで、 Strata+Hadoop World会議を開いております。月曜は夕方まで主にビック・データのトレーニング、今日火曜はトレーニングとチュートリアル、水曜は基調講演とセッション、木曜は基調講演とセッションでございます。   

                                Strata

 現在、センサーがあちらこちらでデータを集め、世界でデータ量が爆発的に増えています。データが持つ価値を解明する方法は、未確定なので、ビッグデータのためののソリューションを考え、プラットフォームを提供しよとする試みのためのイベントです。米国ではビッグデータが重要視されていることがよくわかる映像が昨年のオバマ大統領よりのStrata Hadoop World 2015 に向けたYouTubeによるメッセージです。以下のサイトをご覧ください。https://www.youtube.com/watch?v=vbb-AjiXyh0  

 ですが〜、strata(ストラタ)とは? Hadoop(ハドゥープ)とは、一体どういう意味なのでしょうか?strataとは層という意味です。 Hadoopとは、データを数々のサーバに分散し、並列して処理するミドルウェア(ソフトウェアの種類の一つで、 OSとアプリケーション・ソフトの間に位置し、様々なソフトウェアから共通して利用される機能を提供するもの)です。Hadoopの強みは、数時間以上かかるようなバッチ処理を複数マシンに分散して、高速化できることです。つまり、コンピュータ1台だと少なくとも数時間以上かかるような、大量のデータを読み込んで解析する処理、大量の計算が必要な処理に向いているそうです。大量データの層を解析するビジネス・イベントと呼んでも良いかもしれません。参加されているデータ・サイエンティストの大半が男性でしたが、女性もいらっしゃいました。彼女たちによると「中国の北京、シンガポールでもStrata Hadoop Worldが開催されているんですよぉー」とのことでした。ロンドンやNYでもあるんですね(で、日本はどこよ?)。

Strata全体 Strata女性

 私がチラと覗かせて頂いた教室のトレーニングでは、PythonやR言語を用いたデータ分析手法をお話になられていたようです。ちなみにPython(パイソン)とは、91年に登場したオブジェクト指向型の水準が高いプログラミング言語です。私の娘によれば「英語に近い」とかで、文法が簡潔だそうです(自分で書いたことないから分からないーすいません)。日本から参加されたお二人のエンジニアの方々は「Sparkは使っているけれど、Hadoopを導入するかどうか検討しているので、この会議に参加しました」とのことでした。明日からは基調講演が始まりますので、ご期待ください!

投稿者: Ayako Jacobsson