BIGDATAダッシュボード勉強会の御礼と報告

こんにちは、SSTDの高橋です。 弊社とTreasureData社様との共催で、BIGDATAダッシュボード勉強会を8月22日に行い、無事に終えることができました。 参加者の皆様・関係者の皆様に厚く御礼申し上げます。

さて、今回の勉強会では、ビッグデータを扱うために、データの可視化(ビジュアライゼーション)について考えるというテーマを掲げて開催致しました。 このテーマを掲げた理由として、データの収集・分析についての勉強会は非常に増えてきていますが、最終的にその結果を可視化することについての勉強会はまだまだ不足しているのではないかと感じていたからです。 今回の勉強会を通して、データの可視化やBIツールに対する皆様の興味を更に深めることができていたら幸いです。

さて、本題の勉強会の内容については、当日のハッシュタグの#dashboard2013を確認して頂いたり、既にブログで紹介して下さった方もいらっしゃるので、今回は勉強会で紹介されたBIツールを簡単に紹介していきたいと思います。

  1. Treasure Dataと連携するダッシュボードツール
  2. スモールデータ回帰分析ダッシュボード "adelie"
  3. 誰にも簡単にできるダッシュボード作成
  4. OSSを活用したダッシュボードのご紹介

Treasure Dataと連携するダッシュボードツール

Treasure Data Inc.プロダクト責任者 田村様

TreasureDataMetric Insightsの紹介でした。 TreasureDataについては、このビッグデータ技術ブログにて紹介をしているので、4月の記事から再度チェックして頂ければと思います。 Metric Insightsは、下図(http://docs.treasure-data.com/articles/metricinsightsからの引用)のように、様々なグラフを一括で閲覧できるBIツールです。 TreasureDataとの連携も取れており、クエリを書くだけでグラフの表示ができてしまいます。

その他に、こちらの弊社のスライドの後半にMetric Insightsの外観を紹介しているので、ご覧頂ければと思います。

発表内容にはありませんが、 Treasure Dataのサービス稼働状況をこちらのページで確認できるようになっています。 このように、サービスを利用しているユーザに、サービスの稼働状態をグラフィカルに見せるということも効果的だと思いました。


スモールデータ回帰分析ダッシュボード "adelie"

株式会社サイカ 海老原様

7月にオープンベータを開始したばかりのxica adelieの紹介をされました。 adelieは、回帰分析を容易に行うことができるツールだそうです。 分析モデルを作る際に、特異値を含んだデータを利用すると、その特異値にモデルが引っ張られてしまい、精度が悪くなってしまうという問題があります。 この問題に対して、特異値を除外する操作が必要ですが、adelieではそういった操作も容易にできるように設計されているそうです。

adelieの紹介

使い方はブログにも公開されています。 アカウントを登録して、試してみました。

ログインすると、予め2種類のデータセットが用意されています。 試しに、資格学校のトライアル申込を見てみましょう。

データセットを見てみると、トライアル申込者数と各種広告についてのデータが格納されていることが分かります。 また、予め分析モデルも1つ作られていました。

格納されたデータの内容も確認することができます。

さて、分析モデルを見てみましょう。チェックがついている項目が予測に影響を与える因子です。 現在のモデルは46.14%の精度を示しています。 注目すべき場所の一つは、オレンジ色でラインが入っている領域です。 このオレンジ色の領域は、実測値と予測値が大きく乖離している箇所を示しています。 この領域がなぜ大きく乖離しているのかを考察し、特異値を分析モデルから除外することで予測の精度を向上させることができます。 このように、adelieを利用することで分析モデルと実測値に乖離している部分を発見したり、分析モデルの因子を変更することで精度を挙げ、ビジネスの判断に活かすことができるようです。


誰にも簡単にできるダッシュボード作成

Tableau Japan株式会社 セールスコンサルティングマネージャー 並木様

Tableau Desktopの紹介をされました。 並木様の熟練したデモに見入ってしまい、全く写真を撮っていませんでした… Tableau Desktopはインタラクティブにデータ分析を行うことができるツールです。 ちなみにTableauハッカソンを2013/08/29 18:30から行うそうです。興味がある方はTablueaJapanのTwitterアカウントにコンタクトして頂ければ大丈夫だそうです。

発表時のスライドを掲載致します。

Tableau Publicの紹介

デモで利用していたのはTabluea Desktopでしたが、フリー版であるTableau Publicの方を試してみます(Tableau Desktopは試用版が提供されているので、そちらもどうぞ)。 また、サンプルデータセットも公開されているので、その中のOlympicAthletesをダウンロードしておきます。 このデータには、オリンピックに参加した選手の年齢や国、出場競技、メダル獲得数などが記載されいています。 このデータを使って、スポーツ毎や国毎の選手の平均年齢を可視化してみます。

それではTableau Publicを起動して、Open Dataを選択します。

次に、In a fileのMicrosoft Excelを選択し、ダウンロードしたサンプルデータセットを選択します。

ダウンロードしたエクセルの先頭行には、カラム名が入っています。ここでは、デフォルトのままでOKを行います。

これでデータ分析が始めることができます。左のビューにはDimensionsとMeasuresがあり、Dimensionsは切り口を表し、Measuresには数値が格納しています。さて、実際に触ってみましょう。

MeasuresにあるAgeをRowsに追加します。すると、自動で選手の年齢合計値をグラフとして表示してくれます。 しかし、今回は選手の年齢の平均を知りたいので、Age横の▽を押し、MeasuresのAverageを選択します。

次にDimensionsにあるSportをColumnsに追加します。 すると、各競技毎の平均年齢が可視化されることが分かります。

最後に、DimensionsにあるCountryをColumnsに追加すると、各国毎に各競技毎の平均年齢が表示されます。 また、Show Meの中からグラフの表示形式を変更すると、下図のように世界地図で競技毎の平均年齢を色分けすることができます。 このように、Tablueaでは少ない操作でデータの可視化を行うことが可能になっています。

もっと詳細に操作方法を知りたいという方は、こちらでチュートリアル等もあるようなので、一度試してみてはいかがでしょうか。


OSSを活用したダッシュボードのご紹介

サイオステクノロジー株式会社 大村

弊社の大村の発表では、データの閲覧とアカウント制御というシンプルな構成のBIツールを紹介しました。こちらのBIツールは、発表者の大村が現在開発中のツールとなっています。 ソースコードはGithubに公開していますが、まだhowtoなどもないので、ドキュメントの整備を終え次第、URLなどの紹介をしていきたいと考えています。

発表時のスライドを掲載致します(スライドを一部修正しております)。

その他のBIツールの紹介

大村の発表内にて、名前が挙がったGrowthForecastKibana(kibana2とkibana3があります)がありましたが、Kibana3の外観を紹介したいと思います。

Kibana3は、全文検索エンジンであるElasticSearchをバックエンドで利用したログ検索ツールです。 クエリとして検索したいワードを登録することで、その検索ワードの頻出状態をグラフィカルに表示したりすることも可能です。 また、Kibana3はHTMLとJavascriptで作成されているので、レイアウトの変更なども自由に行うことができます。 こちらからデモを利用することができます。

今後もビッグデータに関連したセミナーや勉強会を開催していきたいと考えておりますので、また皆様とお会いできることを楽しみにしております。

執筆:髙橋@SSTD