Agile Cat — in the cloud

Facebook が目指す、リアルタイム分析のインフラとは?

Posted in Facebook, NoSQL by Agile Cat on March 8, 2011

How Facebook Is Powering Real-Time Analytics
Derrick Harris Mar. 4, 2011, 9:21am PT

_ Gigaom

Facebook is working on a real-time analytics dashboard that will let users determine which content on their pages is getting the most attention from visitors. As described in an educational session on Wednesday night in Facebook’s Seattle office, the service, which tracks both impressions and actions  for plugins and newsfeeds, should be valuable to companies seeking to maximize the effectiveness of the marketing efforts on the popular social media site. However, the highlight of the session was the infrastructure underlying the forthcoming service.

Facebook が取り組んでる、リアルタイム分析ダッシュボードとは、ユーザーのページ上のコンテントの中で、何がビジターの注意を引き付けているのを、判断させるためのものである。 Facebook の Seattle オフィスで、水曜日(3/2)の夜に開催されたエデュケーション・セッションで説明されたように、 プラグインとニュースフィードに関する Impression と Action を追跡するサービスは、この人気ソーシャル・メディア・サイトにおける、マーケティング戦略の有効性を最大にしようとする企業にとって、貴重なものになるはずだ。 ただし、このセッションのハイライトは、この新しいサービスの基礎となる、インフラストラクチャに関するものであった。


クリックで動画ページへ ⇒

The session video gives plenty of details, but here are some highlights. The analytics service tracks about 100 different metrics; is built atop HBase, with support from two Facebook-developed tools called pTail and Puma; and it aims for less than 30 seconds of lag time, a goal it has met a majority of the time during testing. It’s interesting that Facebook is becoming such a big user of the Hadoop-based HBase database, but the company line thus far is that the Cassandra NoSQL database it developed a few years ago just can’t hang with HBase when it comes to reliability and performance. HBase also underpins Facebook’s recently launched “social inbox” feature.

このセッション・ビデオでは、たくさんの詳細情報が提供されるが、いくつかのハイライトも含まれている。この、分析サービスは、およそ 100種類の基準を追跡する。そして、Facebook が開発した pTail とPuma という、2つのツールによりサポートされ、また、HBase 上に構築される。さらに、タイム。ラグに関しては 30秒以内という目標をたて、タイム・テストの大半において、そのレベルが達成されているという。 Facebook が、Hadoop ベースの HBase データベースにおける、ビッグ・ユーザーになることは興味深い。しかし、これまでのところ、同社の方針は数年前に開発した Cassandra NoSQL データベースであり、信頼性と性能の話になると、 簡単に HBase へ移行できないとのことである。 HBase に関しては、最近に Facebook が立ち上げた、“social inbox” 機能を下から支えている。


この分析というのは、Facebook Page(以前の Fan Page)に関するもので、現時点では、だいたい 2日~3日遅れで更新されているという感じです。 詳しい内容については、大元さんのブログをご参照ください。 とても丁寧に説明してくださっています。 ーーー __AC Stamp 2


Facebook 探検隊: どのようなソフトウェアでスケールを達成しているのか
Facebook、Twitter、Digg などでの Cassandra の状況について
Facebook の Social Inbox は、単なる Email ではない!
Facebook のメッセージング・インフラを、再構築する立役者は HBase だ!
Facebook は 20分間で、2.7M Photos/10.2M Comments/4.6M Messages を処理する!

Comments Off on Facebook が目指す、リアルタイム分析のインフラとは?

%d bloggers like this: