"

なにが難しいか

  • イベントタイプの多さ
    • 100以上の基準を扱う
    • プラグインのインプレッション(表示回数)
    • いいね!ボタンが押された回数
    • 新しいフィードのインプレッション
    • 新しいフィードのクリック回数
    • デモグラフィック(ユーザ属性)
  • データの規模
    • 1日あたり200億件(1秒あたり20万件)のイベント
  • データの分布の偏り
    • Likeボタンはある種のべき分布に従う。大部分を占めるロングテールは少数のLikeしか受け取らないが、一部のサイトは巨大な数のLikeを受け取る。
    • この性質はアクセス過多の領域とキー、そしてロック競合の問題を引き起こす。
"

Facebookの新しいリアルタイム解析システムとは? - nokunoの日記