Agile Cat — in the cloud

Twitter は、データセンターの情報を開示すべきだ

Posted in Data Center Trends, Twitter by Agile Cat on July 31, 2012

Why Twitter should open up about its infrastructure
http://wp.me/pwo1E-4vx
Jul 26, 2012 – Derrick Harris
http://gigaom.com/cloud/why-twitter-should-open-up-about-its-infrastructure/#comments

_ Gigaom

If Twitter wants to remain opaque about its practices, that’s fine — but it shouldn’t expect any slack from upset users or investors. Blaming a two-hour outage on an “infrastructural double-whammy” after remaining mum on even where its data centers are located doesn’t exactly inspire confidence.

もし Twitter が、そのプラクティスに関して不透明さを残したいなら、それも良いだろう。 しかし、混乱の最中にあるユーザーや投資家が、それを大目に見ると思ったら間違いだ。 データセンターのロケーションすら秘密にしておきながら、この 2時間におよぶダウンについては「インフラに起こったダブルの不幸」と言い逃れをするようでは、信頼なんで得られっこない。

Whatever investments Twitter is making to improve the reliability of its system aren’t working, or at least not as well as they should be. The world’s favorite micro-blogging site blamed Thursday morning’s approximately two-hour outage on problems within its data centers — specifically the parallel failure of its running system and its backup system — and it’s the second time in less than two month’s Twitter’s infrastructure has brought the site down. Maybe it’s time for Twitter to talk openly about what its doing in there.

そのシステムの信頼性を改善しようとする、Twitter のあらゆる投資が機能しなかったのか、あるいは、無いも同然だったのか。 この、世界で愛されるマイクロ・ブログ・サイトが、木曜日の朝に約 2時間ほど停止したが、そのデータセンターに問題があったらしい。具体的には、運用システムとバックアップ・システムが同時に障害を起こしたということのようだ。さらに言えば、Twitter のインフラ・サイトのダウンというのは、最近では 2回目であり、前回からは 2ヶ月も経っていない。 Twitter は、何が起こったのかを、オープンに話すべき状況にあると思う。

Don’t get me wrong, Twitter has been nothing if not generous in talking about the software it builds. The company has open sourced numerous data-management tools and other pieces of code. It has occasionally (at least in 2009) been willing to share how it handles, stores, searches, and analyzes billions of data points relating to users and their tweets. But when it comes to the actual infrastructure on which this software runs?

間違えていないと思うが、鷹揚な Twitter には、彼らが作るソフトウェアについて、説明に躊躇するようなことはなかった。 同社は、オープンソースのデータ・マネージメント・ツールなどの、たくさんのコードを有している。 そして何度かは(少なくとも 2009年には)、ユーザーとツイートに関連する何十億というデータポイントを、操作/保存/検索/分析するためにコードが共有化され、実現していくための方式が検討されてきた。 しかし、それたのソフトウェアが走る、実際のインフラの話になると?

Let’s just say Twitter is less than forthcoming. The explanation of today’s outage:

とりあえず、ここでは、Twitter の説明は期待を裏切るものだ、とだけ言っておこう。 今日のダウンの説明は、以下のとおりである:

The cause of today’s outage came from within our data centers. Data centers are designed to be redundant: when one system fails (as everything does at one time or another), a parallel system takes over. What was noteworthy about today’s outage was the coincidental failure of two parallel systems at nearly the same time.

今日のダウンは、私たちのデータセンターにおける問題が原因だ。 データセンターは、冗長性を確保するよう設計されている。 つまり、1つのシステムに障害が発生すれば(全体あるいは部分にかかわらず)、並列に走っている別システムに切り替わる。 今日のダウンにおいて、注目すべきことは、ほとんど同じタイミングで、並列に走る 2つのシステムに、偶然にも障害が発生したことである。

It was minimally more descriptive in explaining the cascading bug that took the site down temporarily last month.

先月は、連鎖的なバグが一時的にサイトをダウンさせたという説明だったので、それと比べれば、少しはマシなのかもれない。

And after publicly detailing the migration into its new data center last March, Twitter has been mysteriously mum about where it’s actually running. In Salt Lake City? In Sacramento? The response from a Twitter spokesperson when asked where it’s data centers are located last June: “I can also confirm that we have multiple sites, but I won’t go into further detail.” Apparently, it now has space in Atlanta, too.

昨年の 3月に、新しいデータセンターへ移動すると公表した後、実際に運用される場所について、Twitter は口をつぐんでいる。 奇妙なことだ。 Salt Lake City なのか? Sacramento なのか? そして、昨年の 6月に、データセンターの場所について質問されたとき、Twitter のスポークスマンは、「 マルチ・サイトについては、確認することも可能だが、これ以上の詳細は述べないだろう」と発言している。 見たところでは、同社は Atlanta にもスペースを持っている

imageIf Twitter wants to remain opaque about its practices, that’s fine — but it shouldn’t expect any slack from upset users or investors. By contrast, we have a pretty good idea where Google’s data centers are and what’s going on inside them, and we know nearly everything about Facebook’s operations. When Amazon Web Services has an outage, it might take days, but provides a detailed post-mortem report explaining what went wrong.

もう一度言うが、もし Twitter が、そのプラクティスに関して不透明さを残したいなら、それも良いだろう。 しかし、混乱の最中にあるユーザーや投資家が、それを大目に見ると思ったら間違いだ。 それと対照的に、Google がデータセンターの場所を示すことや、同社内で検討されていることに、私は良い印象を持っている。さらに、私たちは、Facebook の運用するデータセンターについては、ほとんど全てを知っている。 Amazon Web Services に関しては、ダウンから数日を要するが、何が悪かったのかという、詳細な分析レポートが提供される。

Even if Twitter’s infrastructure team is filled with very smart engineers, there’s certainly benefit to be derived from public discussion about what it might be doing right and wrong. Clearly, something isn’t right; the site is down too often considering how much smaller it is than the aforementioned services. While it’s not disruptive enough to anyone’s business to warrant an AWS-style explanation, we gotta get something better than blaming two hours of downtime on an “infrastructural double-whammy.”

たとえ、Twitter のインフラ・チームが、きわめて優秀なエンジニアを抱えているにしても、正しこと間違ったことに関する公開の場での議論は、明確なメリットをもたらすだろう。 明らかに、何かが正しくないのだ。つまり、このサイトは、他のサービスと比較して、あまりにも頻繁にダウンしすぎるのだ。 AWS スタイルの説明は、あらゆるビジネスにとって、混乱をもたらすものではないなどと、そんなことを言うつもりもない。 しかし、2時間におよぶダウンについて、「インフラに起こったダブルの不幸」と言い逃れをするよりは建設的である。

Image courtesy of Shutterstock user Elnur.

Related research and analysis from GigaOM Pro

ーーーーー

imageそうなんですよね。 Twitter はデータセンターについて、その詳細を明かしませんね。 そして納得できるのは、Google や Facebook の姿勢に対する評価です。そうすることで、ほんとうの意味での信頼を得ていけるのだと、Twitter にも理解して欲しいです。言葉は厳しいですが、Derrick Harris さんの Twitterへの愛が感じられる、とても良い記事ですね 🙂 ーーーimage

ーーーーー

<関連>

100% の再生エネルギーを目指す、Apple のデータセンター戦略
eBay のデータセンターは、燃料電池から 6MW を絞り出す
Dell が Quest を $2.4 Billion で買収 : 狙いは DC マネージメント
NTT Com が 85% を出資する、英 Gyron のデータセンター・ビジネスとは?
Open Compute が創りだす、新世代 Web のためのビジネス・モデルとは?

 

Comments Off on Twitter は、データセンターの情報を開示すべきだ

%d bloggers like this: