Agile Cat — in the cloud

SAP と HANA が、Open Compute に恋する理由

Posted in .Selected, Bare-Metal, Data Center Trends, Facebook, Open Compute, Strategy by Agile Cat on November 26, 2013

Why SAP should put HANA on Open Compute
http://wp.me/pwo1E-6Wz

Phil Wainewright | On October 3, 2013
http://diginomica.com/2013/10/03/sap-put-hana-open-compute/

_ diginomica

Those who imagine that virtualization is an essential ingredient of cloud computing must have been mystified to discover from my post on Monday that Facebook prefers not to use the technology. Instead of abstracting away the hardware layer as conventional wisdom suggests one should do in a cloud architecture, Facebook very much factors it in, with its insistence on designing its own custom-built database machine. What’s going on?

クラウド·コンピューティングには欠かせない構成要素として、仮想化テクノロジーの存在をイメージする人は、このテクノロジーを Facebook が使いたがらないという、私の月曜日 (9/30) のポストを見て、当惑しているはずだ。それに換えて、従来からの通念が示唆するようなハードウェア・レイヤから離れて、クラウド·アーキテクチャにおける抽象化を実践すれば良い。Facebook は、独自のデータベース・マシンを、あくまでも自らデザインするという主張により、その構成要素を分解しようとしている。 上手くいっているかい?

In fact it’s replication not virtualization that counts in cloud computing — the ability to scale out across an elastic multitude of identical instances.

実際のところ、クラウド・コンピューティングで重視されるべきは、リプリケーションでありバーチャリゼーションではない。 言い換えれば、膨張性と多数性を備えた一卵性のインスタンスを横断するかたちで、スケールアウトしていく能力が重要となる。

How replication is achieved depends on the context. In an IaaS environment like Amazon Web Services (AWS), which seeks to host a large and diverse population of computing loads, virtualization is a crucial agent of homogenization across the computing stack that hosts those loads. For Facebook, where the load is already homogenized because the vendor is providing the same application to hundreds of thousands of users, virtualization is an unnecessary overhead.

リプリケーションの達成方式は、そのコンテキストに依存する。たとえば、Amazon Web Services(AWS)のような IaaS 環境では、大規模かつ多様な個体の集団を、コンピューティングの負荷の中に抱えようとする。それが仮想化であり、これらの負荷をホストするコンピューティング·スタックを貫く、均質化のための重要なエージェントとなる。その一方で、Facebook の場合は、すでに負荷が均質化される。なぜなら、このベンダーが、無数のユーザーに対して、均一化されたアプリケーションを供給しているからである。したがって、仮想化は不要なオーバーヘッドになる。

Bare metal cloud

This is why the future isn’t going to converge on a tiny handful of global cloud computing giants all competing to provide identical IaaS services. Although there will be giants in that space, there will also be huge fragmentation of the market across specialist providers of application-specific cloud computing.

この理由により、一握りのグローバル・クラウド・コンピューティングの巨人たちだけが、競い合って IaaS サービスを提供するという未来は有り得ない。もちろん、そのスペースに巨人たちは存在するだろうが、個々のアプリケーションに適したクラウド·コンピューティングを提供する、専門的なプロバイダーたちにより、このマーケットは大きく分断されていくだろう。

So Salesforce.com on Exadata is one template for apps that use very large Oracle 12c database instances. Facebook provides a very different template based on using its Open Compute designs. As I noted on Monday, OCP server designs are starting to find their way into enterprise datacenters mainly because of “the lack of a pre-existing industry standard for cloud datacenter servers.”

したがって、Exadata 上の Salesforce.com は、きわめて大規模な Oracle 12c データベース・インスタンスを使用する、アプリケーションのためのテンプレートになっている。また、Facebook が提供するテンプレートは、Open Compute デザインの活用をベースにした、まったく異なるものとなる。月曜日に指摘したように、OCP サーバーのデザインにより、Facebook はエンタープライズ・データセンターにおける方向性を見つけ始めている。 その理由は、「クラウド・データセンターにおけるサーバーに関しては、業界スタンダードが欠如している」という事実に起因する。

Many other templates will emerge. Expect to see some interesting developments once the first generation of 64-bit ARM servers comes out. The ARM architecture is best exploited by parallelizing similar workloads such as large numbers of web servers rather than virtualizing many different workloads.

その他にも、数多くのテンプレートが台頭していくだろう。 まず、第一世代の 64 Bit ARM サーバーが登場した後に、いくつかの興味深い展開が期待される。 ARM アーキテクチャにとって最適なものとしては、さまざまなワークロードを仮想化するよりも、たとえば大量の Web サーバーのような、同一のワークロードを並列化するものがある。

Indeed it’s already possible to rent ‘bare metal cloud’ in which you pay by the hour for your preferred hardware configuration. Bigstep, a London-based venture launched by an established global hosting provider, quotes benchmarks that show virtualization decreases performance by anything between 20 and 80 percent, especially for I/O intensive workloads such as big data. It is therefore targeting its offering at operators of large-scale big data platforms, who have most need to squeeze every ounce of performance out of the underlying computing.

たしかに、好みのハードウェア・コンフィグレーションに対して、時間単位で対価を支払うベア・メタル・クラウドを借りることが、すでに可能となってる。著名なグルーバル・ホスティング・プロバイダにより立ち上げられた、London ベースのベンチャー Bigstep だが、あらゆるケースにおいて仮想化は、パフォーマンスを 20%〜80% の間で劣化させるというベンチマークを引用している。そして、とりわけ、I/Oに負荷が集中するワークロードである、ビッグデータなどのケースに、その傾向が見られるとしている。したがって同社は、コンピューティングにおける、すべての基本パフォーマンスを引き出す必要のある、大規模 Big Data プラットフォームのオペレータに、そのサービスを提供しようとしている。

Honed for HANA

Where else will this lead? Well if big data is a beachhead use case for application-specific cloud computing stacks, then perhaps SAP should be looking closely at teaming up with the Open Compute Project (OCP) to develop an open-source hardware specification that’s honed for HANA.

この話は、何処につながっていくのだろう? もし、Big Data が、アプリケーションに特化したクラウド·コンピューティングの、橋頭堡となるべきスタックのユースケースであるなら、おそらく SAP は、HANA のために磨きをかけられた、オープンソース・ハードウェア仕様を開発するために、Open Compute Project (OCP) との連携を模索しているはずである。

This would be a fitting follow-on from its BW(Business Warehouse) on AWS offering and also benefit many of its customers who currently face huge problems when they come to implement HANA in-house.

それは、 BW(Business Warehouse) on AWS が提供するものを、適切に継続するものになるだろう。そして、インハウスで HANA を実装するときに、深刻な問題に直面する数多くの顧客に対しても、大きなメリットをもたらすものになる。

As my diginomica colleague Dennis Howlett put it when he broached the idea in an email conversation earlier this week:

今週の初めに、diginomica の同僚である Dennis Howlett と、この件について電子メールでやりとりしたとき、彼は以下のように述べていた:

“Provisioning HANA is a dog’s breakfast because there are seven approved hardware manufacturer configurations, all of which have a different approach. OCP might represent a way out of this spaghetti soup in the context of a soon (so they say) OLTP/analysis ‘version’ of the HANA architecture.”

HANA のプロビジョニングは、とても困った問題を抱えている。なぜなら、7種類もの、ハードウェア・マニファクチャ・コンフィグレーションが承認されており、そのすべてが異なるアプローチを持っているからだ。(彼らの言う)HANA アーキテクチャの OLTP/Analysis Version のコンテキストにおいて、このスパゲッティ・スープから抜け出す方式を、近々に OCP が示す可能性もある。

This it must be said is pure speculation, but a single, open-source hardware reference design could be a considerable help to enterprises aiming to implement HANA. Instead of every customer paying a tidy sum to systems integrators or spending in-house resources on separately working out the best way to get optimum performance, the open source model allows those resources to be pooled, achieving a better result at a lower cost for each participant.

それが、純粋な憶測であることを断っておくべきだが、オープンソースによる単一のハードウェア·リファレンス·デザインが、HANA を実装しようとするエンタープライズを、しっかりと支援する可能性があるのだ。 これまで、最適な分業を達成することで、最適なパフォーマンスを得てきた顧客たちは、そのためにシステム·インテグレーターに莫大な費用を支払い、また、社内のリソースを消費してきた。 それに代えて、このオープンソース・モデルは、低コストで良好な結果を達成するたのリソース・プールを、コミュニティに参加する人々により実現していくことになる。

Scale-out challenge

The big potential stumbling block in this potentially rosy picture is HANA’s ability to scale out across multiple commodity hardware boxes (noting that the definition of ‘commodity’ in this context extends to include Facebook’s design for a server incorporating a 3.2-terabyte solid-state flash memory card). Facebook has an OCP design for database machines because it runs hundreds or thousands of them at a time. If one fails, the provider just brings up another node without the end user ever noticing a glitch.

このバラ色の未来において、障害をもたらすかもしれないパートは、多種多様なコモディティ・ハードウェア・ボックスを横断して、全体にスケールアウトしたいくための HANA の能力である(この文脈におけるコモディティの定義は、3.2 TB のソリッドステート・フラッシュ・メモリ・カードを組み込んだ、Facebook デザインによるサーバーまで含むように、拡大解釈される点に注意)。Facebook がデータベース・マシンに OCP デザインを適用しているのは、無数のデータベースを同時に実行するという、必要性に迫られるからである。そして、いずれかに障害が発生しても、このプロバイダーは、それをエンドユーザーに気付かせることなく、他のノードを投入することで対処してしまう。

Can HANA achieve the same effortless fault tolerance? It has been validated to scale out across 12 nodes in production systems and is capable of much more according to SAP executive board member Vishal Sikka, quoted in that announcement in May last year:

HANA は、同じレベルの、しかも手間いらずのフォールト・トレランスを実現できるのか? SAP の Executive Board Member である Vishal Sikka の、昨年 5月のアナウンスメントを引用すると、プロダクション・システムにおいて、12ノード間をまたいだスケールアウトが検証されているようだ:

“Recently, in our research labs, we have assembled the largest SAP HANA system that scales to 100 nodes, 4000 computing cores and 100 TB in DRAM.”

最近のことだが、私たちのリサーチ・ラボにおいて、最大級の SAP HANA システムがアセンブリされた。そこでは、100ノード/4000コンピューティング・コア/100 TB DRAM まで、スケーリングが実現できている。

Verdict

All of this is an interesting thought experiment. Perhaps the gulf between cloud and traditional enterprise computing is not as unbridgeable as I have previously portrayed, at least when operating at a sufficiently large scale. Cloud application players amply demonstrate that once scale becomes large enough, there is much they can do to optimize under the covers of their own infrastructure. Maybe SAP should use OCP to help its HANA customers do likewise.

ここで説明した、すべての事柄が、きわめて興味深い思考の実験である。おそらく、クラウド·コンピューティングと、従来からのエンタープライズ·コンピューティングの間に、ブリッジが架けられないことはない。 それは、少なくとも、大規模スケールの到来と伴に実現されると、説明してきたことである。クラウド・アプリケーションのプレイヤーたちは、スケールが膨大になった後のことを、充分に例証している。つまり、独自のインフラでカバーされた深部で、必要とされる最適化が、充分に達成できるのである。おそらく、SAP は、HANA の顧客を支援するために、OCP を使用するはずだ。

Disclosure: SAP, Oracle and Salesforce.com are diginomica premium partners.

Image credit: Baking bread © Minerva Studio – Fotolia.com.

ーーーーー

TAG indexたまたま見つけた、diginomica というサイトで、Open Compute が取り上げられていました。 そして、とても興味深いことが書かれていたので、訳してみたのですが、とても難しい :) とは言え、専門的な知識を持っている方には、有効に利用してもらえる情報になるはずなので、それは、それで、良しとしましょう。 そして、思い出したのが、『 トップを快走する AWS と、それを追いかける 7人の チャレンジャー 』という 2012年3月の記事です。ここでも、もし Facebook がクラウド・プロバイダーになったら、という仮説が述べられているのですが、合わせて読んでみると、とても面白いですよ!image

ーーーーー

<関連>

Facebook の Dragonstone : これは memcached の SSD 実装なのだ!
Quanta と OCP : Server/Storage/Switch/Rack などがデビュー!
Linaro が OCP に参加 : それにより Linux on ARM in DC が加速していく!
Google や Facebook は、サーバー用の カスタム CPU に取り組むだろう
Facebook Hardware Labs は、エンジニアにとって夢のような空間だ
Facebook の DCIM : 独自のデータセンター管理システムを構築

 

One Response

Subscribe to comments with RSS.

  1. Business electricity comparison said, on March 26, 2014 at 11:06 am

    Excellent way of explaining, and nice paragraph to take information about my presentation subject matter,
    which i am going to deliver in school.


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: