Agile Cat — in the cloud

クラウドで Big Data をハンドリングする 6 社の事例

Posted in .Selected, Amazon, Big Data, Hadoop by Agile Cat on October 7, 2011

6 companies doing big data in the cloud
By
Derrick Harris Sep. 6, 2011
http://gigaom.com/cloud/6-companies-doing-big-data-in-the-cloud/

_ Gigaom

Cloud computing and big data analytics are a match made in heaven. I’ve explained why before, but essentially it’s because the cloud model lets users leverage a service provider’s infrastructure investment and subject-matter expertise without having to build them in-house. Done right, big data in the cloud is like a marriage of managed services and Software as a Service, only using very powerful software.

クラウド・コンピューティングと Big Data 分析は、神の思し召しにより引き合わされる。 以前にも説明したが、その本質は、ユーザーがクラウド・モデルを利用することで、サービス・プロバイダのインフラ投資が活性化され、それに付随する専門的なノウハウを、インハウスで展開する必要がない点に集約される。 適切に処理されたクラウド上の Big Data は、きわめてパワフルなソフトウェアを活用する、マネージド・サービスと SaaS の結婚のようなものである。

Thankfully, big data and the cloud have already found other. Although it’s still very early in the evolution of this combination — experts predict major investment in this area going forward — several companies have already melded the two into a variety of unique services.

そして歓迎すべきことに、Big Data とクラウドは、広がりを見せ始めている。この組み合わせは(この領域への大規模投資が進むと専門家は予測している)、始まって間もない段階にあるが、いくつかの企業のユニークなサービスにおいて、この二人が結び付けられている。

Quantivo: Quantivo just announced its foray into the space today with a cloud-based version of its analytics platform. The platform combines business data from multiple sources, transforms and enriches it, then lets customers work with it via a Quantivo’s specialized interface. Because knowing the right questions to ask is often one of the more-difficult aspects of big data, Quantivo says its technology also takes some of the guesswork out of the process by “intelligently auto-compiling lists of patterns” in customers’ datasets.

Quantivo: まさに いま、Quantivo の分析プラットフォームにおける、クラウドベースのバージョンで、この領域へ向けた斬新な試みが発表されたところだ。 このプラットフォームは、マルチ・ソースによるビジネス・データを結合/変換/凝縮し、Quantivo 独自のインターフェイスを介して顧客に提供する。 必要とされる質問を正確に行うことは、Big Data における難題の 1つである。 そのため、Quantivo のテクノロジーは、顧客のデータセットにおける「パターンに関するインテリジェントな自動変換リスト」を実現し、いくつかの推量のための作業を、対象となるプロセスから取り出すと言う。  

1010data: 1010data actually has been doing big data as a service for more than a decade, before anyone was talking about the cloud. It provides a variety of services for specific big data use cases, including data warehousing, business intelligence advanced analytics. Although 1010data utilizes Hadoop and other traditional big data tools to power its service, its customers interact with the service using familiar tools such as spreadsheets that make it easier to find the connections and trends they’re looking for.

1010data: 誰もクラウドについて語らないころから、1010data は現実のサービスとして、10年以上も Big Data に取り組んできた。 同社では、特定の Big Data ユースケースに対する、多様なサービスを提供しており、そこには、データ・ウエアハウジングや、最先端の分析による BI などが含まれる。1010data サイドでは、それらのサービスにパワーを与えるために、Hadoop などの Big Data ツールを利用するが、顧客サイドでは、問題解決のための接点と傾向を見いだすために、たとえばスプレッドシートなどの使い慣れたツールを用いて、このサービスとインタラクトできる。

Opera Solutions: Opera Solutions is an interesting company because although it’s doing $100 million in revenue a year, relatively few people have heard of it. But its service is pretty compelling: customers upload their data to Opera’s platform, which then analyzes it and delivers results based on the relevant “signals” in a customer’s data set. Not content with providing generic analysis to customers, Opera focuses on each customer’s specific needs and employs experts in a variety of industries to help it cater unique analytics programs for each customer.

Opera Solutions: Opera Solutions は、この分野で $100 million の年商を、きわめて少数の人員で実現している、とても興味深い企業である。 そして、提供するサービスは、きわめて解りやすいものである。 つまり、顧客のデータは、Opera のプラットフォームにアップロードされ、分析された後に、顧客のデータ・セットにおける適切な、Signals に応じて配信されるというものだ。 汎用的な分析を顧客に提供することに満足せず、Opera は顧客固有のニーズに焦点を合わせ、また、顧客ごとの分析プログラムを提供するために、多様な業界からエキスパートを採用している。

IBM: IBM has seemingly limitless options in terms of providing big data analytics as a cloud-based service, but its current strategy appears centered around Hadoop. When IBM launched its SmartCloud cloud computing platform in April, it promised that Hadoop workloads will be part of it. A likely candidate to provide that capability is InfoSphere BigInsights, IBM’s Hadoop-based software for analyzing and visualizing large quantities of unstructured data. BigInsights previously was available as a service on IBM’s test-and-development cloud that SmartCloud replaced.

IBM: IBM は Big Data 分析を、クラウド・ベースのサービスとして提供することに関して、あらゆる選択肢を有しているとするが、現時点の戦略は Hadoop 関連に集約されているようだ。 この 4月に、IBM が SmartCloud クラウド・コンピューティング・プラットフォームを立ち上げたとき、そこに Hadoop ワークロードを取り込むことが約束された。 そのプラットフォームために、大量の非構造データの分析と可視化を実現する、IBM における Hadoop ベースのソフトウェアとして InfoSphere BigInsights が候補に挙げられている。 BigInsights の前身は、IBM のテスト/開発のためのクラウド・サービスとして提供されていたが、この SmartCloud により置き換えられることになった。

Amazon Web Services: AWS isn’t providing actual analytics as a service, just the parallel processing framework and computing power necessary to do them at scale. Its Elastic MapReduce platform is cloud-based Hadoop implementation onto which users port their Hadoop applications, then upload their data and run the workload. Like all things AWS, customers only pay for the resources used while the job’s running, as well as for storing the data in AWS’s S3 storage service.

Amazon Web Services: AWS は、サービスとしての分析を具体的には提供していないが、それを大規模スケールにおいて実現するための、並列処理フレームワークとコンピューティング・パワーを有している。 この Elastic MapReduce プラットフォームは、ユーザーによる Hadoop アプリケーションのポートおよび、データのアップロード、そしてワークロードの実行を可能にする、クラウドベースの Hadoop 実装である。 その他の AWS サービスと同様に、ジョブの実行時間および、AWS S3 にストアされるデータ量に応じて、顧客は使用したリソースへの対価を支払う。

HPCC Systems: LexisNexis spinoff and Hadoop alternative HPCC Systems plans to give customers cloud-based access to a system running the company’s HPCC data-processing software. During an interview during Structure 2011, CTO Armando Escalante noted the company might even offer up its own massive data sets — which span the financial, legal and intelligence sectors, among others — to be processed by customers’ applications.

HPCC Systems: LexisNexis からのスピンオフであり、Hadoop の選択肢である HPCC Systems は、同社の HPCC データ・プロセシング・ソフトウェアを、クラウド・ベースで実行するシステムへのアクセスを、顧客に提供しようと計画している。 Structure 2011 におけるインタビューの際に、CTO である Armando Escalante は、大規模データセットのためのソリューションを提供するかもしれないと発言していた。 それは、顧客のアプリケーションで処理されるべき、金融/司法/諜報の部門に関連するものとなる。

Related research and analysis from GigaOM Pro:

ーーーーー

Hadoop が口火を切り、その後に数多おおくの Big Data プロダクト/サービスが提供され始めました。 しかし、それらが、どのような領域で実際に使われいるかとなると、それほど多くの情報が提供されない状況が続いていましたが、ここに来て、かなり具体的な話が聞けるようになって来ました。 Big Data が使用されるのは、決してソーシャルだけではないと証明され、とてもイイ感じですね! ーーー __AC Stamp 2

ーーーーー

<関連>

Big Data を探せ! アメリカの 5つの具体的な事例とは?
Twitter が提供する、Hadoop ライクな OSS とは?
OpenFlow と Big Data の 深い関係について
HP が $10B で 買収する Autonomy は、Big Data のスペシャリスト?
Facebook は 30 P Bytes の Hadoop HDFS を Oregon へ移動
Google の 3つの世代を振り返る – Batch, Warehouse, Instant

%d bloggers like this: