Agile Cat — in the cloud

Development の調査:Google の 85TB リポジトリは、20億行のコードで満たされている!

Posted in AI ML, DevOps, Google, On Monday by agilecat.cloud on November 2, 2015
Software Development: Google’s Code Base Spans More than 2 Billion Lines
By Dick Weisinger – October 30th, 2015
http://formtek.com/blog/software-development-googles-code-base-spans-more-than-2-billion-lines/
_ formtek
Google online services are powered by more than two billion lines of code, says Rachel Potvin, Google executive.  The services include things like search, maps, Google+, calendar, Gmail and YouTube.  All that code is stored in a single repository and available to all of Google’s 25,000 engineers.
 
Google のオンライン・サービスは、20億行以上のコードからパワーを供給されていると、Google の幹部である Rachel Potvin は発言している。ここで言うサービスとは、Search/Maps/Google+/Calendar/Gmail/YouTube などを含むものとなる。それらすべてのコードは、シングル・リポジトリにストアされ、Google の 25,000人というエンジニアが、利用できる状態になっている。
 
Escher_2The source repository used by Google is proprietary, but there are similarities between it and how GitHub works.  The version control system is called Piper.  Unlike repositories like GitHub which house many many individual projects, the Google repository is structured like one massive project.  It’s possible to share code across any number of projects.  Piper also heavily uses automation to monitor consistency and ‘code health’.
 
この、Google が用いるソース・リポジトリは、プロプライエタリなものであるが、どのように機能するのかという点では、GitHub に類似している。そのための、バージョン・コントロール・システムは、Piper と呼ばれている。 多様で独立しているプロジェクトを収容する、GitHub のようなリポジトリとは異なり、Google のリポジトリは、大規模なシングル・プロジェクトのように構成されている。つまり、あらゆるプロジェクトで、それらのコードを共有できるようになっているのだ。さらに、Piper は、コードの一貫性と健康状態をモニタリングするために、あらゆる側面を自動化している。
 
Sam Lambert, the director of systems at GitHub, commented on Wired that, “having 25,000 developers, as Google does, means it’s sharing code with a diverse set of people with diverse set of skills.  But, as a small company, you can get some of that same advantage using GitHub and open source. There’s that saying: ‘A rising tide raises all boats.’”
 
GitHub の Director of Systems である Sam Lambert は、「 Google の 25,000人というような、数多くの開発者を持つということは、多様なスキルセットを持つ、多様な人々の間で、コード・セットを共有することを意味する。しかし、小規模な企業の場合であっても、GitHub とオープンソースを用いることで、同じようなアドバンテージを得られる。つまり、上げ潮は、すべてのボートを浮かべることができるという話だ」と、Wired でコメントしている。
 
How much storage space do you need to store and version control two billion lines of code.  Google uses about 85 terabytes of storage space and the 25,000 engineers make about 45,000 commits to the repository every day.
 
20億行のコードをストアし、そのバージョンをコントロールするために、どのくらいのストレージ・スペースが必要になると、あなたは想像するだろうか。Google が使用している、ストレージ・スペースは約 85 T Byte になる。 そして、25,000人のエンジニアが毎日のように、そのリポジトリ向けて、45,000回もコミットしているという。
 
It’s interesting to compare the size of Google’s repository to other code bases, like Linux or the Windows OS.  Linux is only 15 million lines and Windows is about 50 million.  15 million lines of code is about how much code is touched by Google engineers every week.
 
この、Google リポジトリの規模を、Linux や Windows OS などのコードベースと比較することは、とても興味深いことである。Linux は、わずか 1,500 万行であり、Windows は約 5,000万行である。 1500 万行のコードというと、Google のエンジニアたちが、一週間でが更新するコードの量に等しいのだ。
 
ーーーーー
On Monday20億行のコードと、85 TB のリポジトリと言われても、あまりにも大きすぎて、ピンときませんね。このリポジトリについて検索してみたら、RankBrain という検索のための人工知能/機械学習システムは分離されているとか、Android と Chrome は別のバージョン・コントロールになるとか、、、そんな話が Wired に掲載されていました。それと、25,000人のエンジニアというのも、かなりの規模だと思います。 従業員数は 50,000人弱なので、半数以上がエンジニアという計算になります。ちなみに、Microsoft の従業員数は 99,000人とのことですが、どれくらいのエンジニアが、その中に含まれるのでしょうかね? また、Apple は 80,000人とのことですが、半数以上がショップの店員だそうです(Wired)。それぞれの業態が反映されていて、なかなか面白いですね。_AC Stamp
ーーーーー
<関連>
Innovation の調査: ビジネスとテクノロジーを破壊/再生していく四大要因とは?
Cloud の調査: クラウド・ポリシーの運用に関して、適切な戦略をもつ企業は1%にすぎない
Quanta の コンバージド・インフラが登場:OpenStack/VMware/Microsoft に対応!
CloudFlare は ”Cisco as a Service” :Google/Microsoft/Baidu/Qualcomm が支援!
Cisco が Piston を買収:OpenStack は Intercloud を構成する重要なパートだ!
 

Comments Off on Development の調査:Google の 85TB リポジトリは、20億行のコードで満たされている!

%d bloggers like this: