読んだ。結構前から読みたいと思っていたが、Amazonで注文しようとするたびに毎回「在庫切れ」の状態で、なっかなか入手できなかったのだ。
構成としては、Googleの内側とあるだけあっていきなり検索エンジンについて話が始まる。次に「スケールアウト」の話が来て、それが終わるとその「スケールアウト」のための具体的な技術について説明がある。
- GFS(GoogleFileSystem)
- Bigtable
- Chubby
- MapReduce
- Sawzal
そして最後に「Google社内の開発体制」についての説明がくる。
個人的には「Bigtable」「GFS」「Chubby」に興味があったが、実際読んでみると「MapReduce」が最も興味深かった。仕事としてGridを管理するFrameworkを構築したからかもしれない。
また、それぞれの技術に関して、クローンのようなものがOSSで存在していると知った。MapReduceのクローン(?)も最近リリース情報を見かけたし。
ちなみに、2章の途中で「多数のサーバで負荷分散する」という節があるのだが、ここに最後まで良く判明しなかった疑問がある。
利用者からの検索リクエストは、まず最初にロードバランサによって振り分けられ、複数あるGWSのいずれかひとつにつながります。ここでいう「ロードバランサ」がどんなヤツなのかについて説明が無かった気がした。ここは一般的なバランサを使っているんだろうか?
もひとつ、初めて知った事実として「Google社内ではUbuntuベースの"Goobuntu"という社内向けディストリビューションを使っている」という事。検索してみると、数年前から知られている事実だった。知らなかった。。
そんなカンジに、色々な技術について簡単に、かつ細かく説明されていてかなり勉強になった。だが、最後の章の「Google社内の開発体制」を読めばわかるように、Googleをもっとも力強く支えているのはGoogle社内の技術者達なんだなぁ、と思った。非常にわかりやすい構成で、読みやすかった。オススメ!
参考Link
- GFS,MapReduce,Bigtable,Sawzalの実装をしているproject、Hadoop->http://hadoop.apache.org/core/
- Rubyで構築されたMapReduceの実装、Skynet->http://skynet.rubyforge.org/
0 件のコメント:
コメントを投稿