[Hadoop][MapR]MapR(GreenPlumHD)の中身説明会に参加してきました。
今日はMapR(GreenPlumHD)の中身説明会に参加してきました。
感想です。
>http://www.zusaar.com/event/198012
タグは#asakusamaprです。
やった内容はMapRの実装とか、本当の中身の話ではなく、
MapRの機能についての説明です。
こちらのブログにある図と同じ図が描かれたスライドと
デモを使いながらの説明です。
>インサイド MapR (1) (Hadoop アドベントカレンダー 2011 16日目) - nagix
>http://d.hatena.ne.jp/nagixx/20111216/1324006829
上のブログにないこととしては、
①ダッシュボード
各ノードのステータス(起動・停止)の変更・確認や
Jobの進捗(JobTrackerのWebUIを拡張したもの)がみれます。
また、ノードに異常があったとき、メールなどで通知することも可能。
また性能の観点から、
各ノードのCPU、メモリ、ディスク使用量が分かります。
またgangliaと連携してMapR独自のメトリクスを読み込ませ、
gangliaに表示させることができます。
私個人としては、
落ちた原因が分からないのがちょっと残念。
②マウントしたら、思ったより使い勝手がよさそう
MapRはNFSにマウントできます。
までは知ってしましたが、
デモでマウントしたら普通のFSと代わらず操作できてました!
hadoop fs -lsとか打ったら1,2秒待たされるのに、
マウントしてlsしたらすぐリストが帰ってきた。
しかもその後viでいじっている!
これは楽しくなりますね。
③信頼性
出てきた質問ですが、
MapRをどこまで信頼していいのか、根拠に関する話があがりました。
商用で実際に使うことを視野に入れた深い質問です。
具体的には、
Q:QAプロセスや実施した試験の公開はあるか?
それらがあれば、説明がしやすい。
A:(英語で分かりませんでした。。。)
あまりストレートには答えてもらえなかったようですが。
Q:MapRの使いやすさだと、直接MapRにデータをおきたくなるが、
大丈夫か?
A:大丈夫だ!!問題ない。
いや根拠は。。。
MapRに限らずHDFSなどでも言える事だとは思いますが、
実績の少ない若いプロダクトは、
どこまで信用していいのか、客観的に考える必要があると気づかされました。