日経クロステックで興味深い記事を見つけました。
楽天グループが「オンプレ回帰」を決断、パブリッククラウドからIT基盤を戻す狙い
様々な業界、企業でパブリッククラウド(AWSやGCP)の活用が進む中、日本の代表的なIT企業とも言える楽天グループがなぜ今になってオンプレミスへの回帰を図るのか、その背景を調べてみました。
楽天グループがオンプレミス(自社所有)環境のプライベートクラウド「One Cloud」を拡充し、グループ企業の各種事業が用いるIT基盤の統合を進めることが日経クロステックの取材で分かった。現在、パブリッククラウドで稼働させているシステムが多数あるが、原則としてOne Cloudへシフトしていく。グループ全社でIT基盤のプライベートクラウドへの集約を進めてコスト効率を高めるほか、IT基盤のノウハウを蓄積し安定稼働やセキュリティー強化につなげる。
楽天グループが「オンプレ回帰」を決断、パブリッククラウドからIT基盤を戻す狙い
https://xtech.nikkei.com/atcl/nxt/column/18/00001/07478/
OneCloudとは何者か?
そもそもこの記事に出てくる「One Cloud」とは何者なのでしょうか。
「One Cloud」をキーワードに調べてみると、楽天のインフラエンジニアの方が楽天グループのITインフラ環境について説明している資料を見つけました。
この記事中には明確に「OneCloud」という用語は出てこないですが、12ページ目に出てくる「楽天エコシステム支えるための統合的なプライベートクラウド」という文言と時系列から「楽天エコシステム支えるための統合的なプライベートクラウド」=「OneCloud」なのだと考えられます。
OneCloudは楽天の何を解決したのか?
前章で紹介したスライドの5ページ目にOneCloudが開発された当時の状況とプラットフォーム乱立(開発環境としてAWSやGCPなどのパブリッククラウドサービス、社内のデータセンター等が混在していたと思われる)により引き起こされた問題点が記載されています。
①社内のエンジニアの開発エクスペリエンスの低下
楽天のインフラ時事情 2022
・ツールやポータルがプラットフォームごとに複数存在
・ユーザから見てどれを使うのがベストかわかりにくい
・課金や認証がプラットフォームごとに異なる
②プラットフォーマー視点
・緊急で複雑なトラブル対応時の問題特定に時間がかかる
③会社視点
・全社レベルでのリソース最適化に課題(人/ハードウェア)
・統一的なセキュリティコントロールの欠如
・部署ごとに異なるライフサイクルポリシー
https://www.slideshare.net/rakutentech/2-2022
「②プラットフォーマー視点」に記載されていることはクラウドを利用するユーザに共通するリスクですね。ただ、①、③については楽天グループならではの事情が絡んでいそうです。
楽天グループと言えば、Eコマース(楽天市場)、モバイル(楽天モバイル)、金融(楽天銀行、楽天証券)などの様々な業界・業種に関連会社を持つ企業です。
そんな中で、関連各社で使用する開発プラットフォームが各社ごとに分かれていたら、楽天グループ内でのエンジニアの融通も利きづらいですし、異動後の教育も大変になってしまいます。
また、一般的に課金、認証に必要とされる機能・処理は適用するサービスに左右されないことが多いです。そのため、共通基盤として課金・認証システムを開発し、各サービスの開発時に共通基盤を利用することで、開発時のアジリティを高め、開発コストを抑えることが可能ですが、開発プラットフォームが分かれているとそれも難しくなってしまいます。
これらの問題点を解決するために「OneCloud」は開発されました。
システム構成等については前章のスライド7ページ以降の通りです。
共通的なインフラ基盤を提供し、その上にマネージドサービスベースのアプリケーションを実装することで、上記①~③の問題点を解消しています。
個人的にすごいなと思ったのは、インフラ基盤を仮想化インフラ基盤(物理サーバにハイパーバイザーを導入し、仮想マシンにより基盤を提供する)ではなく、ベアメタルクラウド(ハイパーバイザー等を導入しない単なる物理サーバ、Kubernetes等を導入してコンテナにより基盤を提供する)になっている点です。
ベアメタルクラウドの場合だと物理サーバでハイパーバイザーが動作していないため、その分だけ性能のオーバヘッドを防ぐことができます。仮想サーバではなくコンテナベースでの開発が主体になりつつあるという記事をよく見ますが、自社で構築するプラットフォーム環境でもコンテナの利用を前提とするとは、楽天グループ恐るべし、、、です。(筆者が比較的レガシーな環境にいるので、「いやいや何古臭いこと言っているの!」みたいな意見があればコメントいただけると嬉しいです)
オンプレミス回帰の流れは続くのか?
ここで気になるのは、楽天グループのオンプレミス回帰の流れは他業界や他社でも続くのかという点です。筆者はオンプレミス回帰の流れは「豊富なインフラエンジニアを抱える巨大企業であればオンプレミスへの回帰は選択肢になりうるが、それ以外の企業は引き続きパブリッククラウドを利用していく」と考えています。
そもそも、AWSやGCPなどのパブリッククラウドがこれだけ流行った理由は、パブリッククラウドを利用すれば、
・必要な時に必要なだけリソースを変動できる(スケーラビリティ)
・迅速にリソースを変更できる(アジリティ)
等のメリットを各企業が享受できるからです。
楽天グループなどの人材も資金も抱える企業であれば上記のメリットを満たした自前のプラットフォームを構築できますが、それ以外の企業で同等の環境を構築するのは難しく、得られるメリットに対して費用対効果がないと思います。
海外でもDropBoxが2014年にAWSの利用を取りやめ自社データセンターに移行していますが、これはDropBoxが抱えるユーザとデータ量が膨大であり(ユーザ数は7億人超!)、自社のニーズに合った環境を自前で構築するほうがコストやパフォーマンス面でメリットが得られると判断したものであり、豊富な人材や資金を抱えているという点で楽天グループと同等だと考えられます。
まとめ
楽天グループが自社のIT基盤をオンプレミスに集約するというニュースを取り上げ、その背景を調査しました。その背景には楽天グループのIT基盤が抱えていた、
・社内のエンジニアの開発エクスペリエンスの低下
・プラットフォーマー視点(トラブル対応に時間がかかる)
・会社視点(リソース最適化、セキュリティ、ライフサイクルポリシー)
という問題があったようです。
また、「オンプレミスへの回帰に他社も続くのか」という点については、「豊富なインフラエンジニアを抱える巨大企業であればオンプレミスへの回帰は選択肢になりうるが、それ以外の企業は引き続きパブリッククラウドを利用していく」と考えています。
コメント