AWS S3からAlibaba Cloud OSSへマイグレーションの手順
本書は、AWS S3からAlibaba Cloud OSSへマイグレーションの手順を紹介します。
1.はじめに
本書は、Amazon Web Services(以下AWS)環境のストレージ(AWS S3)に格納されているデータを、Alibaba Cloudのオブジェクトストレージサービス(以下OSS)へ移行する手順を記載します。移行の際には「Alibaba Cloud移行ツールOSSimport」を使用します。
2.Alibaba Cloud移行ツールとは
Alibaba Cloud 独自のリソース移行ツールです。ローカルまたは他のクラウドストレージシステムに格納されたデータを OSS に移行でき、以下のような特徴があります。
①豊富なデータソースをサポート(必要に応じて拡張可能) ローカルドライブ、Qiniu、Baidu BOS、AWS S3、Azure Blob、Youpai Cloud、Tencent Cloud COS、Kingsoft KS3、HTTP、OSS
②データ転送を中断しても、途中から再開が可能。
③トラフィック制御をサポート。
④時刻指定または指定された接頭辞の後にオブジェクトを移行することが可能。
⑤パラレルでデータのアップロードとダウンロードが可能。
⑥スタンドアロンモードと分散モードをサポート。スタンドアロンモードは展開と使用が容易で、分散モードは大規模なデータ移行に適しています。
3.環境構成図
<構成概要> 1) AWSのクラウド環境 東京リージョンに作成したAWS S3のBucketに、移行用テストデータを配置。
2) Alibaba Cloud環境
①HangZhouリージョンにECSを配置し、移行ツール動作環境を作成。 (本書はHangzhouリージョンに例として説明します、必要に応じてリージョンを設定してください) ②移行先として、OSSにBucketを作成。 ③Alibaba Cloud 移行ツールを使って、AWS S3からデータをOSSへ移行。
4.導入手順
本手順では、AWS環境の準備からAlibaba Cloud 移行ツールでオンライン移行を実施し、動作確認までの具体的な手順を記載します。
4-1. AWS環境の準備
本手順書では下記内容でAWS環境を準備します。記載していない項目は任意です。
4-1-1. AWS S3 bucketを作成する
設定項目 | 説明 |
---|---|
リージョン | Tokyo |
リージョン | Asia Pacific (Tokyo) ap-northeast-1 |
バケット名 | s3-to-oss |
アクセス権 | パブリックの許可 |
移行データ | CSV、Hive、Parquet |
①AWSポータルサイトにログインし、S3画面にて「Create bucket」をクリックする
②Bucket作成画面にパブリック名前とリージョンを設定する
④Bucket作成画面にパブリックの許可の同意確認をチェックする
4-1-2. AWS S3 bucketにてフォルダを作成する
4-1-3. AWS S3 bucketにデータを準備する
「ファイルを追加」ボタンをクリックし、各フォルダにデータファイルをアップロードする
4-2. Alibaba Cloud環境の準備
4-2-1.RAMユーザー、AccessKeyとAccessKeySecret の準備
移行作業を実施する、RAMユーザーを準備します。RAMユーザーにはAccessKeyとAccessKeySecretが必要になります。 AccessKeyとAccessKeySecretの作成権限またはVPC、ECS、OSSなどの作成権限をRAMユーザーに付与してください。
4-2-2.VPCの準備
①AlibabaCloudサイトに登録し、コンソール画面にOSSメニューをクリックする
②今回はHangzhouリージョンで選択し、VPC作成メニューをクリックする
4-2-3.ECSインスタンス作成
①ECSメニューをクリックし、ECSコンソール画面に遷移する
②ECS画面でインスタンスの作成ボタンをクリックし、ECS作成画面に遷移する
4-2-4.Object Storage(以下OSS)バケット準備
①OSSメニューをクリックし、OSSコンソール画面に遷移する
②Bukcetメニューをクリックし、Bukcetリスト画面に遷移する
③「CreateBukcet」メニューをクリックし、Bukcet作成画面に遷移する
4-2-5.OSSImportの導入・設定
OSSImportを導入します。ECSインスタンスにrootユーザでログインして実施します。本手順はスタンドアロンモードで実施します。 ①ECSをログインする
# yum install -y unzip# wget http://gosspublic.alicdn.com/ossimport/standalone/ossimport-2.3.1.zip# mkdir ossimport# mv ossimport-2.3.1.zip ossimport# cd ossimport# unzip ossimport-2.3.1.zip
③OSSImportファイルをダウンロードする、zipファイルが正常に解凍されたことを確認する。
4-2-6.同期用コンフィグファイルの作成
①OSSImportコンフィグファイルを設定する
# cp -p conf/local_job.cfg conf/local_job.cfg.bak# vim conf/local_job.cfg
記入例 srcType :ソース元を指定します。今回はS3を指定します
srcType=s3
srcAccessKey:AWS API にアクセスするための AccessKeyIDを記載します
srcAccessKey=*************OXBX
srcSecretKey:AWS API にアクセスするための AccessKeySecretを記載します
srcSecretKey=*************cNum
srcDomain:AWS S3のリージョンをご記入ください
srcDomain=http://s3.ap-northeast-1.amazonaws.com
srcBucket:S3のバケット名を記載します
srcBucket=s3-to-oss
srcPrefix:スペースを指定します
srcPrefix=
destAccessKey:Alibaba Cloud API にアクセスするための AccessKeySecretを記載します
destAccessKey==*************RKwQ
destSecretKey:Alibaba Cloud API にアクセスするための AccessKeyIDを記載します
destSecretKey==*************ofVU
destDomain:Alibaba Cloud OSSのエンドポイントを記載してください。内部ドメイン名を使用してください(非仮想マシンは使用できません) 例:http://oss-cn-hangzhou-internal.aliyuncs.com ドメイン名にバケット接頭辞を含めないでください
destDomain=http://oss-cn-hangzhou-internal.aliyuncs.com
destBucket:Alibaba Cloud OSSのバケット名を記載します
destBucket=awstooss
destPrefix:Alibaba Cloud OSSのディレクトリを記載します 注:OSSは '/'でファイルの先頭をサポートしていません。 '/'で始まる値は記入しないでください
destPrefix=
4-2-7.Java環境の確認とインストール
①java環境の確認。※バージョンは 1.7 以上
# yum install -y java# java -version
4-2-8.OSSImportを起動、データ移行
①OSSImportを起動し、移行元の全データを移行するテストを行います。
# bash import.sh stat
「Clean the previous job, Yes or No:」が表示された場合は「Yes」を入力して、エンターキーを押します。 インポートが終了すると「Stop import service, Yes or No:」が表示されるので「Yes」を入力して、エンターキーを押します。
4-3.データ移行動作確認
4-3-1.データ移行動作確認
①移行先のOSSにログインして、移行が正常に行われたかを確認します。
<注意> 今回はisIncremental=falseに設定しているため、OSSImportを実行した後に、AWS S3にアップロードされたファイルは、実行中の処理の中では移行対象になりません。実行後に追加したデータは、もう一度OSSImportを実行することでファイルを移行できます。 isIncrementalがtrueに設定する場合、incrementalModeIntervalが設定している秒数ごとインクリメンタルデータをスキャンして、インクリメンタルデータを同期します。
5. 移行時間(参考値)
Alibaba Cloud 移行ツールの日本リージョンから日本リージョンまで移行時間の参考値を以下に記載します。
<AWS環境>・データサイズ:5GB<移行時間>Alibaba Cloud 移行ツールのコマンドを実行して、コマンドが終了するまでの時間は次の通りです。移行時間:約15分
今回は日本リージョンからHangzhouリージョンまで実際の移行時間の参考値を以下に記載します。
<AWS環境>・データサイズ:30GB<移行時間>Alibaba Cloud 移行ツールのコマンドを実行して、コマンドが終了するまでの時間は次の通りです。移行時間:約168分