jarパッケージファイル名 | 説明 | ダウンロードアドレス |
cos-distcp-1.12-3.1.0.jar | COSDistCp関連パッケージです。データをCOSNにコピーします | COSDistCpツールをご参照ください |
chdfs_hadoop_plugin_network-2.8.jar | OFSプラグイン |
jarパッケージファイル名 | 説明 | ダウンロードアドレス |
cos-distcp-1.12-3.1.0.jar | COSDistCp関連パッケージです。データをCOSNにコピーします | COSDistCpツールをご参照ください |
chdfs_hadoop_plugin_network-2.8.jar | OFSプラグイン | |
Hadoop-COS | Version >= 8.1.5 | Hadoop-COSツールをご参照ください |
cos_api-bundle | バージョンはHadoop-COSに対応している必要があります |
cosn://bucketname-appid/
メソッドによるメタデータアクセラレーションバケットへのアクセスをサポートしています。core-site.xml
を変更し、変更完了後にすべてのノード上に送信して設定します。データの移行のみの場合は、ビッグデータコンポーネントの再起動は必要ありません。key | value | 設定ファイル | 説明 |
fs.cosn.trsf.fs.ofs.impl | com.qcloud.chdfs.fs.CHDFSHadoopFileSystemAdapter | core-site.xml | COSN実装クラス。入力必須です |
fs.cosn.trsf.fs.AbstractFileSystem.ofs.impl | com.qcloud.chdfs.fs.CHDFSDelegateFSAdapter | core-site.xml | COSN実装クラス。入力必須です |
fs.cosn.trsf.fs.ofs.tmp.cache.dir | 形式は/data/emr/hdfs/tmp/のようになります | core-site.xml | 一時ディレクトリ。入力必須です。MRSの各ノードにはすべて作成し、十分なスペースと権限を保証する必要があります |
fs.cosn.trsf.fs.ofs.user.appid | お客様のCOS bucketに対応するappid | core-site.xml | 入力必須 |
fs.cosn.trsf.fs.ofs.ranger.enable.flag | false | core-site.xml | 入力必須、falseかどうか確認 |
fs.cosn.trsf.fs.ofs.bucket.region | bucketに対応するregion | core-site.xml | 入力必須です。オプション値:eu-frankfurt(フランクフルト)、ap-chengdu(成都)、ap-singapore(シンガポール) |
hdfs:///data/user/target
をcosn://{bucketname-appid}/data/user/target
に移行したいと仮定します。hdfs dfsadmin -disallowSnapshot hdfs:///data/user/hdfs dfsadmin -allowSnapshot hdfs:///data/user/targethdfs dfs -deleteSnapshot hdfs:///data/user/target {現在の日付}hdfs dfs -createSnapshot hdfs:///data/user/target {現在の日付}
hadoop fs -libjars /data01/jars/chdfs_hadoop_plugin_network-2.8.jar -mkdir cosn://bucket-appid/distcp-tmp
nohup hadoop jar /data01/jars/cos-distcp-1.10-2.8.5.jar -libjars /data01/jars/chdfs_hadoop_plugin_network-2.8.jar --src=hdfs:///data/user/target/.snapshot/{現在の日付} --dest=cosn://{bucket-appid}/data/user/target --temp=cosn://bucket-appid/distcp-tmp/ --preserveStatus=ugpt --skipMode=length-checksum --checkMode=length-checksum --cosChecksumType=CRC32C --taskNumber 6 --workerNumber 32 --bandWidth 200 >> ./distcp.log &
CosDistCp CountersBYTES_EXPECTED=10198247BYTES_SKIPPED=10196880FILES_COPIED=1FILES_EXPECTED=7FILES_FAILED=1FILES_SKIPPED=5
統計項目 | 説明 |
BYTES_EXPECTED | ソースディレクトリの統計に基づいてコピーが必要なファイルの合計サイズ。単位:バイト |
FILES_EXPECTED | ディレクトリファイルを含む、ソースディレクトリの統計に基づいてコピーが必要なファイル数 |
BYTES_SKIPPED | 長さまたはチェックサム値が等しく、コピーされないファイルサイズの合計。単位:バイト |
FILES_SKIPPED | 長さまたはチェックサム値が等しく、コピーされないソースファイル数 |
FILES_COPIED | コピーに成功したソースファイル数 |
FILES_FAILED | コピーに失敗したソースファイル数 |
FOLDERS_COPIED | コピーに成功したディレクトリ数 |
FOLDERS_SKIPPED | スキップしたディレクトリ数 |
--delete
パラメータによってHDFSとCOSのデータを完全に一致させることもできます。--delete
パラメータを使用する場合は、--deleteOutput=/xxx(カスタム)
パラメータを含める必要があります。ただし--diffMode
パラメータを含めることはできません。nohup hadoop jar /data01/jars/cos-distcp-1.10-2.8.5.jar -libjars /data01/jars/chdfs_hadoop_plugin_network-2.8.jar --src=--src=hdfs:///data/user/target/.snapshot/{現在の日付} --dest=cosn://{bucket-appid}/data/user/target --temp=cosn://bucket-appid/distcp-tmp/ --preserveStatus=ugpt --skipMode=length-checksum --checkMode=length-checksum --cosChecksumType=CRC32C --taskNumber 6 --workerNumber 32 --bandWidth 200 --delete --deleteOutput=/dele-xx >> ./distcp.log &
trash
ディレクトリに移動し、/xxx/failed
ディレクトリ下に移動ファイルリストが生成されます。trash
ディレクトリ下のデータの削除にはhadoop fs -rm URL
またはhadoop fs -rmr URL
を用いることができます。
この記事はお役に立ちましたか?