모듈 이름 | COSN 빅 데이터 모듈 지원 현황 | 서비스 모듈 재시작 필요 여부 |
Yarn | 지원 | NodeManager 재시작 |
Hive | 지원 | HiveServer 및 HiveMetastore 재시작 |
Spark | 지원 | NodeManager 재시작 |
Sqoop | 지원 | NodeManager 재시작 |
Presto | 지원 | HiveServer, HiveMetastore, Presto 재시작 |
Flink | 지원 | 필요 없음 |
Impala | 지원 | 필요 없음 |
EMR | 지원 | 필요 없음 |
자체구축 모듈 | 향후 지원 | 필요 없음 |
HBase | 권장하지 않음 | 필요 없음 |
<property><name>fs.cosn.userinfo.secretId</name><value>AK***</value></property><property><name>fs.cosn.userinfo.secretKey</name><value></value></property><property><name>fs.cosn.impl</name><value>org.apache.hadoop.fs.CosFileSystem</value></property><property><name>fs.AbstractFileSystem.cosn.impl</name><value>org.apache.hadoop.fs.CosN</value></property><property><name>fs.cosn.bucket.region</name><value>ap-shanghai</value></property>
COSN 매개변수 | 값 | 설명 |
fs.cosn.userinfo.secretId | AKxxxx | Tencent Cloud 계정의 API 키 정보 |
fs.cosn.userinfo.secretKey | Wpxxxx | Tencent Cloud 계정의 API 키 정보 |
fs.cosn.bucket.region | ap-shanghai | COS 버킷이 있는 리전 |
fs.cosn.impl | org.apache.hadoop.fs.CosFileSystem | FileSystem용 cosn 구현 클래스. org.apache.hadoop.fs.CosFileSystem으로 고정 |
fs.AbstractFileSystem.cosn.impl | org.apache.hadoop.fs.CosN | AbstractFileSystem에 대한 cosn 구현 클래스. org.apache.hadoop.fs.CosN으로 고정 |
cp hadoop-cos-2.7.3-shaded.jar /opt/cloudera/parcels/CDH-5.16.1-1.cdh5.16.1.p0.3/lib/hadoop-hdfs/
hadoop jar ./hadoop-mapreduce-examples-2.7.3.jar teragen -Dmapred.job.maps=500 -Dfs.cosn.upload.buffer=mapped_disk -Dfs.cosn.upload.buffer.size=-1 1099 cosn://examplebucket-1250000000/terasortv1/1k-inputhadoop jar ./hadoop-mapreduce-examples-2.7.3.jar terasort -Dmapred.max.split.size=134217728 -Dmapred.min.split.size=134217728 -Dfs.cosn.read.ahead.block.size=4194304 -Dfs.cosn.read.ahead.queue.size=32 cosn://examplebucket-1250000000/terasortv1/1k-input cosn://examplebucket-1250000000/terasortv1/1k-output
cosn://schema
뒷부분을 사용자 빅 데이터 비즈니스의 버킷 경로로 변경하십시오.CREATE TABLE `report.report_o2o_pid_credit_detail_grant_daily`(`cal_dt` string,`change_time` string,`merchant_id` bigint,`store_id` bigint,`store_name` string,`wid` string,`member_id` bigint,`meber_card` string,`nickname` string,`name` string,`gender` string,`birthday` string,`city` string,`mobile` string,`credit_grant` bigint,`change_reason` string,`available_point` bigint,`date_time` string,`channel_type` bigint,`point_flow_id` bigint)PARTITIONED BY (`topicdate` string)ROW FORMAT SERDE'org.apache.hadoop.hive.ql.io.orc.OrcSerde'STORED AS INPUTFORMAT'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'OUTPUTFORMAT'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'LOCATION'cosn://examplebucket-1250000000/user/hive/warehouse/report.db/report_o2o_pid_credit_detail_grant_daily'TBLPROPERTIES ('last_modified_by'='work','last_modified_time'='1589310646','transient_lastDdlTime'='1589310646')
select count(1) from report.report_o2o_pid_credit_detail_grant_daily;
spark-submit --class org.apache.spark.examples.JavaWordCount --executor-memory 4g --executor-cores 4 ./spark-examples-1.6.0-cdh5.16.1-hadoop2.6.0-cdh5.16.1.jar cosn://examplebucket-1250000000/wordcount
sqoop import --connect "jdbc:mysql://IP:PORT/mysql" --table sqoop_test --username root --password 123** --target-dir cosn://examplebucket-1250000000/sqoop_test
select * from cosn_test_table where bucket is not null limit 1;
문제 해결에 도움이 되었나요?