Hadoopдо DistCp деген эмне?
Hadoopдо DistCp деген эмне?

Video: Hadoopдо DistCp деген эмне?

Video: Hadoopдо DistCp деген эмне?
Video: Hadoop Day to Day Operations - Distcp - Data back ups and migration 2024, Апрель
Anonim

Discp (бөлүштүрүлгөн көчүрмө) чоң аралык/кластер аралык көчүрүү үчүн колдонулган курал. Ал колдонот MapReduce аны бөлүштүрүү, каталарды иштетүү жана калыбына келтирүү жана отчеттуулукту ишке ашыруу. Ал файлдардын жана каталогдордун тизмесин карта тапшырмаларына киргизүүгө кеңейтет, алардын ар бири булак тизмесинде көрсөтүлгөн файлдардын бөлүгүн көчүрөт.

Ошо сыяктуу эле, кимдир бирөө сурашы мүмкүн, Distcp үстүнөн жазабы?

Мен дагы кээ бир нерселерди тактап, түшүндүрүшүм керек distcp - үстүнө жазуу болот үстүнө жазуу файлдын өлчөмү дал келеби же жокпу. Бул hdfs-nn2 өлчөмү боюнча hdfs-nn1ге дал келбеген бардык файлдарды жаңыртат, ошондой эле бардык ашыкча файлдарды жок кылат.

Ошо сыяктуу эле, Hadoop FS буйругу деген эмне? Файл системасы ( FS ) кабыкча ар кандай кабык сымал кирет буйруктар менен түздөн-түз өз ара аракеттенет Hadoop Бөлүштүрүлгөн файл системасы ( HDFS ) ошондой эле башка файл системалары Hadoop колдоо, мисалы, жергиликтүү FS , HFTP FS , S3 FS , жана башкалар.

Ушундай жол менен, мен кантип маалыматтарды бир Hdfs башка Hdfs өткөрүп берем?

Hadoop fs cp – Эң оңой бирден маалыматтарды көчүрүү жолу булак каталогуна башка . колдонуу hadoop fs -cp [булак] [көздөгөн жери]. Hadoop fs copyFromLocal – Керек маалыматтарды көчүрүү жергиликтүү файл тутумунан HDFS ? колдонуу hadoop fs -copyFromLocal [булак] [дестинация].

Кантип кластерди бир кластерден экинчисине көчүрөм?

Файлдарды көчүрүү ортосунда кластерлер . Сенин колуңдан келет файлдарды көчүрүү же ар түрдүү ортосундагы каталогдор кластерлер hadoop distcp буйругун колдонуу менен. Сиз ишеним грамотасын камтууга тийиш файл сенин көчүрүү булактан суранабыз кластер булактан ырасталганыңызды ырастай алат кластер жана максат кластер.

Сунушталууда: