Vad är DistCp i Hadoop?
Vad är DistCp i Hadoop?

Video: Vad är DistCp i Hadoop?

Video: Vad är DistCp i Hadoop?
Video: Hadoop Day to Day Operations - Distcp - Data back ups and migration 2024, November
Anonim

DistCp (distribuerad kopia) är ett verktyg som används för stor kopiering mellan/intra kluster. Det använder MapReduce för att genomföra dess distribution, felhantering och återställning samt rapportering. Den expanderar en lista med filer och kataloger till indata för kartuppgifter, som var och en kommer att kopiera en partition av filerna som anges i källlistan.

På samma sätt kan man fråga sig, skriver Distcp över?

Jag borde också utveckla en del och förklara det distcp - skriva över kommer skriva över filen oavsett om storleken matchar eller inte. Detta kommer att uppdatera alla filer i hdfs-nn2 som inte matchar i storlek från hdfs-nn1, samt radera eventuella främmande filer.

På samma sätt, vad är Hadoop FS-kommandot? Filsystemet ( FS ) skal inkluderar olika skalliknande kommandon som direkt interagerar med Hadoop Distribuerat filsystem ( HDFS ) samt andra filsystem som Hadoop stöder, till exempel Local FS HFTP FS , S3 FS , och andra.

På så sätt, hur överför jag data från en hdfs till en annan hdfs?

Hadoop fs cp – Enklast sätt att kopiera data från en källkatalog till annan . Använd hadoop fs -cp [källa] [destination]. Hadoop fs copyFromLocal – Behöver kopiera data från det lokala filsystemet till HDFS ? Använd hadoop fs -copyFromLocal [källa] [destination].

Hur kopierar jag ett kluster från ett kluster till ett annat?

Kopiera filer mellan kluster . Du kan kopiera filer eller kataloger mellan olika kluster genom att använda kommandot hadoop distcp. Du måste inkludera autentiseringsuppgifter fil i din kopiera begära så källan klunga kan verifiera att du är autentiserad till källan klunga och målet klunga.

Rekommenderad: