Innehållsförteckning:

Hur kan jag förbättra min sqoop-prestanda?
Hur kan jag förbättra min sqoop-prestanda?

Video: Hur kan jag förbättra min sqoop-prestanda?

Video: Hur kan jag förbättra min sqoop-prestanda?
Video: Apache Sqoop Tutorial | Sqoop: Import & Export Data From MySQL To HDFS | Hadoop Training | Edureka 2024, April
Anonim

Att optimera prestanda , uppsättning de antal kartuppgifter till ett värde lägre än de maximalt antal anslutningar som de databas stöder. Kontrollerande de mängd parallellitet som Sqoop kommer att använda för att överföra data är de huvudsakliga sättet att kontrollera de ladda på din databas.

På motsvarande sätt, vad händer om sqoop misslyckas mellan en process?

En typisk Sqoop jobb som matar in data från en källdatabas till HDFS kommer att kopiera data till en målkatalog. Den kopierade filen kommer att raderas om sqoop misslyckas utan att slutföra.

Man kan också fråga sig, hur uppnår man parallellism i sqoop? Kontrollerande Parallellism . Sqoop importerar data parallellt från de flesta databaskällor. Du kan ange antalet kartuppgifter (parallella processer) som ska användas för att utföra importen genom att använda argumentet -m eller --num-mappers. Vart och ett av dessa argument tar ett heltalsvärde som motsvarar graden av parallellitet att anställa

Följaktligen, hur förbättrar jag min Hive-frågeprestanda?

Nedan är listan över metoder som vi kan följa för att optimera Hive-frågor

  1. Aktivera komprimering i Hive.
  2. Optimera sammanfogningar.
  3. Undvik global sortering i Hive.
  4. Aktivera Tez Execution Engine.
  5. Optimera LIMIT-operatör.
  6. Aktivera parallell exekvering.
  7. Aktivera Mapreduce Strict Mode.
  8. Single Reduce för Multi Group BY.

Hur fungerar sqoop split?

Den kan användas för att förbättra importprestandan genom att uppnå större parallellitet. Sqoop skapar delar upp baserat på värden i en viss kolumn i tabellen som specificeras av -- dela -av av användaren genom importkommandot. Om den inte är tillgänglig används primärnyckeln i inmatningstabellen för att skapa delar upp.

Rekommenderad: