Vad är spark broadcast?
Vad är spark broadcast?

Video: Vad är spark broadcast?

Video: Vad är spark broadcast?
Video: 🔥Why is it Not Patented? Insert Spark Plug into the TV and Watch all the Channels of the World! 2024, Maj
Anonim

Utsända variabler i Apache Gnista är en mekanism för att dela variabler mellan exekutorer som är avsedda att vara skrivskyddad. Utan utsända variabler dessa variabler skulle skickas till varje executor för varje transformation och åtgärd, och detta kan orsaka nätverkskostnader.

På samma sätt frågar folk, när ska jag sända gnista?

Utsända Variabler används oftast när uppgifter över flera steg kräver samma data eller när det krävs cachelagring av data i den deserialiserade formen. Utsända variabler skapas med en variabel v genom att anropa SparkContext.

Dessutom, vad är ackumulatorer och sändningsvariabler i gnista? Gnista stöder två typer av delad variabler : sändningsvariabler , som kan användas för att cache ett värde i minnet på alla noder, och ackumulatorer , vilka är variabler som bara "läggs till", såsom räknare och summor.

Med tanke på detta, vad är gnistackumulator?

Ackumulatorer är variabler som endast "läggs till" genom en associativ operation och kan därför effektivt stödjas parallellt. De kan användas för att implementera räknare (som i MapReduce) eller summor. Gnista stöder inbyggt ackumulatorer av numeriska typer, och programmerare kan lägga till stöd för nya typer.

Hur uppdaterar jag min broadcast-variabel i spark?

  1. Flytta referensdatasökningen till en forEachPartition eller forEachRdd så att den ligger helt på arbetarna.
  2. Starta om Spark Context varje gång refdata ändras, med en ny Broadcast Variable.

Rekommenderad: