Vad är AWS MapReduce?
Vad är AWS MapReduce?

Video: Vad är AWS MapReduce?

Video: Vad är AWS MapReduce?
Video: Create and Execute MapReduce in Eclipse 2024, November
Anonim

Amazon Elastic MapReduce (EMR) är en Amazon Web Services ( AWS ) verktyg för stordatabearbetning och analys. Amazon EMR bearbetar stora data över ett Hadoop-kluster av virtuella servrar på Amazon Elastic Compute Cloud (EC2) och Amazon Simple Storage Service (S3).

På detta sätt, hur fungerar AWS EMR?

Tjänsten startar ett kundspecificerat antal Amazon EC2-instanser, bestående av en master och flera andra noder. Amazon EMR kör programvaran Hadoop på dessa instanser. Masternoden delar in indata i block och distribuerar bearbetningen av blocken till de andra noderna.

Förutom ovan, vad är skillnaden mellan ec2 och EMR? Till skillnad från EMR , EC2 kategoriserar inte slavnoder i kärn- och uppgiftsnoder. Detta ökar risken för att förlora HDFS-data om en nod tas bort/försvinner. EC2 använder Apache-bibliotek (s3a) för att komma åt data på s3. Å andra sidan, EMR använder AWS proprietär kod för att få snabbare åtkomst till s3.

Dessutom, hanteras AWS EMR helt?

Amazon Elastic MapReduce ( EMR ) är en helt hanteras Hadoop och Spark plattform från Amazon Webb-service ( AWS ). Med EMR , AWS kunder kan snabbt spinna upp Hadoop-kluster med flera noder för att bearbeta big data-arbetsbelastningar.

Använder AWS Hadoop?

Amazon Webbservice använder Apache med öppen källkod Hadoop distribuerad datorteknik för att göra det lättare att komma åt stora mängder datorkraft för att köra dataintensiva uppgifter. Hadoop , öppen källkodsversionen av Googles MapReduce, används redan av företag som Yahoo och Facebook.

Rekommenderad: