Är s3 baserad på HDFS?
Är s3 baserad på HDFS?

Video: Är s3 baserad på HDFS?

Video: Är s3 baserad på HDFS?
Video: Which filesystem to use HDFS or Amazon S3 2024, April
Anonim

S3 är faktiskt en oändlig lagring i molnet men HDFS är inte. HDFS finns på fysiska maskiner, så du kan köra vilket program som helst där. Du kan inte köra någonting på S3 eftersom det bara är Object Store och inte FS.

Då, är s3 ett distribuerat filsystem?

S3 det är inte en distribuerat filsystem . Det är ett binärt objektlager som lagrar data i nyckel-värdepar. Det är i huvudsak en typ av NoSQL-databas. Varje hink är en ny "databas", med nycklar som din "mappsökväg" och värden är de binära objekten ( filer ).

Man kan också fråga sig, är AWS baserad på Hadoop? Hadoop är ett ramverk som hjälper till att bearbeta stora datamängder över flera datorer. Det inkluderar Map/Reduce (parallell bearbetning) och HDFS (distribuerat filsystem). AWS är ett datalager byggd ovanpå en egenutvecklad teknologi som ursprungligen utvecklades av ParAccel.

Utöver detta, hur överför jag filer från s3 till HDFS?

Svar. Det finns ingen direkt sätt att kopiera filer från S3 till HDFS utan att gå igenom lokalt filer . Däremot kan du använda tSystem-komponenten i ett standardjobb för att anropa det ursprungliga Hadoop kommando du brukar använda till kopiera filer , till exempel, s3 -dist-cp.

Vad är s3 databas?

Amazon S3 eller Amazon Simple Storage Service är en tjänst som erbjuds av Amazon Web Services (AWS) som tillhandahåller objektlagring via ett webbtjänstgränssnitt. Amazon S3 använder samma skalbara lagringsinfrastruktur som Amazon.com använder för att driva sitt globala e-handelsnätverk.

Rekommenderad: