Vad är parkettdataformat?
Vad är parkettdataformat?

Video: Vad är parkettdataformat?

Video: Vad är parkettdataformat?
Video: Как Реставрировать Паркет? Секреты Лайфхаки Профессионала 2024, Maj
Anonim

Apache Parkett är en kolumnorienterad gratis och öppen källkod data lagring formatera av Apache Hadoop-ekosystemet. Den är kompatibel med de flesta data bearbetningsramverk i Hadoop-miljön. Det ger effektiv data komprimerings- och kodningsscheman med förbättrad prestanda för att hantera komplexa data i bulk.

Helt enkelt så, vad är filformatet för parkett?

Parkett , en öppen källkod filformat för Hadoop. Parkett lagrar kapslade datastrukturer i en platt kolumn formatera . Jämfört med en traditionell metod där data lagras i radorienterad metod, parkett - är effektivare när det gäller lagring och prestanda.

Dessutom, vad används parkett till? Parkett är ett filformat med öppen källkod tillgängligt för alla projekt i Hadoops ekosystem. Apache Parkett är designad för effektiv och prestanda platt kolumnär lagringsformat av data jämfört med radbaserade filer som CSV- eller TSV-filer.

Dessutom, hur lagrar parkettformat data?

DATA BLOCK Varje block i parkett - filen är lagrat i form av radgrupper. Så, data i en parkett - filen är uppdelad i flera radgrupper. Dessa radgrupper består i sin tur av en eller flera kolumnbitar som motsvarar en kolumn i data uppsättning. De data för varje kolumnbit skriven i form av sidor.

Är parkett läsbar för människor?

ORC, Parkett , och Avro är också maskin- läsbar binära format, det vill säga att filerna ser ut som trams för människor . Om du behöver en människa - läsbar format som JSON eller XML, så bör du förmodligen ompröva varför du använder Hadoop i första hand.

Rekommenderad: