Är spark SQL en databas?
Är spark SQL en databas?

Video: Är spark SQL en databas?

Video: Är spark SQL en databas?
Video: PySpark Tutorial: Spark SQL & DataFrame Basics 2024, November
Anonim

Spark SQL låter dig använda dataramar i Python, Java och Scala; läsa och skriva data i en mängd olika strukturerade format; och fråga Big Data med SQL . Det ger en DataFrame abstraktion i Python, Java och Scala för att förenkla arbetet med strukturerade datamängder. DataFrames liknar tabeller i en relation databas.

Med tanke på detta, är spark en databas?

Gnista används ofta med distribuerade databutiker som MapR XD, Hadoops HDFS och Amazons S3, med populära NoSQL databaser såsom MapR Databas , Apache HBase, Apache Cassandra och MongoDB, och med distribuerade meddelandebutiker som MapR Event Store och Apache Kafka.

vilken databas använder spark? MongoDB

Följaktligen, vad är spark SQL?

Spark SQL är en Gnista modul för strukturerad databehandling. Den tillhandahåller en programmeringsabstraktion som kallas DataFrames och kan också fungera som en distribuerad SQL frågemotor. Det gör att omodifierade Hadoop Hive-frågor kan köras upp till 100 gånger snabbare på befintliga distributioner och data.

Är spark SQL ANSI-kompatibel?

Från och med Gnista 2.0, Gnista är ANSI SQL :2003 kompatibla , som betyder Spark SQL stödjer SQL operationer som inte är tillgängliga på andra dialekter.

Rekommenderad: