Hello Everyone,
from pyspark.sql import Row
from pyspark.sql.types import StructType, StructField, IntegerType, StringType, DoubleType
from pyspark.sql.functions import *
schema = StructType([
StructField("id", IntegerType(), nullable=False),
StructField("name", StringType(), nullable=False),
StructField("age", IntegerType(), nullable=False),
StructField("department", StringType(), nullable=False),
StructField("salary", DoubleType(), nullable=False)
])
data = [
Row(1, "John", 30, "Sales", 50000.0),
Row(2, "Alice", 28, "Marketing", 60000.0),
Row(3, "Bob", 32, "Finance", 55000.0),
Row(4, "Sarah", 29, "Sales", 52000.0),
Row(5, "Mike", 31, "Finance", 58000.0)
]
employeeDF = spark.createDataFrame(data, schema)
display(employeeDF)
This series is for beginners and intermediate level candidates who wants to crack PySpark interviews
Here is the link to the course : https://www.geekcoders.co.in/courses/...
#pyspark #interviewquestions #interview #pysparkinterview #dataengineer #aws #databricks #python
Смотрите видео PySpark Coding Question - Accenture and TCS | PySpark Interview Question | онлайн без регистрации, длительностью часов минут секунд в хорошем качестве. Это видео добавил пользователь GeekCoders 27 Май 2024, не забудьте поделиться им ссылкой с друзьями и знакомыми, на нашем сайте его посмотрели 3,65 раз и оно понравилось 5 людям.