Data Engineering With RY: 2. Working Count Using Dataframe

2. Working Count Using Dataframe


from pyspark.sql.functions import split, explode,col
df = spark.read.text("/FileStore/tables/words-1.txt").toDF("line")
words = df.select(explode(split('line',' ')).alias("words")).filter(col('words') !="").groupBy('words').count()
words.show()