In this class I cover the basics of pre-processing and running machine learning models in PySpark. First, I review the concept of estimators versus transformers (this is an extremely important topic for the Databricks ML Practitioner Exam). I cover how to perform pre-processing steps including:
One-Hot encoding
Preparing categorical data for processing with StringIndexer
Missing data imputation
Rescaling features
Inputting data into a model with VectorIndexer
Finally, I cover how to run a machine learning model and how to combine all the above steps into a single pipeline optimized for deployment.
To gain access to code, data, and course materials visit https://kelseyemnett.com/2021/07/10/m....
Смотрите видео Machine Learning Basics in PySpark онлайн без регистрации, длительностью часов минут секунд в хорошем качестве. Это видео добавил пользователь Data Analysis Lab 10 Июль 2021, не забудьте поделиться им ссылкой с друзьями и знакомыми, на нашем сайте его посмотрели 98 раз и оно понравилось like людям.