Аннотация: Расширенная аналитика с PySpark
Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP.| Издательство | BHV(БХВ) |
| Автор/составитель | Ласерсон Ури;Тандон Акаш;Райза Сэнди |
| Серия | O'REILLY |
| Год выпуска | 2023 |
| Кол-во страниц | 224 |
| ISBN | 978-5-9775-1770-6 |
| Обложка | мягкая обложка |
| Вес | 299г |
| Формат | 17 x 25 cm |
| Тираж | 1000 |
| Возрастная категория | 16+ |