| ||||||||||
Изучаем Spark. Молниеносный анализ данных — Холден Карау, Энди Конвински, Патрик Венделл
Быстрый заказ Быстрый заказ — это заказ 1 товара в 1 клик! |
|
Описание
"Изучаем Spark. Молниеносный анализ данных". Холден Карау, Энди Конвински, Патрик Венделл
Авторы – разработчики Spark. Холден Карау – ведущий инженер, занимается разработкой программного обеспечения на Databricks. Энди Конвински - соучредитель Databricks. Принимал участие в проекте Apache Mesos. Патрик Венделл - инженер Databricks.
Информационный поток постоянно увеличивается, данных становится все больше. В этой книге рассказывается, как работать с ними эффективно. Книга дает возможность быстро погрузиться в возможности Spark. Apache Spark - открытая система кластерных вычислений. Дает возможность разрабатывать программы с высокой производительностью анализа данных. Используя Spark можно манипулировать значительными объемами данных. В книге рассказывается, каким образом можно выполнять задания параллельно, приводятся примеры, начиная от простых приложений до программ, которые выполняют обработку потоковых данных и применяют алгоритмы машинного обучения. Авторы предлагают использовать одну парадигму программирования, а не смешивать и сопоставлять несколько инструментов. Вы узнаете, как развернуть интерактивные партии, как осуществить подключение к источникам данных, в том числе HDFS, Hive, JSON, S3.
Авторы – разработчики Spark. Холден Карау – ведущий инженер, занимается разработкой программного обеспечения на Databricks. Энди Конвински - соучредитель Databricks. Принимал участие в проекте Apache Mesos. Патрик Венделл - инженер Databricks.
Информационный поток постоянно увеличивается, данных становится все больше. В этой книге рассказывается, как работать с ними эффективно. Книга дает возможность быстро погрузиться в возможности Spark. Apache Spark - открытая система кластерных вычислений. Дает возможность разрабатывать программы с высокой производительностью анализа данных. Используя Spark можно манипулировать значительными объемами данных. В книге рассказывается, каким образом можно выполнять задания параллельно, приводятся примеры, начиная от простых приложений до программ, которые выполняют обработку потоковых данных и применяют алгоритмы машинного обучения. Авторы предлагают использовать одну парадигму программирования, а не смешивать и сопоставлять несколько инструментов. Вы узнаете, как развернуть интерактивные партии, как осуществить подключение к источникам данных, в том числе HDFS, Hive, JSON, S3.
Отзывы
Новости
- 31.12.2023
- График работы: 1-2 января 2024 магазин не работает!
- 10.04.2022
- График работы во время войны
- 05.01.2022
- Если не дозвонились ?
Написать отзыв
Задать вопрос