Изучаем Spark. Молниеносный анализ данных.
Авторы - Холден Карау, Энди Конвински, Патрик Вендел, Матей Захария
По мере вхождения в обиход анализа данных специалисты-практики во многих областях искали все более простые инструменты для решения этой задачи. Apache Spark быстро завоевал популярность как инструмент, расширяющий и обобщающий модель MapReduce. Фреймворк Spark имеет три основных преимущества. Во-первых, простота в использовании - с его помощью можно создавать приложения на ноутбуке, используя высокоуровневый API, который позволяет сконцентрироваться на предметной стороне вычислений. Во-вторых, высокая скорость работы, что дает возможность создавать интерактивные приложения и использовать сложные алгоритмы. И в-третьих, обобщенность, позволяющая объединять разнотипные вычисления (например, выполнять SQL-запросы, обрабатывать текст и реализовывать алгоритмы машинного обучения (machine learning)), для чего прежде необходимо было применять разрозненные инструменты. Все это делает Spark отличной отправной точкой на пути изучения аспектов обработки «больших данных» (Big Data).
Книга "Изучаем Spark: Молниеносный анализ данных", написанная Холденом Карау, Энди Конвински, Патриком Венделом и Матеем Захарией, является вводным руководством по Spark, целью которого является помочь вам быстро настроить Spark и приступить к работе с ним. Здесь вы узнаете, как загрузить и запустить Spark на своем ноутбуке, как работать с ним в интерактивном режиме, чтобы поближе познакомиться с API. Затем рассматриваются особенности доступных операций и распределенных вычислений. В заключение совершается экскурс по высокоуровневым библиотекам, входящим в состав Spark, включая библиотеки для машинного обучения, потоковой обработки данных (stream processing) и SQL. Авторы надеются, что с этой книгой вы быстро сможете приступить к решению задач, связанных с анализом данных, как на одной, так и на сотнях машин.
Данная книга адресована главным образом специалистам в области анализа данных (или исследователям) и инженерам-программистам.
Издательство – ДМК-Пресс
Год издания – 2015
Формат книги - PDF
Размер - 51,5 Мб
Изучаем Spark. Молниеносный анализ данных. Холден Карау, Энди Конвински, Патрик Вендел, Матей Захария - скачать
|