Hadoop. Подробное руководство.
Автор - Том Уайт
Apache Hadoop — фреймворк с открытым исходным кодом, в котором реализована вычислительная парадигма, известная как MapReduce, позволившая Google построить свою империю. Эта книга покажет вам, как использовать всю мощь Hadoop, чтобы создавать надежные, масштабируемые, распределенные системы и обрабатывать гигантские наборы данных. Программисты найдут здесь методики анализа, администраторы узнают, как установить и запустить кластеры Hadoop. Если вы работаете с большими массивами данных, гигабайтами или петабайтами информации, то Hadoop — это идеальное решение.
«Hadoop: Подробное руководство» - написанная Томом Уайтом книга, в которой досконально и доступно описаны все возможности Apache Hadoop. Издание охватывает последние изменения Hadoop, в том числе материалы по новой исполнительной среде MapReduce, - называемой MapReduce 2, которая реализована на базе системы YARN (Yet Another Resource Negotiator) — общей системы управления ресурсами для распределенных приложений. В главе 1 объясняется необходимость создания Hadoop и описывается история проекта. Глава 2 знакомит читателя с MapReduce. В главе 3 подробно рассматриваются файловые системы Hadoop (прежде всего HDFS). В главе 4 изложены основные принципы ввода/вывода в Hadoop: целостность данных, сжатие, сериализация и структуры данных на базе файлов. Следующие четыре главы содержат подробное описание MapReduce. В главе 5 перечислены практические действия, необходимые для разработки приложений MapReduce. В главе 6 рассматривается реализация MapReduce в Hadoop с точки зрения пользователя. Глава 7 посвящена модели программирования MapReduce и различным форматам данных, с которыми может работать MapReduce. В главе 8 рассматриваются нетривиальные аспекты MapReduce, включая сортировку и объединение данных. Главы 9 и 10 предназначены для администраторов Hadoop. В них читатель узнает, как организуется настройка и сопровождение кластеров Hadoop с HDFS и MapReduce. Дальнейшие главы посвящены проектам, построенным на базе Hadoop или связанным с этой технологией. В главах 11 и 12 представлены Pig и Hive — аналитические платформы на базе HDFS и MapReduce, тогда как в главах 13, 14 и 15 описаны HBase, ZooKeeper и Sqoop соответственно.
Издательство – Питер
Год издания – 2013
Формат книги - PDF, DOC
Размер - 15,3 Мб
СКАЧАТЬ с gigapeta.com
Или
СКАЧАТЬ с turbobit.net
Или
СКАЧАТЬ с hitfile.net
Любители печатных изданий могут заказать бумажный экземпляр этой же книги здесь:
|