Прогнозное моделирование в IBM SPSS Statistics, R и Python. Метод деревьев решений и случайный лес. - IBM - Учебники - Электронная библиотека системного администратора

Реклама

Рубрики

Книги и учебники

Microsoft [186]

Linux, Unix, FreeBSD, Solaris [151]

Oracle [36]

Cisco [41]

IBM [22]

1C [46]

SAS [10]

СУБД и базы данных [57]

Web технологии [131]

Компьютерные сети [125]

Компьютеры, hardware [104]

Защита информации [140]

Программирование [197]

Тестирование ПО [23]

DevOps [21]

Начинающим админам [209]

Общие вопросы по IT [76]

Справочники [202]

Программы

Администрирование [58]

Архиваторы [8]

Безопасность [17]

Полезный софт [32]

Программы для hardware [17]

Работа с DJVU, PDF, FB2 [10]

Сетевые сервисы [17]

Сетевые утилиты [79]

Статистика

Онлайн всего: 1

Гостей: 1

Пользователей: 0

Главная » Учебники » IBM

Прогнозное моделирование в IBM SPSS Statistics, R и Python. Метод деревьев решений и случайный лес.

Прогнозное моделирование в IBM SPSS Statistics, R и Python. Метод деревьев решений и случайный лес.

Автор - Артем Груздев

В книге Артема Груздева "Прогнозное моделирование в IBM SPSS Statistics, R и Python: Метод деревьев решений и случайный лес" рассказывается том, как строить модели дерева решений или модели случайного леса, интерпретировать результаты, оценивать качество полученных моделей, улучшать его, сохранять результаты и применять правила классификации/прогноза, полученные с помощью дерева или случайного леса, к новым данным. Также рассказывается о том, как с помощью дерева решений и случайного леса улучшить модель логистической регрессии. Отдельно рассматривается вопрос автоматизированного поиска оптимальных параметров случайного леса.

Глава 1 кратко знакомит с терминологией метода деревьев решении, в ней рассказывается о преимуществах и недостатках деревьев, задачах, которые можно выполнить с их помощью. Главы 2-6 посвящены построению деревьев решений и случайного леса в IВМ SPSS Statistics 24.0. В главе 2 освещается CHAID - один из самых популярных методов деревьев решений. В главе 3 рассказывается, как можно менять параметры дерева CHAID, влияя на результаты классификации. Здесь же рассказывается о том, как можно выполнить биннинг переменных для включения в модель логистической регрессии, использовав дерево CHAID и случайный лес. Для иллюстрации выбрана конкурсная задача предсказания отклика ОТП Банка. Кроме того, на данном примере показывается, как выполняется предварительная подготовка данных и решаются вопросы, связанные с автоматизацией построения моделей (для этого будет использован командный синтаксис SPSS). Код, автоматизирующий процесс построения прогнозных моделей, вы можете в дальнейшем использовать в собственных проектах. В этой же главе будет рассмотрена разработка ансамбля модели логистической регрессии и дерева CHAID. Глава 4 посвящена методам деревьев CRT и QUEST. В главе 5 рассказывается о редакторе дерева. Глава 6 посвящена методу случайного леса. В ней рассказывается о методологической основе случайного леса, приводятся примеры использования случайного леса для хранения задач классификации и регрессии. Главы 7-11 посвящены построению деревьев решений и случайного леса в R. В главе 7 подробно рассматривается процесс построения и интерпретации дерева решений CHAID в пакете CHAID. В главе 8 применяется пакет rpart, чтобы построить и проанализировать дерево решений CRT. В главе 9 рассказывается, как можно построить модель случайного леса, интерпретировать ее и применить к новым данным, используя пакет randomForest. В ней же будет рассказано как осуществлять оптимизацию параметров случайного леса с помощью пакета caret. Глава 10 посвящена пакету ranger быстрой реализации случайного леса в R, позволяющей работать с большими и высокоразмерными наборами данных. Кроме того, в этом пакете реализована возможность использовать случайный лес не только для решения задач регрессии и классификации, но и для анализа выживаемости. В главе 11 рассказывается о пакете h2o, который позволяет использовать в среде R возможности платформы h2o, разработанной для работы с большими данными. Речь пойдет об алгоритме случайного леса, использующего распределенные вычисления и новейшие эвристики, позволяющие в ряде случаев получить лучшее качество модели. В главе 12 речь пойдет об использовании классов DecisionTreeClassifier, Decision-TreeRegressor, Rando:nForestClassifier и RandonForestRegressor, реализованных в питотоновской библиотеке scikit-learn и предназначенных для построения дерева классификации, дерева регрессии, ансамбля деревьев классификации и ансамбля деревьев регрессии соответственно. В этой же главе будет рассмотрена работа с антоновским модулем h2o и построение распределенного случайного леса с помощью класса H2ORandoTiForestEstisator.

Издание будет интересно маркетологам, риск-аналитикам и другим специалистам, занимающимся разработкой и внедрением прогнозных моделей.

Издательство – ДМК Пресс

Год издания – 2018

Формат книги - PDF

Размер - 59 Мб

"Книга Прогнозное моделирование в IBM SPSS Statistics, R и Python. Метод деревьев решений и случайный лес. Артем Груздев - скачать"