Прогнозное моделирование в IBM SPSS Statistics, R и Python. Метод деревьев решений и случайный лес.
Автор - Артем Груздев
В книге Артема Груздева "Прогнозное моделирование в IBM SPSS Statistics, R и Python: Метод деревьев решений и случайный лес" рассказывается том, как строить модели дерева решений или модели случайного леса, интерпретировать результаты, оценивать качество полученных моделей, улучшать его, сохранять результаты и применять правила классификации/прогноза, полученные с помощью дерева или случайного леса, к новым данным. Также рассказывается о том, как с помощью дерева решений и случайного леса улучшить модель логистической регрессии. Отдельно рассматривается вопрос автоматизированного поиска оптимальных параметров случайного леса.
Глава 1 кратко знакомит с терминологией метода деревьев решении, в ней рассказывается о преимуществах и недостатках деревьев, задачах, которые можно выполнить с их помощью. Главы 2-6 посвящены построению деревьев решений и случайного леса в IВМ SPSS Statistics 24.0. В главе 2 освещается CHAID - один из самых популярных методов деревьев решений. В главе 3 рассказывается, как можно менять параметры дерева CHAID, влияя на результаты классификации. Здесь же рассказывается о том, как можно выполнить биннинг переменных для включения в модель логистической регрессии, использовав дерево CHAID и случайный лес. Для иллюстрации выбрана конкурсная задача предсказания отклика ОТП Банка. Кроме того, на данном примере показывается, как выполняется предварительная подготовка данных и решаются вопросы, связанные с автоматизацией построения моделей (для этого будет использован командный синтаксис SPSS). Код, автоматизирующий процесс построения прогнозных моделей, вы можете в дальнейшем использовать в собственных проектах. В этой же главе будет рассмотрена разработка ансамбля модели логистической регрессии и дерева CHAID. Глава 4 посвящена методам деревьев CRT и QUEST. В главе 5 рассказывается о редакторе дерева. Глава 6 посвящена методу случайного леса. В ней рассказывается о методологической основе случайного леса, приводятся примеры использования случайного леса для хранения задач классификации и регрессии. Главы 7-11 посвящены построению деревьев решений и случайного леса в R. В главе 7 подробно рассматривается процесс построения и интерпретации дерева решений CHAID в пакете CHAID. В главе 8 применяется пакет rpart, чтобы построить и проанализировать дерево решений CRT. В главе 9 рассказывается, как можно построить модель случайного леса, интерпретировать ее и применить к новым данным, используя пакет randomForest. В ней же будет рассказано как осуществлять оптимизацию параметров случайного леса с помощью пакета caret. Глава 10 посвящена пакету ranger быстрой реализации случайного леса в R, позволяющей работать с большими и высокоразмерными наборами данных. Кроме того, в этом пакете реализована возможность использовать случайный лес не только для решения задач регрессии и классификации, но и для анализа выживаемости. В главе 11 рассказывается о пакете h2o, который позволяет использовать в среде R возможности платформы h2o, разработанной для работы с большими данными. Речь пойдет об алгоритме случайного леса, использующего распределенные вычисления и новейшие эвристики, позволяющие в ряде случаев получить лучшее качество модели. В главе 12 речь пойдет об использовании классов DecisionTreeClassifier, Decision-TreeRegressor, Rando:nForestClassifier и RandonForestRegressor, реализованных в питотоновской библиотеке scikit-learn и предназначенных для построения дерева классификации, дерева регрессии, ансамбля деревьев классификации и ансамбля деревьев регрессии соответственно. В этой же главе будет рассмотрена работа с антоновским модулем h2o и построение распределенного случайного леса с помощью класса H2ORandoTiForestEstisator.
Издание будет интересно маркетологам, риск-аналитикам и другим специалистам, занимающимся разработкой и внедрением прогнозных моделей.
Издательство – ДМК Пресс
Год издания – 2018
Формат книги - PDF
Размер - 59 Мб
"Книга Прогнозное моделирование в IBM SPSS Statistics, R и Python. Метод деревьев решений и случайный лес. Артем Груздев - скачать"
|