
Прогнозирование непрерывных целевых переменных с помощью регрессионного анализа
277
9.2.2. Визуализация важных характеристик
набора данных
Исследовательский анализ данных (Exploratory Data Analysis, EDA) — важный и реко-
мендуемый первый шаг перед обучением модели. Мы воспользуемся некоторыми про-
стыми, но полезными методами из набора графических инструментов EDA, которые
помогут нам визуально обнаружить наличие выбросов, а также исследовать распреде-
ление данных и отношения между признаками.
Для начала создадим матрицу диаграмм рассеяния (scatterplot matrix), которая позво-
лит нам визуально отобразить попарные корреляции между ...