Обучение предиктивного элемента ML-модели

Kaspersky MLAD позволяет выполнить обучение предиктивного элемента для ML-модели, созданной вручную, импортированной в Kaspersky MLAD, созданной по шаблону, а также для скопированной ML-модели.

Обучение элементов ML-моделей доступно системным администраторам и пользователям с правом Обучение моделей из группы прав Управление ML-моделями. Функциональность доступна после добавления лицензионного ключа.

Чтобы обучить элемент ML-модели:

В основном меню выберите раздел Модели.
В дереве активов выберите предиктивный элемент, который вы хотите обучить.
Справа отобразится список параметров.
Откройте вкладку Обучение и нажмите на кнопку Изменить в правом верхнем углу окна.
В поле Интервал отбора данных укажите интервал времени данных, на которых требуется обучить ML-модель.
Если требуется применить разметки для отбора данных для обучения ML-модели в рамках выбранного интервала, в поле Разметки выберите одну или несколько разметок.
Выбранные разметки сформируют индикатор обучения.

Совокупность критериев, на основании которых определяются интервалы времени данных, на которых ML-модель выполняет обучение.
Если требуется просмотреть, какие данные будут отобраны разметками, нажмите на кнопку На графике.
Разметки отобразятся в указанных при создании цветах.

При просмотре данных на графике вы можете выбрать определенный пресет.
Если требуется задать расширенные параметры обучения, включите переключатель Расширенные параметры обучения.
В поле Максимальная продолжительность обучения (сек.) укажите в секундах максимальное время, которое сервер Kaspersky MLAD может затратить на обучение ML-модели.
В поле Размер валидационной выборки укажите в виде десятичной дроби долю валидационной выборки относительно всего набора данных для обучения ML-модели.
Вы можете указать значение в диапазоне от 0 до 1.

По умолчанию этот параметр имеет значение 0.2.
В поле Максимальное количество эпох укажите максимальное количество эпох для обучения ML-модели.
По умолчанию этот параметр имеет значение 500.
В поле Количество эпох для ранней остановки обучения укажите количество эпох, в течение которых качество обучения не улучшается для ранней остановки обучения ML-модели.
Ранняя остановка обучения ML-модели применяется для избежания переобучения модели. При этом обучение ML-модели считается успешно завершившимся.

По умолчанию этот параметр имеет значение 15.
В поле Разрешение графиков результатов обучения укажите в виде десятичной дроби разрешение графиков для отображения результатов обучения на вкладке Результаты обучения.
Вы можете указать значение в диапазоне от 0 до 1.
В поле Размер пакета укажите количество элементов выборки, которое требуется передать на обучение в рамках итерации.
По умолчанию этот параметр имеет значение 16.

Этот параметр недоступен для элемента с TCN-архитектурой.
В поле Количество блоков укажите количество блоков, на которое требуется разбить данные для обучения ML-модели.
По умолчанию этот параметр имеет значение 4.
В раскрывающемся списке Режим инференса выберите одно из следующих значений:
- Если требуется загрузить все пакеты данных для обучения в оперативную память, выберите Быстрый инференс.
  Этот режим инференса позволяет выполнить инференс быстрее.
- Если требуется загружать в оперативную память по одному пакету данных, выберите Экономия памяти.
  Этот режим инференса позволяет выполнить инференс с минимальными затратами оперативной памяти, но медленнее, чем в режиме Быстрый инференс.
В раскрывающемся списке Режим обучения выберите одно из следующих значений:
- Если требуется загрузить все данные для обучения модели в оперативную память, выберите Загрузить все данные в оперативную память.
- Если требуется загружать в оперативную память по одному блоку данных и сформировать валидационные блоки из конца набора данных, выберите Сформировать валидационные блоки из конца данных.
- Если требуется загружать в оперативную память по одному блоку данных без формирования валидационных блоков, выберите Проводить валидацию в каждом блоке обучающих данных.
  Валидационные данные формируются из каждого обучающего блока данных.
В раскрывающемся списке Режим распределения памяти выберите один из следующих параметров:
- Зарезервировать минимальный объем свободной памяти. При выборе этого параметра при обучении ML-модели служба Trainer будет оставлять свободным минимальный объем памяти, указанный в поле Объем памяти, МБ.
- Зарезервировать максимальный объем памяти на обучение модели. При выборе этого параметра для обучения ML-модели служба Trainer будет использовать максимальный объем оперативной памяти, указанный в поле Объем памяти, МБ.
Если требуется учесть результаты предыдущего обучения при обучении ML-модели на новых данных, включите параметр Инициализировать веса модели значениями из результатов предыдущего обучения.
Если требуется перемешать данные для улучшения качества обучения ML-модели, включите параметр Перемешать данные.
В поле Инициализация генератора псевдослучайных чисел укажите значение, на основании которого будет сгенерирована последовательность псевдослучайных чисел.
В поле Коэффициент скорости обучения укажите коэффициент, с помощью которого будут корректироваться веса элемента ML-модели на каждой итерации обучения.
По умолчанию этот параметр имеет значение 0.0001.
В раскрывающемся списке Алгоритм оптимизации обучения выберите один из следующих алгоритмов:
- Adadelta – алгоритм, основанный на адаптивной скорости обучения для каждого измерения.
- Adagrad – алгоритм, в котором скорость обучения зависит от частоты обновления параметров во время обучения.
- Adam – алгоритм, основанный на адаптивной оценке первого и второго момента распределения параметров.
- RMSprop – алгоритм, использующий скользящее среднее квадратов градиента для адаптивного нормирования скорости обучения на каждом шаге.
- SGD – алгоритм стохастического градиентного спуска.
В раскрывающемся списке Функция потерь выберите одну из следующих функций:
- MSE – для расчета среднеквадратичной ошибки.
- MSLE – для расчета средней логарифмической ошибки.
- MAE – для расчета средней абсолютной ошибки.
- MAPE – для расчета средней абсолютной процентной ошибки.
В правом верхнем углу окна нажмите на кнопку Сохранить.
В случае изменения параметров обучения для ранее обученного элемента необходимо подтвердить сохранение изменений.
В информационном блоке, расположенном над параметрами обучения, нажмите на кнопку Обучить элемент.
В информационном блоке будет отображаться номер текущей эпохи обучения элемента.

После завершения обучения вы можете просмотреть результаты обучения элемента ML-модели на вкладке Результаты обучения.

После успешного обучения всех предиктивных элементов и элементов на основе эллиптического конверта в составе ML-модели ей будет присвоен статус Обучена. Если требуется, вы можете повторно обучить элемент ML-модели, нажав на кнопку Перезапустить обучение.

В начало