Augumentation,
Аугментация данных (Data Augmentation) в машинном обучении — это процесс искусственного увеличения объема и разнообразия обучающей выборки путем создания модифицированных копий уже существующих данных.
Это не просто «раздувание» датасета, а способ научить модель игнорировать несущественные изменения (например, поворот картинки) и фокусироваться на главных признаках объекта.
Зачем она нужна?
- Борьба с переобучением (Overfitting): Если данных мало, модель просто «зазубривает» их. Аугментация заставляет её обобщать правила, а не запоминать конкретные примеры.
- Экономия ресурсов: Сбор и разметка новых реальных данных — это дорого и долго. Аугментация позволяет получить «бесплатные» данные программным путем.
- Повышение устойчивости (Robustness): Модель учится распознавать объект в разных условиях: при плохом освещении, под углом или с помехами.
- Решение проблемы дисбаланса классов: Если примеров одного класса гораздо меньше, чем другого, можно искусственно «догенерировать» редкий класс.
Как это работает в разных областях?
1. Компьютерное зрение (самый частый кейс)
К изображениям применяют геометрические и цветовые трансформации:
- Отражение (Flipping): Зеркальное отображение по горизонтали или вертикали.
- Повороты (Rotation): Наклон объекта на определенный градус.
- Масштабирование и обрезка (Scaling/Cropping): Приближение фрагмента фото.
- Изменение цвета: Вариация яркости, контрастности или насыщенности.
- Добавление шума: Наложение «зернистости», чтобы модель не терялась при плохом качестве фото.
2. Работа с текстом (NLP)
Тут всё сложнее, так как нельзя просто «повернуть» предложение, не потеряв смысл:
- Замена синонимами: Замена случайных слов их аналогами из словаря.
- Обратный перевод (Back Translation): Перевод текста на другой язык и обратно (например, Ru → En → Ru) для получения новой формулировки.
- Случайное удаление/перестановка: Уборка лишних слов или изменение их порядка (если это допустимо).
3. Работа со звуком и сигналами
- Изменение темпа и тональности: Ускорение или замедление записи.
- Инъекция фонового шума: Добавление звуков улицы или помех.
Как выполняется аугментация?
- Оффлайн (Offline): Вы создаете новые файлы заранее и сохраняете их на диск. Это увеличивает размер датасета физически.
- На лету (Online/On-the-fly): Трансформации применяются прямо во время процесса обучения в оперативной памяти. Каждый раз нейросеть видит немного измененную версию исходного объекта.
Осторожно: Аугментация должна быть логичной. Например, если вы обучаете модель распознавать цифры «6» и «9», поворот на 180 градусов может всё испортить, превратив один класс в другой.
Комментариев нет:
Отправить комментарий