вторник, 3 февраля 2026 г.

Augumentation,

Augumentation, 

Аугментация данных (Data Augmentation) в машинном обучении — это процесс искусственного увеличения объема и разнообразия обучающей выборки путем создания модифицированных копий уже существующих данных.
Это не просто «раздувание» датасета, а способ научить модель игнорировать несущественные изменения (например, поворот картинки) и фокусироваться на главных признаках объекта.
Зачем она нужна?
  1. Борьба с переобучением (Overfitting): Если данных мало, модель просто «зазубривает» их. Аугментация заставляет её обобщать правила, а не запоминать конкретные примеры.
  2. Экономия ресурсов: Сбор и разметка новых реальных данных — это дорого и долго. Аугментация позволяет получить «бесплатные» данные программным путем.
  3. Повышение устойчивости (Robustness): Модель учится распознавать объект в разных условиях: при плохом освещении, под углом или с помехами.
  4. Решение проблемы дисбаланса классов: Если примеров одного класса гораздо меньше, чем другого, можно искусственно «догенерировать» редкий класс.
Как это работает в разных областях?
1. Компьютерное зрение (самый частый кейс)
К изображениям применяют геометрические и цветовые трансформации:
  • Отражение (Flipping): Зеркальное отображение по горизонтали или вертикали.
  • Повороты (Rotation): Наклон объекта на определенный градус.
  • Масштабирование и обрезка (Scaling/Cropping): Приближение фрагмента фото.
  • Изменение цвета: Вариация яркости, контрастности или насыщенности.
  • Добавление шума: Наложение «зернистости», чтобы модель не терялась при плохом качестве фото.
2. Работа с текстом (NLP)
Тут всё сложнее, так как нельзя просто «повернуть» предложение, не потеряв смысл:
  • Замена синонимами: Замена случайных слов их аналогами из словаря.
  • Обратный перевод (Back Translation): Перевод текста на другой язык и обратно (например, Ru → En → Ru) для получения новой формулировки.
  • Случайное удаление/перестановка: Уборка лишних слов или изменение их порядка (если это допустимо).
3. Работа со звуком и сигналами
  • Изменение темпа и тональности: Ускорение или замедление записи.
  • Инъекция фонового шума: Добавление звуков улицы или помех.
Как выполняется аугментация?
  • Оффлайн (Offline): Вы создаете новые файлы заранее и сохраняете их на диск. Это увеличивает размер датасета физически.
  • На лету (Online/On-the-fly): Трансформации применяются прямо во время процесса обучения в оперативной памяти. Каждый раз нейросеть видит немного измененную версию исходного объекта.
Осторожно: Аугментация должна быть логичной. Например, если вы обучаете модель распознавать цифры «6» и «9», поворот на 180 градусов может всё испортить, превратив один класс в другой.

Комментариев нет:

Отправить комментарий