Лучшие практики конкурса «Экспедиция DS. Обнаружение»

Унификация, аугментация и специализация: лучшие практики команд-участниц первого конкурса в рамках «Экспедиция. Data Science»

Пока в разгаре конкурс «Сканирование», мы расскажем о том, что привело к успеху команды конкурса «Обнаружение». В нём конкурсанты создавали ПО и обучали нейросети для поиска археологических объектов в рельефе. Мы поговорили с экспертами конкурса и узнали, что делали лидеры рейтинга для лучшего результата. Ответы — ниже.

Унифицировали масштаб перед обучением
Снимки из всех источников приводили к одному разрешению — 0,5 м на пиксель. Это стабилизирует обучение и помогает нейронке видеть все объекты в единых величинах.

Агрессивно разделяли большие сцены с перекрытием
Не пугайтесь, ни один театр не пострадал. Нейросетям трудно обработать огромные снимки, поэтому изображения режут на квадраты — тайлы. Лидеры конкурса работали с крупными тайлами 1024–8192 пикселя и добавляли осмысленные перекрытия. Они нужны, чтобы не потерять объекты на стыках тайлов.

Разделяли задачи по специализациям моделей
Вместо одной модели, которая ищет всё сразу, участники создавали по несколько узких — отдельно для каждого класса искомых объектов: городищ и селищ, дорог и караванных путей, пашен и других. Так каждая модель могла лучше выучить свой класс с учётом его особенностей.

Усиливали аугментацию для защиты от переобучения
Аугментация нужна, чтобы модель не зубрила набор данных наизусть, а училась находить один и тот же объект в разных контекстах и умела отсекать лишнее. Для этого данные искусственно множат: создают дополнительные изображения с поворотами, отражениями, иной яркостью, имитацией разного времени суток и не только.

Отбирали классы под целевую метрику
Прагматичный соревновательный ход: обучить модель на всех классах объектов, но для финального файла выбрать лишь те, по которым результат получился лучше всего. Например, курганы, пашни и дороги. Это математически улучшает оценку в конкурсе.

Ставили на качество данных
Фильтровали датасет перед обучением: отбрасывали тайлы с минимальными фрагментами — если там было меньше 10-20% площади большого объекта, который видно на других изображениях. Ещё убирали шумный фон. С таким качеством можно выиграть даже не на самой тяжёлой модели.

Продвинуто валидировали и усредняли веса
Намеренно недодавали модели 20% данных, каждый раз предлагая их в разной комбинации. Так получили 5 моделей, каждая из которых видит картину немного иначе. Затем оценили полноту — число объектов, которые нейросеть нашла в каждой из эпох. Выбрали лучшую эпоху, взяли 2 соседние, усреднили веса всех трёх и присвоили итоговой версии модели. Затем ещё раз обучили её — уже на всех данных.

Проводили гибкую постобработку геометрии после предсказаний
После обучения — улучшали геометрию итоговых данных для точного результата. Отбрасывали слишком мелкие полигоны, склеивали те, что пересекались на стыках тайлов, ставили разные пороги уверенности нейросети для классов: для редких низкие, чтобы ничего не упустить, а для частых высокие, чтобы убрать шум. Дополнительно задавали минимальную площадь в пикселях и метрах, отсекая слишком мелкие случайные сущности.

Заботились о практической инженерной воспроизводимости
И речь не о поколениях инженеров. Воспроизводимость — это когда другой человек, например кто-то из жюри, может запустить код и получить такой же результат. С таким подходом легко проводить эксперименты и улучшать качество модели с каждым разом.

***

Сейчас полным ходом идёт уже следующий конкурс — «Сканирование». В нём решения участников должны будут выявлять археологические объекты даже под землёй. Команды проходят квалификацию и готовят финальные версии решений.

Если хотите узнать больше интересных подробностей конкурса — следите за событиями на сайте Экспедиция. Data Science.

археология

ИИ

поиск объектов

техническое зрение

Поделиться новостью