Унификация, аугментация и специализация: лучшие практики команд-участниц первого конкурса в рамках «Экспедиция. Data Science»
Пока в разгаре конкурс «Сканирование», мы расскажем о том, что привело к успеху команды конкурса «Обнаружение». В нём конкурсанты создавали ПО и обучали нейросети для поиска археологических объектов в рельефе. Мы поговорили с экспертами конкурса и узнали, что делали лидеры рейтинга для лучшего результата. Ответы — ниже.
Унифицировали масштаб перед обучением
Снимки из всех источников приводили к одному разрешению — 0,5 м на пиксель. Это стабилизирует обучение и помогает нейронке видеть все объекты в единых величинах.
Агрессивно разделяли большие сцены с перекрытием
Не пугайтесь, ни один театр не пострадал. Нейросетям трудно обработать огромные снимки, поэтому изображения режут на квадраты — тайлы. Лидеры конкурса работали с крупными тайлами 1024–8192 пикселя и добавляли осмысленные перекрытия. Они нужны, чтобы не потерять объекты на стыках тайлов.
Разделяли задачи по специализациям моделей
Вместо одной модели, которая ищет всё сразу, участники создавали по несколько узких — отдельно для каждого класса искомых объектов: городищ и селищ, дорог и караванных путей, пашен и других. Так каждая модель могла лучше выучить свой класс с учётом его особенностей.
Усиливали аугментацию для защиты от переобучения
Аугментация нужна, чтобы модель не зубрила набор данных наизусть, а училась находить один и тот же объект в разных контекстах и умела отсекать лишнее. Для этого данные искусственно множат: создают дополнительные изображения с поворотами, отражениями, иной яркостью, имитацией разного времени суток и не только.
Отбирали классы под целевую метрику
Прагматичный соревновательный ход: обучить модель на всех классах объектов, но для финального файла выбрать лишь те, по которым результат получился лучше всего. Например, курганы, пашни и дороги. Это математически улучшает оценку в конкурсе.
Ставили на качество данных
Фильтровали датасет перед обучением: отбрасывали тайлы с минимальными фрагментами — если там было меньше 10-20% площади большого объекта, который видно на других изображениях. Ещё убирали шумный фон. С таким качеством можно выиграть даже не на самой тяжёлой модели.
Продвинуто валидировали и усредняли веса
Намеренно недодавали модели 20% данных, каждый раз предлагая их в разной комбинации. Так получили 5 моделей, каждая из которых видит картину немного иначе. Затем оценили полноту — число объектов, которые нейросеть нашла в каждой из эпох. Выбрали лучшую эпоху, взяли 2 соседние, усреднили веса всех трёх и присвоили итоговой версии модели. Затем ещё раз обучили её — уже на всех данных.
Проводили гибкую постобработку геометрии после предсказаний
После обучения — улучшали геометрию итоговых данных для точного результата. Отбрасывали слишком мелкие полигоны, склеивали те, что пересекались на стыках тайлов, ставили разные пороги уверенности нейросети для классов: для редких низкие, чтобы ничего не упустить, а для частых высокие, чтобы убрать шум. Дополнительно задавали минимальную площадь в пикселях и метрах, отсекая слишком мелкие случайные сущности.
Заботились о практической инженерной воспроизводимости
И речь не о поколениях инженеров. Воспроизводимость — это когда другой человек, например кто-то из жюри, может запустить код и получить такой же результат. С таким подходом легко проводить эксперименты и улучшать качество модели с каждым разом.
***
Сейчас полным ходом идёт уже следующий конкурс — «Сканирование». В нём решения участников должны будут выявлять археологические объекты даже под землёй. Команды проходят квалификацию и готовят финальные версии решений.
Если хотите узнать больше интересных подробностей конкурса — следите за событиями на сайте Экспедиция. Data Science.
новости
археология
НТИ
22.04.2026
Лучшие практики конкурса «Экспедиция DS. Обнаружение»

археология
ИИ
поиск объектов
техническое зрение
Поделиться новостью
Другие новости
01.05.2026
Фонд НТИ объявляет о старте приема заявок на участие в Конкурсе отдельных заданий №2 Технологического конкурса «Гибридный полет»
30.04.2026
Итоги консультационного мероприятия технологического конкурса «Сверхнизкие орбиты»
29.04.2026
Продление приема заявок на КОЗ № 4 Системы конкурсов "Экспедиция. Земля"
Вас могут заинтересовать






