Эксперты представили технологический барьер конкурса Up Great ПРО//ЧТЕНИЕ

24 апреля 2020

23 апреля состоялась онлайн-конференция «Нас слышат, видят, реагируют: куда движутся технологии?», посвященная трендам в развитии технологий обработки естественного языка, а также возможностям взаимного обучения человека и компьютера. Конференция была приурочена к презентации нового Технологического конкурса Up Great ПРО//ЧТЕНИЕ.

В рамках соревнований разработчики должны будут создать ИИ-систему для поиска ошибок в реальных текстах. Победит тот, кто преодолеет технологический барьер — создаст не имеющее аналогов в мире решение, которое сможет справиться с содержательным анализом текста на уровне не хуже специалистов.

«Одна из целей конкурса — создание открытого бенчмарка для оценки технологий искусственного интеллекта и анализа текста. Созданная нами система оценки позволит сравнивать качество работы различных систем анализа текста и подстегнет конкуренцию и развитие таких решений. Также мы хотим, чтобы разработки участников конкурса, ориентированные на долгосрочную перспективу, начали внедряться в России уже в ближайшее время, и будем активно этому содействовать», — рассказал Константин Кайсин, операционный директор технологических конкурсов Up Great в РВК.

По словам Константина Кайсина, в качестве материалов для конкурса будут использованы настоящие эссе старшеклассников и студентов, поскольку организаторы намерены протестировать реальное внедрение технологий в сферу образования.

«В рамках конкурса искусственный интеллект должен будет выявить и проанализировать смысловые ошибки в текстах на таком же уровне, как это сделал бы преподаватель в условиях ограниченного времени — 10 минут на работу. Такой уровень проверки позволит использовать разработку и как систему поддержки решений преподавателя, и как отдельный тренажер для обучающихся», — отметил Юрий Молодых, директор по развитию технологических конкурсов Up Great в РВК.

ИИ должен будет найти грамматические, речевые, логические фактические и этические ошибки и создать короткие аннотации на естественном языке о том, в чем заключается каждая ошибка. В конкурсе будут использованы тексты до 12 000 символов по неограниченному набору тем по предметам: русский язык, литература, обществознание, история, английский язык. Ограничение по времени для работы с текстом составит 30 секунд на один текст.

«Задача разработки технического регламента и правил формирования обучающих данных конкурса легла на лабораторию машинного интеллекта МФТИ. Модели ИИ участников будут проходить обучение на размеченных текстах, которые проверили реальные преподаватели. Мы стремимся к тому, чтобы эта база была достаточно полной», — отметил Константин Воронцов, доктор физико-математических наук, заведующий лабораторией машинного интеллекта МФТИ.

«Работа с естественным языком — самое интересное, что есть в технологиях анализа данных. Пока что мы вообще очень плохо понимаем, как устроен язык. При работе над ИИ мы, например, довольно далеко продвинулись в том числе в диалоговых системах. Но есть много примеров, где эти системы хороши — и не меньше примеров, где они не справляются. Мы видим, что машинное обучение сейчас развивается как экспериментальна наука. И конкурс ПРО//ЧТЕНИЕ — та область, где технологии еще не дотягивают, чтобы сделать конечное решение. Но именно здесь открываются возможности для участников на пути к реализации прорывных проектов», — подчеркнул Иван Ямщиков, научный сотрудник Института Макса Планка, ИИ-евангелист компании ABBYY.

Как отметил еще один участник дискуссии, заведующий лабораторией нейронных систем и глубокого обучения МФТИ Михаил Бурцев, первая волна развития ИИ была связана с компьютерным зрением, но сегодня интерес повсеместно смещается в область анализа и обработки естественной речи: происходит развитие нейросетей, появляются новые алгоритмы, задачи становятся всё сложнее, при этом их контуры вырисовываются более четко.

Кирилл Левин, директор научно-исследовательского департамента группы компаний ЦРТ, также отметил, что участие разработчиков в подобных конкурсах приближает появление прорывных технологий и дает возможность их коммерциализировать. По его словам, на данный момент технологии машинного обучения еще слабые, но работа в этой сфере весьма перспективна. При этом сейчас не стоит пытаться дорабатывать качество искусственного алгоритма до возможностей живого человека — сегодня более важно научить ИИ помогать человеку.

Конкурс ПРО//ЧТЕНИЕ пройдет в несколько этапов и продлится до конца 2022 года. Испытания будут проходить регулярно до тех пор, пока одна из команд не покажет результат, превосходящий способности человека. Первые испытания запланированы на ноябрь 2020 года. Соревнования будут организованы отдельно для текстов на русском и английском языках. Призовой фонд каждого конкурса составит по 100 млн руб.

Оператор технологического конкурса ПРО//ЧТЕНИЕ — РВК. Соорганизаторы — Фонд «Сколково», АСИ. Технический партнер конкурса — Центр компетенций НТИ по направлению «Искусственный интеллект» на базе МФТИ.

Подать заявку и получить подробную информацию о конкурсе можно по адресу: ai.upgreat.one