Группа исследователей решила фундаментальную проблему машинного обучения, создав первый метод работы с симметричными данными, который гарантированно эффективен как с точки зрения вычислений, так и с точки зрения потребностей в данных. Основная проблема заключается в том, что ИИ может легко запутаться в симметрии; например, он может увидеть повернутую молекулу как совершенно новый объект вместо того, чтобы распознать в ней ту же самую структуру.
Эти симметрии важны, потому что они являются своего рода информацией, которую природа сообщает нам о данных, и мы должны учитывать ее в наших моделях машинного обучения. Теперь мы показали, что машинное обучение на симметричных данных можно проводить эффективным способом. - Бехруз Тахмасеби, аспирант MIT и один из ведущих авторов.
Хотя некоторые современные модели, такие как графовые нейронные сети, могут работать с симметричными данными, исследователи не до конца понимают, почему они работают так хорошо. Команда Массачусетского технологического института утверждает, что они применили другой подход - они разработали новый алгоритм, объединив математические понятия из алгебры и геометрии, чтобы создать систему, которая может эффективно обучаться и соблюдать симметрию.
Этот доказанно эффективный метод требует меньшего количества образцов данных для обучения, что может повысить точность и адаптивность модели. Исследователи говорят, что их работа может привести к разработке более мощных и менее ресурсоемких моделей ИИ для широкого спектра приложений, "от открытия новых материалов до выявления астрономических аномалий и разгадки сложных климатических закономерностей" Исследование было недавно представлено на Международной конференции по машинному обучению.