Методология создания базовых универсальных моделей трансформерных архитектур нейронных сетей для анализа процессов на коллайдерах

19 Feb 2025, 13:50
10m
Синий зал

Синий зал

Speaker

Andrei Zaborenko (SINP MSU)

Description

В нашем исследовании мы представляем подход к обучению базовых трансформерных моделей, способных обрабатывать данные с различными кинематическими сигнатурами. Разрабатываемая модель обучается на объединённых наборах смоделированных событий, что позволяет учитывать разнообразие физики взаимодействий и извлекать общие закономерности уже на этапе предобучения. Такой подход обеспечивает возможность анализа различных конечных состояний в рамках единой архитектуры.

Физика процессов с тремя и четырьмя топ-кварками имеет схожую природу, однако кинематические различия событий требуют отдельных подходов к их анализу. В рамках работы представлена стратегия предобучения трансформерных моделей, позволяющая унифицировать анализ и выделить общие физические закономерности взаимодействий. Исследуются различные техники предобучения трансформеров и их архитектурные модификации (формирование пространства входных переменных, численные эмбеддинги). Способность предобученных моделей к выделению полезных зависимостей в данных будет проверяться файн-тюнингом в задачах регрессии и классификации.

Методология базовых трансформерных моделей обеспечивает универсальность и гибкость в обработке данных и потенциально может повысить качество решения узкоспециализированных задач, как это произошло в областях компьютерного зрения и обработки естественного языка.

Тематическая секция Физика за пределами Стандартной модели

Primary authors

Anastasia Markina (Skobeltsyn Institute of Nuclear Physics, M.V. Lomonosov Moscow State University (RU)) Andrei Zaborenko (SINP MSU) Egor Iudin (Skobeltsyn Institute of Nuclear Physics, M.V. Lomonosov Moscow State University (RU)) Emil Abasov (Skobeltsyn Institute of Nuclear Physics (SINP MSU)) Lev Dudko (Skobeltsyn Institute of Nuclear Physics, M.V. Lomonosov Moscow State University (RU)) Maxim Perfilov (Skobeltsyn Institute of Nuclear Physics, M.V. Lomonosov Moscow State University (RU)) Petr Volkov (Skobeltsyn Institute of Nuclear Physics, M.V. Lomonosov Moscow State University (RU))

Presentation materials

There are no materials yet.