Catalyst.RL — reproducible RL research framework

Data Science
Зал №6

Тезисы

Несмотря на большой прогресс в области RL и, возможно, именно из-за него, крайне сложно провести сравнению различных алгоритмов RL. Чтобы исправить этот недостаток и быть уверенным в работоспособности новых решений мы представляем Catalyst.RL — библиотеку для проведения RL исследований с акцентом на воспроизводимость и гибкость. В этом докладе я расскажу вам про обучение с подкреплением, про то, как появилась эта библиотека, какие открытия уже были сделаны с ее помощью, а какие соревнования — выиграны. Есть ли воспроизводимость результатов в RL? Что требуется, чтобы этого добиться? Все просто — переходите на catalyst.

Аудитория и уровень

Middle+.

Tinkoff

Сергей Колесников

R&D Lead в «Тинькофф», Project Lead Catalyst, исследователь в Яндексе и МФТИ. Занимается обучением с подкреплением и глубоким обучением последние пять лет. Успел поработать в разных стартапах и областях, включая анализ естественного языка, обработку звука и компьютерное зрение. C 2017-го занимает призовые места в соревнованиях по обучению с подкреплением. Интересуется психологией и последовательными методами принятия решений. Сейчас развивает опенсорсные проекты.

R&D Lead в «Тинькофф», Project Lead Catalyst, исследователь в Яндексе и МФТИ. Занимается обучением с подкреплением и глубоким обучением последние пять лет. Успел поработать в разных стартапах и областях, включая анализ естественного языка, обработку звука и компьютерное зрение. C 2017-го занимает призовые места в соревнованиях по обучению с подкреплением. Интересуется психологией и последовательными методами принятия решений. Сейчас развивает опенсорсные проекты.