Почему мы не первые полетели в цифровой космосНедавно руководитель агентства
«Простыми словами» спросил меня: «Почему мы отстаем в гонке за ИИ»?
От западных компаний мы слышим о том, что
вот-вот достигнем AGI, а скоро и
суперинтеллекта. Конечно, есть те, кто говорит: «Сначала определитесь, что такое интеллект, а потом уже давайте громкие названия», и в этом есть доля правды. Но пора уже определить, что мы понимаем под интеллектом.
Мой путь в «машинном обучении» (ML) начался в 2012 году, когда я впервые услышал об этом термине на конференции Яндекса в Москве (тогда
начался новый этап развития глубоких сетей). Будучи студентом Дальневосточного университета, я понял, что мои познания в математике и информатике могут помочь не только решать абстрактные задачи, но и прогнозировать болезни или предотвращать поломки самолетов. Так машинное обучение стало моим призванием.
Воодушевившись, я стал изучать зарубежную литературу, и добавил модуль на базе ML в курсовую работу по информационным системам. Во Владивостоке преподаватель впервые услышала об этом термине, у нас начался спор, и моя работа получила невысокий балл. К счастью, я учился не ради оценок, а в 2016 году, сдав идентичную работу в магистратуре ВШЭ в Москве, я получил высший балл и практику в
SAP.
Тогда в Вышке утверждали, что «ИИ» – это маркетинг, и мы использовали термин «машинное обучение». Но уже через пару лет я стал аспирантом в департаменте анализа данных и «ИИ» (все таки маркетинг?) в ВШЭ. А окончательный переворот в терминологии произошел, когда в 2019-ом в Сбере
мы запустили «ИИ-трансформацию» и увидели, какие колоссальные деньги экономит банк, решая задачи, которые раньше выполнял человек.
Понятие интеллекта все еще не определено, но все же можно сказать, что это
способность системы решать задачи, используя внутреннюю модель мира. В языковых моделях язык и отражает «картину мира» (рекомендую к прочтению
Витгенштейна), а с добавлением видео-модальности их уже официально
называют «моделями мира».
Какая нам разница, что находится в «мозгу» у робота, если у него есть возможность совершить действия, способные навредить нам, основываясь на своей внутренней логике? Мы не можем четко прогнозировать поведение такой системы, т.к. она основывается не на детерминированных алгоритмах, а на внутренней обученной модели мира. Откуда нам знать на каких данных обучался этот робот?
Если так, то такого робота стоит воспринимать как интеллектуальную машину – когнитивную систему со всеми вытекающими особенностями, ведь в ее ядре находится модель мира, которая во многом англоязычная.
Сегодня при обучении русскоязычных моделей разработчики используют большой корпус англоязычных текстов. Для обучения русскоязычных моделей нужны качественные датасеты на русском, а контента в интернете значительно меньше, чем на английском. Здесь пригодится умение синтезировать новые данные.
Что касается вычислительных мощностей для обучения ИИ, то из-за санкций железа действительно не хватает, и все в той или иной мере зависят от Nvidia. Думаю, здесь может помочь
децентрализованное обучение, в том числе на потребительских видеокартах.
Ну а новых кардинально революционных алгоритмов пока нет – есть «западный» трансформер, который работает на ура, его можно немного модифицировать и масштабировать.
Пусть мы не первые в ИИ-гонке, но рецепт для участия в ней прост: не нужно изобретать свой велосипед, нужно использовать лучшие международные практики и затачивать ИИ под решение прикладных задач, трансформируя компании и целые отрасли экономики.
Но следует принять простую идею: новая форма интеллекта уже здесь – пусть это и «перемножение матриц», и «оно работает не так, как человек», но оно действительно работает: обучается на наших данных и приносит пользу.
Уверен, рано или поздно эта идея получит более массовое принятие. А пока мы должны оставаться на передовой технологических прорывов, наблюдать за изменениями, рефлексировать и быстро адаптировать свою модель мира к постоянно меняющейся среде – ведь именно это и есть обучение собственного интеллекта.
#мысли