слушать в Яндекс.Музыке, Apple Podcasts и Spotify
Про что говорим с Борей:
- краткая история создания Алисы такой, какая она есть сейчас
- из каких технологических компонентов состоит селф-драйв
- какие самые большие технологические вызовы стоят перед командами, которые делают селф-драйв
- как в принципе построена работа всех команд, которые работают над селф-драйвом
- как изнутри чувствуется работа над селф-драйвом
- селф-драйв на камерах или на лидарах и картах?
- как машинное обучение может создавать суперстимулы
- неоптимальность человеческого мозга и с чем может помочь Neuralink
- произойдёт ли децентрализация машинного обучения?
- три важных урока, которые Боря рассказал бы себе 20-летнему
Расшифровка
00:00:00
Ваня: Боря, привет.
Боря: Привет.
Ваня: Боря попросил его представить, как специалиста по машинному обучению. Я не буду тебя так представлять. Когда мы с тобой работали.. Мы с Борей работали в «картинках», в «Яндекс.картинках» и чуть-чуть над небольшим совместным проектом рядом, в «картинках». Мне очень нравилось с тобой каждый раз общаться и работать, потому что ты… Ты очень круто думаешь про.. про вообще любую задачу. Мне очень нравится, что у тебя есть всегда возможность по-другому на эту задачу посмотреть, под другим слоем. И каждый раз это позволяло, обсуждение каждой конкретной задачи, пойти чуть-чуть дальше, в чуть более неожиданную сторону. И каждый раз.. Ну, я наблюдаю за тобой. Наблюдал за тем, когда работал в Яндексе.
00:01:00
И какое-то время, когда мы пытались тебя схантить, я все равно каждый раз продолжал думать—блин, ни фига себе, нифига Борян умный.
Боря: Я сейчас просто покраснел.
Ваня: Боря, ты делаешь, ты делал Алису. Ты работал в «картинках», потом ты делал Алису и сейчас делаешь?
Боря: Self-driving
Ваня: Self-drive. Расскажи чуть-чуть.. Давай начнем с Алисы. Интересно, какие в Алисе происходили какие-то большие решения, правильные решения. У меня гипотеза, что все большие успешные проекты — они строятся на небольшом количестве удачных или правильных решений. Давай декомпозируем путь Алисы или найдем одно решение у события.
Боря: Наверное про одно будет проще рассказать, его можно выделить очень хорошо. То есть когда мы делали Алису — понятно, были уже голосовые помощники. Была Alexa, то есть некий ориентир такой, на который можно равняться.
00:02:02
Ну и можно было, в принципе, сделать то же самое — как бы адаптировать это под российский рынок, воспользоваться силой бренда Яндекса и тем, что для русского языка вообще тогда еще продукта никакого не было. Ну и как бы просто сделать то же самое в России. И это как бы нормальная схема, рабочая.
Но так получилось, что задумка на стадии зарождения проекта сразу была немножко другой. У нас тогда был в CTO Миша Парахин, который в общем-то и решил, что это надо сделать. И он такой сразу говорит — нам нужен дифференциатор, и давайте этим дифференциатором будет то, что эта штука может говорить на любую тему. Что она не просто тебе говорит про погоду или еще что. А ты что-то ей скажешь, что выходит за рамки тех сценариев, которые в ней есть, и она ответит. На тот момент..
00:03:00
А я, я тогда знал примерно, что происходит в дип-лернинге, что можно делать с текстами и что нельзя, и, честно говоря, это казалось немного безумием. Не было особых причин полагать, что это вообще может получиться. То есть были какие-то техники — как обучить нейросеть че-то говорить, какие-то публикации в научных журналах. Если посмотреть на эти публикации и попытаться воспроизвести методы — получалась хрень, реально. Они не очень хорошо работали. И нам говорят — ну, чуваки, делайте, вроде в Китае есть какой-то бот, у которого огромная аудитория и он че-то нормально говорит, но он говорит по-китайски и не до конца понятно, как убедиться в том, что он действительно нормально говорит. Ну мы такие — окей, ладно, надо значит надо.
И, знаешь, еще про это все думалось так, что есть там сценарий в Алисе — это как бы фигня, понятно, как делать..
Ваня: Сценарий — это типа погода?
Боря: Ну, скажем, все полезное, что она делает. Условно, погода, или что угодно.
00:04:04
Какие-то действия, которые в нее вшиты. И это типа понятно, как делать, каких-нибудь регулярок нафигачьте. Но вот надо сделать, чтобы она еще и говорила. На самом деле все оказалось наоборот. Сделать, чтобы она говорила, в итоге оказалось намного проще, чем сделать всю вот эту историю со сценарием.
Ваня: Почему так?
Боря: Почему так? Потому что в конечном итоге сделать, чтобы она говорила, можно было одной командой, решив понятную задачу машинного обучения. Мы еще тогда не знали какую, что это вообще можно сделать, но в итоге оказалось, что можно. А сценарии… Там нужно решить не только технические задачи. Тебе нужно создать такую систему, чтобы, условно, весь Яндекс мог контрибьютить туда, какие-то сервисы могли туда встраиваться, все это происходило эффективно и прозрачно. Ну еще это ведь система, которая с естественным языком работает — она должна понимать все время, о чем ты говоришь.
00:05:03
И если за то, что она понимает, о чем ты говоришь, отвечают одни люди, а за то, что она умеет делать — отвечают другие, то часто это перестает матчиться. Там, в общем, очень много разных проблем, на стыке, сложных.
Ваня: Короче, это сложная инфраструктурная задача больше.
Боря: Сложная инфраструктурная. Ну и даже концептуально сложная. То есть я бы не сказал, что мы в итоге нашли прям идеальный способ как такие системы делать. Конечно, какой-то нашли, но кажется, что задача полностью не решена и можно лучше.
С «болталкой» — это мы так называли эту функциональность, что она типа может говорить, — получилось намного лучше. Ну и прикольно, что.. То есть у нас была такая установка — мы какое-то время что-то делали, сперва пробовали те методы, которые в литературе опубликованы. Ну и особо ничего не получалось. И приходили, присоединялись к проекту какие-то новые люди. И много раз была такая история, что приходил какой-нибудь человек и говорил — «слушайте, ну это какая-то херня, это надо закрыть. Че у вас там люди сидят, занимаются чем-то непонятным. Пусть идут, помогают делать сценарии».
00:06:07
И в конечном итоге, каждый раз Миша Парахин нас отстаивал, говорил — нет, пусть делают, они сделают. Мы такие — окей, здорово, попытаемся еще. И внезапно мы нащупали путь. Есть Слава Алипов, в Яндексе работает, очень талантливый разработчик. Он нащупал ту идею в итоге, которая помогла. Мы за нее зацепились, развили, так — раз, два, и вдруг получилось! Она, короче, заговорила.
Ваня: А ты можешь рассказать, если это не коммерческая тайна — в чем суть концепта?
Боря: Мы про это рассказывали, на самом деле, неоднократно. Нет, не тайна. Наверное, грубо говоря, можно так сказать: все что в литературе пытались сделать — это пытались какие-то нейросети придумать, которые будут генерировать текст за нее, там, буква по букве, слово за словом или еще чего-то.
00:07:03
Ну и в тот момент.. Сейчас вот, на самом деле, научились решать неплохо эту задачу генерации. Но в тот момент соответствующих техник не было и все вот эти модели, которые что-то генерируют, они раз на раз — то что-нибудь нормально скажут, то чушь какую-нибудь. И ты никак не можешь это контролировать.
А мы в Яндексе при этом очень круто умеем задачу ранжирования решать. И у нас была куча техник — как ранжировать что угодно, от больших документов до маленьких текстов. И мы в итоге придумали, как эту штуку свести к задаче ранжирования, очень похожей на ту, которая решается в поиске. И весь.. Ну, не весь, но какую-то часть технологий, в которой мы очень хорошо умеем, взяли и применили туда — и внезапно стало лучше. И когда ты ранжируешь — у тебя намного больше контроля, потому что ты можешь выбирать — из чего ранжировать. То есть она никогда не скажет какую-то бессвязную чушь — просто потому что среди тех текстов, среди которых ты выбираешь, там все тексты нормальные уже априори.
00:08:04
Ваня: А, в ранжировании пессимизируются явно косячные сценарии и просто убираются из обучающей выборки, или что?
Боря: Ну, им типа ставится плохая оценка. Ты там, например, говоришь с ней да размечаешь, говоришь да размечаешь, и оно все сходится к тому, что она отвечает какие-то нормальные вещи.
Ваня: Прикольно. Окей. Дальше давай вернемся к тому, что Миша топил за то, что «Алиса» должна разговаривать.
Боря: Да. Он, значит, топил, топил, и что-то начало получаться. Но даже там было интересно. То есть уже время подошло к запуску. И с штукой, которая разговаривает — с ней есть одна большая проблема: ты не в полной мере контролируешь что она говорит. А еще ты ее обучал на текстах в интернете, скорей всего. Просто потому что нигде больше не найти такое громадное количество диалогов, кроме как в интернете, чтобы составить разумных размеров корпус для обучения.
00:09:00
И в интернете много ненависти. Много желчи, злости, сарказма. И, конечно, если обучаешься говорить так, как в среднем люди в интернете — она все эти свойства ухватывает. И начинает очень часто вести себя немного вызывающе. И нужно было с этим че-то делать — мы не могли запустить штуку, которая, если пользователь не попал в погодный сценарий, оскорбляет его. Ну и мы пытались че-то делать — мы там банили всю обсценную лексику или там всякий расизм, фашизм в том множестве, из которого она могла отвечать. Но ты всего не забанишь. Ты можешь все плохие слова забанить, а из хороших такую конструкцию составишь — просто за голову схватишься. И вообще непонятно было, насколько безопасно такую штуку запускать. У нас был один пример — вот эта история с майкрософтовским ботом, может помнишь, которого они запустили, по всей видимости похожую штуку..
00:10:03
Ваня: А, да, помню, который стал фашистом за сутки.
Боря: Да. У них в твиттере такая же, примерно, болталка отвечала — ну и быстро раскопали, как ее вывести на фашистские разговоры. Был большой скандал для Майкрософта. Мы знали только эту историю, и, понятно, оптимизма она вообще никакого не внушала. Но в конечном итоге.. Тут нужно было волевое решение. Ну я не знаю — если бы люди, которые переживают за свою жопу, собрались, они бы сказали — «да нет, мы не будет это запускать, это какое-то палево». А нужно было какое-то видение сверху, и в конченом итоге Миша говорит — запускаем. Мы покатили, ну и дальше — я думаю, ты помнишь, ты был, получилось очень круто. Была мега-волна хайпа в результате. Это стал супер-узнаваемый продукт благодаря этому. Встречают по одежке — и вот это одежка была, которая «Алису» сделала большой и классной. Потом, понятно, уже надо делать, чтобы она еще полезной была..
00:11:04
Ваня: А как то, что она умела разговаривать, помогло деньги зарабатывать на Алисе?
Боря: Это работа на бренд, в первую очередь. Я не могу сказать, что это напрямую помогает зарабатывать деньги, но это увеличивает ее узнаваемость — соответственно, увеличивает пользовательскую базу в конечном итоге. Кажется, что может даже ретеншн увеличивает — ну просто потому что..
Ваня: А вы не замеряли — как то, что Алиса разговаривает, влияет на возвращаемость?
Боря: Скажем так — мы знаем, что если улучшать то, КАК она разговаривает, это влияет на возвращаемость. Мы никогда не проверяли гипотезу, где вообще этой компоненты нет, потому что она — неотъемлемая часть продукта. Но знаем, что улучшает.
Ваня: Окей. То есть суть в том, что был один визионер, Миша Парахин, который топил за то, что Алиса должна разговаривать. И топил, даже когда казалось, что это невозможно. И топил выкатывать, даже когда казалось, что там пролезет фашизм и политика.
00:12:13
Боря: Не было 100%-ной уверенности, что пролезет — были опасения. Нужно было кому-то..
Ваня: Если это была бы какая-нибудь корпорация, в которой нет такого сильного лидера-визионера, то это, скорее всего, было бы либо без разговоров, либо было бы с разговорами, но сильно-сильно позже, урезаннее и безопаснее.
Боря: Да. И такого громкого запуска и не получилось бы. И неизвестно, что было бы с пользовательской базой. Это для меня важная история, потому что я это вижу, знаешь, как пример того, что чтобы получилось что-то по-настоящему классное, часто должен быть где-то там один визионер, который в конечном итоге всех направит в нужном направлении.
00:12:58
И может быть даже это направление будет направлено не в сторону оптимума, но по крайней мере все будут двигаться примерно в одну сторону, в соответствии с его видением. Так до результата можно дойти проще. Можно облажаться, конечно — это не универсальная схема. Но это как будто бы необходимое требование для того, чтобы получилось что-то классное. А когда у тебя комитет, все начинают перетягивать что-то друг на друга, прикрывать свою жопу, сталкиваются интересы разных людей — получается что-то среднее и скучное в конечном итоге. Комитеты — там никогда нет риска, а чтобы получилось что-то классное — всегда должен быть риск. Потому что если бы риска не было — все бы делали что-то классное. Обычная история.
Ваня: Получается, что наличие одного лидера с сильным мнением, сильным видением элиминирует эго-мотивы участников комитета.
00:14:00
И поскольку эго-мотивы — они тащат всегда в свою сторону и всегда не в оптимальную сторону, он их скрывает, всех упаковывает и ведет в одно направление.
Боря: Ну да, для меня это примерно так выглядит. Мне кажется, есть глобальные истории примерно про то же — с Маском, Джобсом. Там что-то подобное происходило.
Ваня: Ты читал биографию Джобса?
Боря: Я читал биографию Джобса, но если ты сейчас что-то спросишь — я плохо помню..
Ваня: Не-не-не. У меня после прочтения биографии Джобса сложилось несколько ключевых тезисов, которые я понял, на которые, кажется, декомпозируются причины успеха — конкретно Джобса и Эппла, как следствие. Помимо того, что он психопат и нарцисс — это как бы безусловно, это за скобками, у него была удивительная особенность — растягивать мнение людей до невозможного.
00:15:03
Я не знаю, из какой сферы — из мышления, наверное, есть принцип растяжки. Когда есть два человека, с двумя разными точками зрения, и у обоих есть интент свести точки зрения к одной — чем полярнее и чем дальше исходные точки зрения друг от друга, тем сильнее внутренний конфликт у каждого человека. И этот внутренний конфликт в итоге.. Ну, если взять, например, за крутость результата длину вектора — чем дальше растяжка, тем дальше вектор итогового результата. Почему? Потому что человек.. У него в биографии очень много кейсов было. Когда к нему приходил инженер и говорил — мы делаем iMac вот таким.
00:16:00
Например, делаем первый аймак с непрозрачным корпусом. Он говорил — «нет, идите найдите способ, как сделать с прозрачным корпусом, потому что это будет супер-круто для пользователя». Или например — «хочу, чтобы у первого макинтоша или у «Lisa» блок питания был встроен в компьютер». Обычно блок питания ты отдельно докупал, и он болтался с проводом, а он был бы встроен в компьютер. Это была супер-революция. Он пришел к Возняку и сказал «я хочу, чтобы блок питания был внутри. Делай, что хочешь — но сделай». И все крутили пальцем.
То есть он, по сути, максимально далеко уводил стандартную точку зрения, стандартную привычную — невозможной, и не оставлял тебе выбора. А дальше человек уходил и.. Как, по сути, с Парахиным — он говорил «чуваки, надо сделать, чтобы она болтала». Все уходили, думали — че за фигня? А потом постепенно нормировались, искали способы и в итоге находили решение.
00:17:04
Боря: Видимо эта та же техника, да. С ней есть большой риск единственный — что можно слишком сильно растянуть.
Ваня: Да, и поэтому люди увольнялись. И на самом деле, Джобс очень хорошо знал про эту технику. Точнее, он знал, что.. Он осознавал, что ее применяет. И осознавал, что есть негативные side-эффекты, но понимал, что позитивный side-эффект во много-много раз выше. И там, по-моему, в 80-х годах у Джобса даже, ой, у Эппла была награда «Ты смог переубедить Джобса». Она то ли каждый год вручалась. Каждый год вручали награду, когда человек смог реально переубедить Джобса с его этой точкой зрения.
Окей. Расскажи, пожалуйста, чем ты сейчас занимаешься.
Боря: Я сейчас работаю в Яндекс селф-драйвинге. Мы делаем машину, которая ездит сама.
00:18:01
Я конкретно там отвечаю за часть, которая называется prediction— это предсказание того, что будет происходить вокруг нашей машины в ближайшее время, как поведут себя все остальные агенты дорожного движения, куда поедут машины и что они будут делать, куда пойдут пешеходы. Без этого понимания о том, что произойдет в ближайшем будущем, сложно принимать решения в настоящем. Это важная задача, которую водитель решает постоянно. Мне надо сделать нейросети, которые делают примерно то же самое.
Ваня: Кстати, а ты по-моему раньше не водил? Стал водить, когда начал работать над тачкой?
Боря: Я пошел, короче, в автошколу в тот момент, когда я ушел из Алисы. У меня был отпуск два месяца перед селф-драйвом. Я думаю — блин, хорошо бы наверное вообще понимать, что происходит на дороге, а то.. На тот момент для меня вообще какая-то магия была — штуки двигаются. Думаю — наверное будет полезно. Оказалось полезно, да.
00:19:00
Ваня: Круто. Из каких компонентов еще состоит селф-драйв?
Боря: Там много разных. Даже сам стек того, что работает на машине, когда она едет, — его обычно делят на несколько больших блоков. Есть то, что мы называем perception — это то, что позволяет видеть, где и что сейчас находится. Грубо говоря, нейросети, которые понимают, где пешеходы, а где машины — это персепшны. Области, где можно ехать и где нельзя. В текущий момент времени, вот конкретно на текущую секунду.
Дальше есть слой планирования.. Ну, во-первых, дальше есть предикшн (prediction), который смотрит, что персепшн видит сейчас и что персепшн видел до этого. И, грубо говоря, говорит, что скорее всего персепшн увидит потом.
Есть слой планирования — это штука, которая на основе того, что происходит сейчас и что, вероятно, произойдет в будущем, решает, как лучше выполнить задачу, которая сейчас стоит перед машиной.
00:20:02
То есть мы знаем, куда примерно нам нужно доехать, видим какие-то ограничения в мире и дальше можем решить, по какой траектории нам ехать, тут лучше притормозить и пропустить, или нет — и все такое. И выбирает желаемую траекторию движения. И дальше есть еще компонента, которая называется контрол (control), ее задача — реализовать траекторию, которую выбрал планер. То есть отдать машине такие инструкции, которые выражаются в повороте руля или нажатии педали, чтобы она прям по этой траектории поехала.
Причем у тебя всегда есть внешние факторы, которые мешают — отличается температура дороги, проскальзывают шины, еще что-то. Поэтому ты не можешь никак идеально сразу выбрать, куда руль повернуть, чтобы получилась траектория. Ты все время как бы даешь ей команды, смотришь, что получается и насколько оно отличается от того, что ты хочешь, и вводишь маленькие коррекции. В принципе — ровно то же самое, что делает водитель, на самом деле. Это про сам стек, который на машине работает.
00:21:01
А еще есть же огромная часть вокруг всего этого. А еще есть большая важная штука — локализация. Это тоже на самой машине. Нам нужно всегда понимать, где машина вообще сейчас находится.
Ваня: Например? В гараже? На парковке?
Боря: Нет, более конкретно. В какой области пространства. Грубо говоря, тебе нужно понять, по какой полосе ты сейчас едешь, в каком месте, какие полосы вокруг, где светофор, куда смотреть. За это отвечает отдельный большой блок. И сейчас подход такой: в тех местах, где ты ездишь, можно поездить, лидаром поснимать, сделать точную, трехмерную карту того, что происходит вокруг. И дальше уже в моменте ты светишь лидаром, смотришь, что у тебя где..
Ваня: Где относительно объектов ты находишься. Окей. Какие еще компоненты вне машины?
Боря: Вне машины — мощная офлайн-инфраструктура. Инфраструктура — это очень важно.
00:22:02
Тебе нужно запомнить все, что происходило с машиной. То есть она ездит, собирает данные, что-то происходит. Их нужно анализировать, а их очень много там — петабайты. Тебе нужна инфраструктура, которая, во-первых, их все скачает, которая предоставит всем удобный доступ, чтобы ты мог быстро отвечать на какие-то вопросы про нее. Например, как часто мы поздно тормозим перед светофором? Почему вот здесь мы не уступаем пешеходу? Это сложная инфраструктура, которую до конца местами непонятно, как делать более удобно, потому что за ней нет многолетней истории, она вот сейчас формируется на ходу, исходя из того, что нам нужно, что удобно.
Ваня: Окей. Что еще?
Боря: Инфраструктура того, чтобы из всего этого делать данные для обучения. Много разных разметок того, что происходит с машиной.
00:23:00
Ваня: Ручной разметки?
Боря: Ассесорской разметки, да. Ты задаешь им всякие вопросы. Нужны им данные для обучения.
Ваня: Что сейчас самое сложное в том, чтобы селф-драйв.. Ну типа, завтра у Яндекс.Такси 5% машины были селф-драйв?
Боря: Это невозможно сейчас потому что на настоящий момент мы не можем ездить в городе так же безопасно, как это делает человеческий водитель.
Ваня: Мм, еще нет?
Боря: Ну, нет. Смотри, давай я пару слов скажу про то, как вообще, в принципе разрабатывается селф-драйвинг, чтоб ты понимал, и какая там основная метрика. Это работает так. Вот ты делаешь машины, написал для них софт, который как-то может ездить, но он иногда лажает, в каких-то ситуациях. Понятно — нельзя сразу сделать хорошо, тем более решить такую сложную задачу. Ты сажаешь туда специально обученных людей, которые, когда машина делает какую-то фигню, они могут вмешаться в управление и исправить ситуацию. Потом отпустить — и она дальше поедет как задумывала.
00:24:02
Каждое такое вмешательство логируется. Это у нас называется disengagement, в селф-драйвинг комьюнити. И основная метрика это disengagement rate — как часто на километр водителю пришлось вмешаться. С некоторыми оговорками, можно сказать, что вмешательство — это потенциальное ДТП. Если вмешательств будет меньше, чем статистика по ДТП человеческим — это значит, что мы сделали штуку, которая ездит более безопасно, чем человек. Насколько мне известно, пока никому таких цифр показать не удалось. А еще есть большая сложность..
Ваня: Никому в мире? Офигеть.
Боря: Да, никому в мире, даже в Waymo. А еще есть большая сложность.. В смысле, я думаю, что в Waymo может где-то, в каких-то очень ограниченных локациях, где они сейчас пытаются возить людей без водителя, они вероятно показали, но там должно быть что-то достаточно простое, где практически ничего не происходит, где они сильно уверены в том, что все будет хорошо. В Москве ты знаешь, какой трафик. Здесь сложно ездить.
00:25:08
Есть еще задачи, по всем уровням стека, которые нужно решить сперва, прежде чем это станет возможным.
Ваня: Какой у тебя прогноз?
Боря: Это очень сложно. Я вот не люблю футурологию, потому что ты никогда не угадаешь. Там столько факторов! Просто, как на кофейной гуще.
Ваня: Пальцем в небо.
Боря: А прогноз чего?
Ваня: Когда можно будет заказать Яндекс.Такси, и приедет..
Боря: В Москве?
Ваня: В Москве.
Боря: Блин, я не знаю, реально. Плюс даже сейчас у нас есть тестовые локации, тот же Иннополис, где в принципе условия уже как в Штатах практически — у нас там ездят машины, где safety-инженер сидит на переднем пассажирском сидении. И там есть как бы такси, где прям люди ездят. И в принципе там довольно безопасно, потому что это простая ограниченная локация. Можно там для начала запуститься. А потом ты такой наращиваешь, наращиваешь, на все более сложные, сложные выходишь.
00:28:02
Ваня: У меня есть гипотеза, что у Яндекса есть фора относительно.. На самом деле, у Яндекса есть супер-ресурс в виде карт. Например у Убера нет своих карт, и Убер обязан платить Гуглу. Должен был заплатить с покупкой данных, сбором данных и инфраструктурой создания карт. У Яндекса карты есть. И у Яндекса, мне кажется, есть еще одна супер-фишка — это агрессивные водители и разные погодные условия. То есть ты когда в Штатах, ты обучаешь в Калифорнии, например — у тебя там нет снега. У тебя нет мотоциклов, которые снуют между рядов, нет реально супер-агрессивных водителей. А когда ты здесь обучаешь, у тебя этот сет такой, что чаще происходят скорее экстремальные ситуации — и соответственно, когда ты это будешь раскатывать, например, на Данию на какую-нибудь, у тебя из коробки все будет лучше работать, чем у Гугла, который обучался в Калифорнии.
00:29:02
Боря: Я с тобой абсолютно согласен. Это как, знаешь, тренировка с утяжелителем сознательная. Ну и ты еще одну вещь не упомянул. Еще у нас полгода зима. А это на самом деле колоссальная проблема, потому что сенсоры современные, которые на этих машинах стоят — лидары, камеры — они не очень хорошо работают в зимних условиях, это создает..
Ваня: Почему?
Боря: Ну смотри, лидар — он светит лазером, пока лазер от чего-нибудь не отразится. Если, например, конденсируется вода в воздухе и появляются кристаллики льда, или выхлопные газы могут конденсироваться — от их начинает отражаться лазер. У тебя повсюду появляются эфемерные препятствия. Нужно учиться их фильтровать, вырезать. Вода, условно, заливает камеру, солнце на горизонте светит в камеру и она перестает что-то видеть. Ты уже не видишь нигде светофоры..
Ваня: Очень круто.
Боря: Да, там много сложного. И неплохое доказательство того, что то, что ты сказал — это правда: у нас в прошлом году ребята поехали на CES и там катали журналистов.
00:30:08
И они были единственными, кто в итоге прокатил журналистов без человека за рулем. То есть они собрали наш стек, посмотрели — и он заработал в тех условиях. Потому что там действительно люди ездят по правилам, там не происходит ничего неожиданного. Там очень разумная система самоорганизации дорожного движения. Там не надо через три ряда в последний момент перестраиваться. И оно поехало. Значит подход действительно оправдан.
Ваня: Я слышал, что еще что, поскольку Яндекс не в юрисдикции США, и.. Ну короче это был рискованный пиар-ход. Типа — а рискнем, надеясь, что будет хорошо. И получилось.
Боря: Это в тему нашего разговора, первой темы. Видение, риск и результат.
Ваня: Какая сейчас самая сложная задача в селф-драйве?
00:31:02
Или самая сложная, над которой ты работаешь.
Боря: Вся моя задача. Я бы ее отнес к этому. С моей задачей большая сложность — и как это часто бывает в таких проектах, которые еще на заре своего развития, — не в том, что у тебя есть поставленная задача, которую ты не знаешь как решить, а ты в самой постановке все время сомневаешься. Потому что, смотри — тебе нужно сделать какую-то модель, которая предсказывает, что будут делать люди вокруг. И там сразу много нюансов, потому что будущее — оно, вообще говоря, не детерминировано, по крайней мере, у нас не полная информация о мире. Могут разные вещи произойти. И ты должен свои предсказания предоставлять в каком-то таком формате, который будет, во-первых, говорить потребителям, что будущее может быть разным, и еще, чтобы им было эффективно с этим представлением работать. И иногда непонятно, каким это представление должно быть.
00:32:04
Ваня: Пользователям — в смысле, водителям?
Боря: Пользователям — в смысле компонентам дальше по стеку, по тому же планеру, которые что-то с этим будут делать. То есть как выразить то знание, которое мы смогли вычислить, чтобы оно еще и полезным стало. Вот с этим много вопросов.
Ваня: По сути еще приходится создавать язык, через который вы описываете, как, возможно, будет вести себя окружение в будущем?
Боря: Точнее не скажешь, да. Мы пробуем разные языки, у тех — эти проблемы, у тех (других) — эти. Давай какой-нибудь один пример приведу. Допустим, ты хочешь понять, что будут делать пешеходы. И естественная мысль — по крайней мере, у меня сразу естественная мысль — «давайте сделаем модель, которая будет предсказывать траекторию, по которой пешеход будет двигаться в следующие десять секунд». Или если мы скажем — «окей, будущее мультимодально, пусть модель предсказывает несколько возможных траекторий, по которым он будет двигаться».
00:33:03
Кажется, что если решил такую задачу, то все окей. Дальше что происходит. Мы, допустим, подъезжаем к пешеходному переходу, к нему подходит человек и видит, что мы едем. И он никуда не идет, потому что мы еще не показали, что мы будем тормозить, а он под колеса не хочет. Он остается там. И ты можешь спросить у своей системы prediction — каковы вероятные траектории, по которым он будет двигаться? Она видит, что он стоит, и скажет — он стоит, он никуда не пойдет. Это будет правильный ответ с точки зрения постановки задачи. Но он-то хочет пойти. И мы должны остановиться и пропустить его, несмотря на то, что ни одна его возможная траектория, на текущий момент, не пересекает нашу. Это про то, что есть интент, а есть типа его реализация, и это вообще-то разные вещи. И твой язык, которым ты говоришь о будущем, должен и ту, и другую как-то учитывать.
00:34:05
Ваня: Круто. И получается в разных контекстах на пешеходном переходе интент один, и реализация одна. Вне пешеходного перехода — интент другой и реализация тоже другая.
95% людей, который будут слушать и смотреть этот подкаст, не представляют, каково это быть.. Как у тебя роль называется? Data Science инженер?
Боря: Руководитель группы предсказания дорожной ситуации.
Ваня: По сути ты Data Science инженер? Верно?
Боря: По большому счету да.
Ваня: 95% людей, и я, в частности, не представляем, что есть работа Data Science инженера. Можешь рассказать, как, например высокоуровневые .. Через другие метафоры, через понятные нам задачи, из чего состоит твоя работа, и как ты и твоя команда себя чувствуете в этом?
00:35:00
Боря: Я даже не знаю, насколько там понадобятся метафоры.. Мне кажется, что там все просто и понятно достаточно. Как правило, у тебя задача — промоделировать какое-то явление, так или иначе. Что это значит? Это очень общо звучит и может кому-то показаться непонятным. Например, ты хочешь сделать ранжирование в поиске — типа выбирается, какой документ показать, какой не показать. Это на самом деле значит, что ты моделируешь то, как свойства документа влияют на то, какие из них полезны пользователю, какие нет. И так про любую задачу data science можно сказать — что ты строишь модель данных и пытаешься описать там какие-то явления, которые в ней происходят, и из них что-то выцепить и получить результат. Обычно все начинается с того, что у тебя есть данные какие-то, и надо чего-то с ними сделать. Первым делом, по крайней мере, в хороших командах люди садятся и начинают думать — «а как бы нам измерить вот эти наши модели, которые мы будем делать».
00:36:03
И инвестируют усилия в то, чтобы какую-то систему измерения того, что они дальше будут делать, создать. Условно — если делаешь поиск, ты должен написать штуку, которая для любого твоего алгоритма ранжирования тебе скажет, насколько он хорош, и выразит это одним числом. Какой-то метрикой. Например, с помощью асессорской разметки или чего-нибудь такого.
Ваня: Асессорская разметка — это когда люди сидят и размечают. У них на входе запрос, на выходе — сниппеты, и они размечают — типа сниппет правильный, скорее правильный, скорее неправильный.
Боря: Да, например. Это не единственный путь, как можно получить такую метрику, на самом деле. У нас в группе немножко другая история. Мы предсказываем будущее, при этом всегда знаем настоящее. А настоящее становится будущим рано или поздно. Если мы записали все, что с машиной происходило, то в любой момент времени t мы знаем, что было через t+5 секунд. И мы просто должны проверить, что то, что мы предскажем, совпадет. Поэтому нам никакая асессорская разметка не нужна.
00:37:03
Нужна инфраструктура, которая такие числа сможет считать. После того, как она есть, в принципе вся работа выглядит следующим образом: мы собираемся и с учетом всего, что мы знаем о текущей модели, думаем — а как бы попробовать ее улучшить, чтобы, чтобы вот это чиселка упала? Мы, например, знаем, что сейчас она, в основном, лажает тут, тут и тут, ну и мы формулируем какие-то гипотезы — что туда попробовать добавить, чтобы она в этом месте не лажала. Из этих гипотез рождается эксперимент, и дальше люди уходят, пишут код эксперимента, запускают, смотрят, как изменилось чиселко..
Ваня: А можешь пример эксперимента с селф-драйвом?
Боря: Пример эксперимента с селф-драйвом… Самое банальное — мы предсказываем что-то для машин. Если мы в явном виде добавим информацию о текущей угловой скорости машины в модель, то сможет ли модель лучше понимать, что машина начала перестроение — прям в тот самый момент, когда у нее только появится угловая скорость. Условно, такого рода вещи.
00:38:09
Это какие-то локальные. Могут быть более глобальные. Типа, что если мы к нашему представлению мира, которое использует модель, добавим сырые лидарные данные — сможет ли модель сама научиться понимать по ним, где можно ездить, а где нельзя. По структуре точек в лидарном облаке. Или же надо как-то явно сперва предсказывать, где можно ездить, а где нельзя, и уже потом эту информацию добавлять в модель.
Ваня: То есть, если очень сильно упростить — поправь меня, если я ошибаюсь — Data Science это попытка понять мир каким он есть сейчас. И, например, если мы хотим сделать штуку, которая в мире ведет себя так, как ничто себя в мире не ведет — например, селф-драйв машина.. А, водитель. Нужно, например, сделать так. Чтобы селф-драйв ехал как водитель. Нужно приблизиться. И дальше собираем много данных, вообще всех, разнообразных — акселерометры и так далее. Лидары, камеры.
00:39:07
И пытаемся над этим иметь несколько слоев. Первый слой — как какие-то данные улучшают какую-то метрику или нет и потом — как эти данные между собой перекомбинировать, в разные модели засунуть так, чтобы опять же эта метрика выросла.
Боря: Ну, по большому счету да. Это не то чтобы про Data Science в целом история. Это такой Data Science/Machine Learning, которым мы примерно занимаемся. Бывает и другое Data Science.
Ваня: Маск утверждает, что он в следующем году, в 2020 году, запустит роботакси. Веришь или нет?
Боря: С Маском забавная история, мне она очень нравится. Это тоже в тему нашего разговора про видение и про то, что иногда можно ошибиться. Сорри, я сейчас немного мыслью по древу растекусь, но это важно.
00:40:01
Давай шаг назад сделаем. Почему вообще вся эта история с Маском произошла. Есть два способа делать селф-драйвинг, грубо говоря. Ты можешь делать RnD, пока у тебя не получится машина, которая везде ездит сама, и потом из нее сделать какой-то продукт в результате, как-то. Может быть начиная с ограниченных локаций, потом расширяясь или нет — неважно. А еще ты можешь сделать консьюмерскую тачку и типа в нее добавлять сперва какие-то базовые технологии, типа круиз-контроля умного, и потом чтобы они постепенно эволюционировали в сторону селф-драйвинга. У каждого подхода есть свои преимущества и недостатки. В чем, например, прелесть консьюмерского подхода — ты сразу продал очень много тачек, у тебя огромный флот, который генерирует очень много данных. Ты можешь проверять свои гипотезы — AB делать настоящий, с такой же стозначностью, как в поиске.
Ваня: AB — это AB-тесты, когда ты на выборку .. У тебя есть контроль — половина, и на тестовую выборку ты раскатываешь новые изменения. Дальше ты смотришь, изменяется ли метрика в соответствии с контрольной выборкой.
00:41:10
Боря: Да. Но есть и недостатки. У тебя консьюмерские тачки — вся эта деятельность должна быть тебе экономически выгодной, иначе у тебя закончатся деньги. Стоимость производства машины должна быть меньше чем то, сколько ты заработаешь на ней. И это сразу накладывает определенные ограничения. Например, ты не можешь использовать очень дорогие сенсоры. Лидары, в частности. Которые стоят пока еще достаточно много денег. У Теслы и так там экономика со скрипом сходится, насколько я знаю. Но добавь туда лидар — и все сломается. Это значит, что они тоже с утяжелителем делают софт-драйв. Им можно только по камерам. А это намного сложнее. Ну Маск правильно говорит — человек же может, глядя своими только глазами на сцену, водить. Окей, да, может.
00:42:06
Но лидар — это типа очень мощный костыль, который реально помогает. Конечно, можно сделать селф-драйв на камерах, но возможно это займет десять лет. Но у него нет вариантов других.
Ваня: Почему? Потому что он пообещал?
Боря: Он выбрал этот путь, закомитился.
Ваня: Про то, что камеры — да. Я про то, что к середине 20 года уже будут роботакси.
Боря: Он, как мне кажется..
Ваня: Переоценивает?
Боря: Да, у него есть тенденция к громким заявлениям. В данном случае, мне кажется, он чрезмерно экстраполировал. Тесла сделала технологию autopilot, которая ездит по автомагистралям достаточно неплохо. И такое ощущение, что он почему-то решил, что — ну если она ездит по автомагистралям, то осталось совсем чуть-чуть, чтобы она ездила в городе. Он с высоты своего executive vision решил — «ну че там, на год работы». Но это неправда.
00:43:05
По автомагистралям ездить очень легко, по сравнению с городом. И там задач, не решенных никем, еще очень много. Как они надеются решить их за год — непонятно. После того, как он сделал эти громкие заявления, там были истории, что через несколько месяцев сменилось руководство в селф-драйвинге, народ начал уходить, потому что заскрипело что-то.
Ваня: Маск, конечно, много обещает, но при этом, даже если делить на два — например, он обещал 10000 Тесл в начале 2018 года, а сделал к концу 2018 года — он все равно добивается.
Боря: Да, смотри, он добивался там, где есть понятные инженерные задачи — то, в чем он хорош. Он инженер, он понимает — можно ракету построить, можно машину, которая ездит.
00:44:01
Наладить процессы производства — примерно понятно, вроде все компоненты есть, надо только, чтоб экономика сошлась. А тут другая немного история. Тут нет компонентов, нет технологий, местами неизвестно, через сколько они появятся. Потому что есть огромные белые пятна — непонятно, как делать то или это. И мне кажется, он тут дал маху чутка.
Еще я хотел одну штуку про экономику Теслы сказать, пока мы с этой темы не соскочили. В его пути есть еще один интересный недостаток. Если делаешь консьюмерскую тачку — ты продаешь ее одному человеку, по большому счету. Он один ею будет пользоваться. И вот эта добавочная стоимость производства селф-драйвинга, которая войдет в цену этой машины, — он должен будет заплатить ее один. И нужно, чтобы преимущества от селф-драйвинга были такими, чтобы один человек был готов эти деньги заплатить. А когда ты делаешь райдшеринг — эта стоимость делится на много человек.
00:45:03
Ты можешь больше денег потратить на технологию селф-драйвинга при той же экономике, плюс-минус.
Ваня: Поэтому он же и делает роботакси. У него суть не в том, что ты покупаешь селф-драйв для себя, а в том, что сейчас ты покупаешь тачку, за 7500 баксов ты покупаешь потенциальный селф-драйв, тебе ставят плату с их чипами. А потом, когда раскатывается селф-драйв такси, роботакси, твоя Тесла добавляется в пул такси, которые сами ездят и зарабатывают тебе деньги.
Боря: Да. Я хочу сказать, что вот поэтому им приходится делать такую конструкцию сверху, которая как бы… Если кто-то не понимает эту экономику — она выглядит не до конца понятной, неестественной. Зачем так надо делать, чтобы моя Тесла таксовала..
Ваня: Почему непонятно? Все кристально понятно у тебя.
00:46:05
Люди к машинам относятся по-разному. Кто-то относится типа «ты моя хорошенькая», а кто-то — как к утилитарному предмету. Если «ути, моя хорошенькая» — она только для тебя. Если тебе вдруг понадобились срочно деньги, и тебе окей, что в твоей Тесле будут ездить другие люди, ее похимчистят за тебя, — то окей, почему нет?
Боря: Давай так сформулирую. Мой поинт в том, что это делается не для того, чтобы вы, покупатели Теслы, смогли заработать еще денег…
Ваня: Конечно же, нет.
Боря: потому что у него экономика не сойдется, иначе никакого селф-драйвинга не будет.
Ваня: Да-да, понятно, что ты заработаешь скорее на такси, а не на продаже тачек — это да. Но при этом интент человек покупать такую тачку я вполне понимаю. Точнее, покупать тачку — и потом чтобы она за тебя часть времени ездила, таксовала — я абсолютно хорошо понимаю. При этом бизнес-модель, на самом деле гениальная.
00:47:00
Почему? Потому что когда ты Убер, у тебя нет своих тачек. И если ты хочешь делать селф-драйв такси в Техасе, в Остине Техаса — тебе нужно самому закупить тачки. А когда ты Тесла, ты не несешь риск того, что конкретно в этом районе Штатов люди не будут ездить на селф-драйве — этот риск взяли на себя твои клиенты. И твоя задача дальше их убедить, дальше дать им больше денег, дать им больше плюшек. Не знаю, бесплатное обслуживание, которое у тебя стоит копейки. Бесплатная замена аккумулятора. Но ты не несешь риски. У тебя нет флота машин. Капитальные расходы на твоих клиентах.
Боря: Гениально.
Ваня: Это супер-круто. Идем дальше. Ты рассказал, что есть по сути работа Data Science инженера. А как это чувствуется изнутри?
00:48:02
Ты приходишь на работу, общаешься со своей командой. Вы, по сути, создаете с нуля новые блоки технологий, новые блоки инфраструктур, новые языки. Как это изнутри чувствуется?
Боря: Да как любая работа. Как чувствуется изнутри работа продакт-менеджера?
Ваня: Работа продакт-менеджера — ты решаешь по сути похожие задачи, когда создаешь новый продукт, но при этом у тебя много понятных компонентов. Делаешь сайт, делаешь мобильное приложение, делаешь пуши. Понятно, там есть best practices, как с этим работать. У тебя, кажется, работа скорее ученого. Это больше наука. Если сравнивать, например, с продакт-менеджментом — это больше наука, чем ремесло.
Боря: Там и ремесла тоже очень много. У меня в работе есть такой элемент, как у руководителя всей этой штуки, что я больше задаю себе вопросы — а правильно ли то, что мы сейчас делаем, тот ли язык мы выбрали, а как его модифицировать, а какие проблемы.
00:49:11
Но в целом, моя основная задача — это создать для команды какую-то парадигму, в которой ей будет легко работать. Что я называю парадигмой? Это когда мы зафиксировали какую-то метрику, какой-то язык и дальше пытаемся ее улучшить. И там, по большому счету, это ремесло скорее. Там есть, конечно, простор для творчества, но очень практический. У тебя есть понятная задача, и ты там все эти трюки, которым ты научился в machine learning, применяешь. В основном, команда занимается вот этим. Иногда происходят какие-то большие сдвиги парадигм, когда меняется метрика, меняется взгляд и язык. Но в основном ремесло.
Ваня: Давай поговорим про машинное обучение высокоуровневое. Я в конце расскажу про книгу Life 3.0 Макса Тегмарка.
00:50:02
Книга безумная совершенно. Половина книги про то, какие возможны пути развития искусственного интеллекта, artificial general intelligence. Не узкого — типа селф-драйв, а general — как человек думает. Вторая половина книги про то, как жизнь возможно будет развиваться на горизонте десятков и сотен миллиардов лет — и там типа будет один большой искусственный интеллект, и он будет вселенные захватывать, превращать их в супер-компьютер, окружать звезды сферами Дайсона, испарять черные дыры. Короче, безумно крутая книжка.
Я не буду тебя спрашивать — как ты думаешь, поработит ли нас искусственный интеллект, потому что здесь исчерпывающий набор вариантов. 20 вариантов — тирания, киборги, сосуществование. Куча разных вариантов.
00:51:03
Давай поговорим про другое. Сейчас я знаю как минимум три примера, когда машинное обучение — помогает, меняет какие-то давно устоявшиеся сферы не в призме «мы сейчас заменим водителей», не в призме «есть профессия, которую делают руки — мы сейчас этих людей уберем, будут делать другие люди». Например, собака Boston Dynamic. Она по сути должна заменить людей, которые ходят по стройкам и проверяют, правильно ли идет стройка. Или осматривают объекты. Например, Газпром какой-нибудь, когда строит месторождение, — им нужно постоянно контролировать, правильно ли идет сварка. Ходят проверяющие, смотрят сварочные швы по трубе.
00:52:02
Например, три кейса — есть DeepMind, который играет в «StarCraft». И DeepMind, который обучается в StarCraft не на том, как другие игроки играют, а reinforce learning — когда он сам пробует разные штуки и смотрит, какие из них приводят к результатам.
Боря: Там даже больше — там self-play очень важная концепция. Он обучается, играя сам с собой.
Ваня: Да-да, играет сам с собой и благодаря тому, что он пробует миллион разных вещей, у него есть возможность тонко мерить, какие его действия приводят к результату и не приводят к результату. Это главное отличие от людей — мы когда что-то пробуем, у нас нет возможности сказать, на сколько процентов или десятых долей процента улучшили или ухудшили. У нас — работает или не работает, сильно лучше или сильно хуже. И например DeepMind научился: А) строить больше рабов…
00:53:02
Б) я не помню, на там какие-то тактики, на которые смотришь и типа — fuck!! Вот это круто! Если я, как игрок в StarCraft, смотрю и такой — «вот это крутая штука!». И для меня, как для зрителя — я смотрю стримы "старика" — это круто. То есть кажется, что на горизонте единиц лет появятся искусственные интеллекты, которые оптимизируют не столько выигрыш в StarCraft, сколько интересность для зрителей.
Боря: А ты не думаешь, что это случайный побочный эффект — интересность для зрителя — просто от того, что это система, немного чуждая тому, к чему ты привык? Потому что она обучалась, играя сама с собой, и поэтому нашла другие стратегии. Они выглядят для тебя экзотическими, просто потому что люди никогда так не играли. Может быть, могли бы, просто их процесс оптимизации куда-то в другую сторону пошел.
00:54:00
Ваня: Да. Второй пример — это скорее мысленный эксперимент, хотя я слышал, что такие эксперименты делает Дисней. Сажаем тысячу добровольцев на Филиппинах, за пределами юрисдикции, которая запрещает такие эксперименты. Подключаем им к голове все, что может считывать с черепа, вживляем электроды в мозг, подключаем капельницы и считываем все гормоны-нейромедиаторы, которые у них сейчас в голове и в крови присутствуют. Сажаем их перед ютубом, сажаем их играть в компьютерные игры — и смотрим, какие образы, какие ситуации и комбинации ситуаций вызывают определенные химические и эмоциональные реакции. А дальше берем искусственный интеллект, который генерит видео или генерит компьютерные игры.
Люди в это играют, и по сути нейронка обучается на том, чтобы максимизировать эмоциональные дофаминовые всплески и всех остальных гормонов-нейромедиаторов.
00:55:06
И если взять DeepMind плюс вот эту штуку — ничто не мешает на горизонте какого-то количества лет сделать искусственный интеллект, которые сделает суперстимулы. То есть видео, от которого ты не можешь оторваться — почему, потому что все остальное меркнет по сравнению с теми всплесками дофамина.
Боря: Если твой вопрос в том, как искусственный интеллект и машинное обучение изменит привычную нам реальность, то одно из мнений будет, что либо придется ввести законодательное регулирование подобных вещей, либо нам конец. Потому что то, что ты сейчас описал, — самый ужас в том, что это вообще реально сделать. Все эти технологии уже плюс минус есть для этого. Нужно только найти энтузиастов. Мы знаем, как даже сейчас социальные сети, которые обучены на неявный сигнал в виде лайков, просмотров ленты и прочего, насколько они уже здорово понимают, как встроиться в этот дофаминовый цикл правильно.
00:56:13
Уже невозможно оторваться от того, что происходит. А если ты еще прямой оптимизацией займешься — ну я не знаю, у меня нет ответа. Это очень сложный вопрос. Но на мой взгляд, если так и дальше пойдет — а пока так и идет — то это потенциал чего-то, что может разрушить общество абсолютно. Как во всех антиутопиях, где люди сидят, слюни пускают на диване и больше ничего не делают. Нужно защитить себя от этого. Тот же deep mind — они же не так давно сделали у себя внутри ветвь, которая занимается именно вопросами законодательно-этическими, связанными с искусственным интеллектом. То есть их задача — к тому моменту, как.. Да даже уже сейчас и когда технологии еще больше разовьются, предоставить какие-то решения — как вообще все это можно зарегулировать так, чтобы человечество не пострадало в результате.
00:57:08
И кажется, что этика искусственного интеллекта и что-то с этим связанное могут стать профессией.
Ваня: Прикольно. Маск, кстати, этим же занимается в OpenAI. Он нанял Сэма Альтмана, который был президентом YCombinator. И Сэм Альтман сейчас возглавляет Open AI, и их задача — сделать искусственный интеллект + набор регуляторики и правил вокруг этого, чтобы не свалиться в негативные сценарии, которые Макс Тегмарк описывает в книге. Окей. Первый пример — DeepMind, который круто играет. Второй пример — можно наоптимизироваться на суперстимулы. Третий пример — про Microsoft Flight Simulator. Чуваки что делают — они взяли карты Бинга всей планеты, и сделали нейронку, которая генерит визуально очень точные..
00:58:03
Это симулятор полета на самолете и генерит очень точные здания, деревья , короче ландшафт — по картам Бинга. И это безумно крутой подход, потому что раньше люди вручную сидели и расставляли деревья, или просто говорили — «тут будет лес», а дальше он как-то генерится. Как машинное обучение изменит нашу жизнь или какие-то сферы — не через призму «минус профессия», «минус человек», а через призму «регуляторика»? Это первый принцип, что там есть возможность суперстимулов — окей, придется регулировать это, появится такая профессия. Как например, дип майнд играет сам с собой и, соответственно, искусственный интеллект может обучаться в виртуальной реальности.
00:59:03
И, например, селф-драйв тачка может ездить в виртуальной реальности и прогнозировать будущее в миллиард раз быстрее, чем реальная машина едет. Почему? Потому что ты ограничен только вычислительными мощностями. Что еще может поменяться? Какие принципы ты видишь?
Боря: В твоих примерах мне не очень нравится — ты сказал, что это примеры, не связанные с тем, что мы какую-то работу с людей перекладываем на искусственный интеллект. Третий пример — это чисто про переложение работы людей, который раньше сперва, условно, рисовали эти города, потом писали, программировали процедурные генераторы. А теперь программирование процедурных генераторов — типа еще один мета-уровень теперь, это уже делает нейросеть.
Ваня: Смотри, мне кажется в этом примере важно не то, что раньше люди делали, а теперь делает алгоритм — то есть «минус люди», а в том, что благодаря этому слою можно создавать миры в разы круче.
01:00:04
То есть не делаем так же, как люди раньше делали, а делаем в разы круче, на качественно новом уровне. Ты смотрел тизеры Microsoft Flight Simulator?
Боря: Нет.
Ваня: Картинка просто невероятная! На «Лепре» был пост, все такие — fuck!! Че, серьезно? Картинка просто космос. Ну, например — одна из самых очевидных вещей в том, что виртуальная реальность застряла на каком-то уровне развития почему-то. И, возможно, генерация картинок, которые фотографической четкости, или генерация опытов и ситуаций виртуальной реальности, которые вызывают искренний восторг — возможно это то, что как раз виртуальную реальность приблизит к этому. К массовому адопшну (adoption).
Боря: Не, ну окей. Ты, мне кажется, подметил тут интересный тренд: когда мы куда-то вставляем нейросеть, она не просто может решать ту же задачу, что и человек, или решать задачу лучше человека, а еще вместе с ней сразу в комплекте идет механизм обучения.
01:01:16
И если мы ее куда-то встроили, то ее можно потом в этом месте файнтюнить на какие-нибудь дополнительные сигналы, как правило. Таким сигналом, как раз-таки, может быть какая-нибудь мера эксайтмента (excitement) от того, что происходит у людей. Как в том Flight Simulator — можно сделать сеть, которая генерирует города, потом запустить, собрать метрики, посмотреть, чего как енгейджит людей, и потом начать генерировать классные города — такие, над которыми хочется летать.
Ваня: Это опять в сторону суперстимула.
Боря: Да. То есть все можно заоптимизировать до предела в конечном итоге, как только ты туда вставил механизм машинного обучения.
01:02:02
Но и это тоже история про замену людей, потому что, по большому счету, это то, чем занимаются геймдизайнеры сейчас, или еще какие-то люди. Они вручную оптимизируют то, что можно оптимизировать автоматически, если все сделать правильно.
Ваня: То есть базовый принцип такой, что теперь можно оптимизировать не просто выполнение работы, но и эмоциональный опыт человека. И неизбежно будем сваливаться в зависимость от этого опыта. И неизбежно будет появляться регуляторика. Окей, прикольно!
Боря: Будут новые сигареты и наркотики, возможно. Буду лобби такие же, типа гейм-девы.
Ваня: Сидишь там — «новый, новый граб». Подпольные, да? Прикольно. Что думаешь про Neurolink?
01:03:00
Боря: Это масковская новая история?
Ваня: Да. Neurolink — это тебе вот здесь делают дырку, робот-хирург подводит какое-то количество электродов — могу врать, несколько тысяч, до десяти тысяч — к определенным нейронам, определенным синапсам. Нейронам, точнее. И на определенном расстоянии какое-то количество микрон должно находиться — и, как результат, ты можешь считывать информацию с мозга. То есть не печатать пальцами, а думать, и у тебя эти слова, образы — что-то будет появляться в компьютере. И наоборот, воспринимать информацию.
Боря: Ну, что я думаю? Я думаю, что, во-первых, это проект в духе Маска, как обычно. Типа если ты задашь себе вопрос — а что еще такого революционного можно было бы, очевидного, но при этом революционного, сделать? И решил на интерфейсы посмотреть. И ты понимаешь, что наши текущие интерфейсы — они, блин, очень искусственные. Там какие-то неестественные прослойки между человеком и действием, в то время, как мы можем напрямую уже очень точно и емко формулировать интенты в мозге.
01:04:13
И тот, кто уберет эту прослойку, — он настолько повысит эффективность взаимодействия человека с машиной и с миром. От этого экономический эффект будет просто бомбический. Маск любит такие проекты, которые в перспективе меняют мировую экономику. Поэтому очень закономерно. Я плохо знаю про технологическую составляющую вопроса — почему сейчас? Действительно ли это economically viable может стать уже в какой-то краткосрочной перспективе? Или это история на двадцать лет? Научились ли они что-то такое делать, что никто не мог? Как-то суперэффективно, дешево, качественно эту операцию проводить.
Ваня: Не, пока не научились. Они анонсировали технологию для того, чтобы нанимать. Они сделали анонс типа «инженеры, биологи, химики — приходите к нам».
01:05:03
У меня знаешь, какая мысль. Я сейчас читаю книгу Willpower instinct, и на прошлой неделе общался с Димой Мацкевичем. Я очень много работаю, занимаюсь с собой психотерапией. И на самом деле эволюция — это такой адовый говнокодер, который шлепает сверху заплатку на заплатку, и как следствие — у нас есть проблемы с ожирением. Почему? Потому что 98% решений, которые мы принимаем в жизни, автоматические, и мы их не осознаем. Например, в книге Willpower Instinct — в день человек, в среднем, принимает 200+ решений про еду — что есть, как есть, в какой момент времени есть, из которых человек осознает единицы. То есть остальное — полностью автомат. Наш предыдущий опыт, обычная нейронная сеточка, она просто повторяет этот опыт.
01:06:04
И, например, наша зависимость от алкоголя, зависимость от наркотиков и тяга к сладкой, жирной еде — это reptilian brain и лимбическая система, которые такие: «Так! Короче! Жирное, сладкое полезно, потому что этого в природе нет». А дальше появляется префронтальная кора, которая тормозит эти инстинкты. И дальше с этим есть проблемы. Например, когда ресурсов мало, если ты не выспался, если энергии мало, если мало сахара в мозгу, если ты не выспался, устал, раздражен, одинок — то префронтальная кора не имеет тормозящей силы.
И мы жрем Макдональдс, бухаем, наркотики, и так далее. И кажется, что набор из нейроинтерфейсов плюс машинное обучение… Когда типа залезаем в мозг, изучаем, какие есть явно негативные паттерны, ну например — сладкое, жирное, алкоголь, наркотики, — и в момент, когда у тебя есть тяга неосознанная и у тебя не хватает ресурсов, чтобы затормозить, посылаем сигнал «тормозим».
01:07:23
Или вброс сахара тебе в кровь, чтобы у префронтальной коры появился ресурс. Кажется, что наше и, может быть, следующее поколение — это последний шаг перед неоптимальным мозгом, который развивался очень долго. Просто сейчас мы это делаем через психотерапию, медитацию, какие-то осознанные усилия — типа «медитирую!». То через 50 лет ты нажимаешь кнопочку — «загрузить минус отказ от сахара». Ну или умеренное потребление сахара тогда, когда оно тебе действительно необходимо.
01:08:01
И у тебя есть программка, которая знает, как именно твой мозг негативно требует сахара, и потом говорит «Все, братан». Нажал на кнопочку — все, у тебя исчезла тяга. Почему? Потому что дал ресурс, например, префронтальной коре. Очень жду этого момента.
Боря: Да? Блин, а я немножко пессимист в таких вопросах. Сейчас я объясню, почему. Вообще я заметил, что когда начал работать в больших корпорациях над сложными проектами, я стал очень большим пессимистом по поводу технологий, потому что я вижу без слоя маркетингового буллшита, что на самом деле там внутри происходит. И все вот эти вещи, про которые красиво рассказывают — как они иногда могут работать, сколько там неэффективности в принятии решений вокруг них, сколько косяков, ошибок, сколько багов.
01:09:01
И текущие практики разработки, техники — они не позволяют полностью с этой проблемой справиться. И мне становится страшно. Вот наш мозг. Понятно — он не слишком-то приспособлен к жизни в текущем обществе, эволюция его под это не оптимизировала. Но в обществе охотников-собирателей, у которых с нами что-то общее есть, все-таки приспособлен. Как-то эволюция всю эту систему обтесала. Там есть неэффективности реализации, но совсем уж очевидных багов кажется, что не очень много.
Ваня: Не согласен — дохренища. Очевидных багов прям очень-очень много. Например, что такое психологическая травма? Если переложить концепт нейронной сети из машинного обучения — то это просто сильно выбивающийся набор данных, когда, если у тебя было что-то в детстве или взрослом возрасте, что, возможно, привело бы тебя к смерти, мозг говорит «так, забываем все, что было до этого, теперь живем исходя из того, чтобы ни в коем случае не допустить эту ситуацию».
01:10:15
И дальше человек абсолютно автоматически, не осознавая этого.. Например, общаясь с руководителем, у него срабатывает эта нейронная сеточка типа «чувак» это ровно тогда же, когда ты чуть не умер. И человек абсолютно автоматически впадает в страх, в панику, ничего не слышит, и дальше идет по бажному процессу. И таких багов дохренища.
Боря: Это не баг, Вань. Это костыль, в чистом виде. Это решили одну проблему заплаткой, которая теперь работает в другой ситуации, к которой она была не готова, и работает очень грубо. Костылей — их немало.
Ваня: Их дохренища. Их не просто немало — их очень-очень много.
Боря: Да.
01:11:00
Но такого, что в определенной ситуации, абсолютно невинной, из-за какого-то сочетания факторов у тебя вдруг случается эпилептический припадок — это довольно редко, все-таки.
Ваня: Эпилептический припадок — нет, но дальше идет градиент. Просто таких ситуаций, правда, очень много.
Боря: Я хочу сказать, что с софтом такое происходит постоянно, как ты наверное знаешь. Как только мы начнем вмешиваться туда с нашими текущими, по крайней мере, практиками разработки — я не думаю, что мы будем чрезмерно аккуратно действовать — будет как минимум такой период, когда такой фигни будет очень много. Да, мы будем что-то исправлять, но будем в эту сложную систему, которая настроена на взаимодействие частей друг с другом, вносить какие-то возмущения с абсолютно непредсказуемыми последствиями. И вот это вот — «чувак, че-то плохо перепрошился» — это будет повсеместно происходить.
01:12:03
Про это киберпанка много всякого написано, но они, мне кажется, даже недооценивают, что произойдет, когда можно будет программно вмешиваться в работу мозга и его оптимизировать. Мне кажется, киберпанк еще оптимистичную картину рисует — все может вообще настолько измениться! Ни концепции личности не останется, ничего. Все будет совсем иначе.
Ваня: У меня еще знаешь какая мысль. Ты говоришь, когда ты работаешь в корпорации — на самом деле видишь изнутри, как неэффективно и криво многие вещи происходят. Кажется, что это опять следствие того, что complexity системы растет экспоненциально, когда ты добавил плюс один тип взаимосвязи… Например, у тебя пять команд в селф-драйве, добавил шестую команду, и теперь шестая команда обязана подстроиться под все пять команд, в инфраструктуру, и, соответственно, пять команд должны под нее подстроиться.
01:13:02
Ты увеличил сложность в два раза. Люди развиваются довольно медленно. Мозг не приспособлен.. Мозг эволюционно был создан для того, чтобы существовать так как он существует, а развитие отдалось, делегировалось эволюции, случайной мутации. И мозг на самом деле не особо приспособлен для развития — для изменения, улучшения, избавления от привычек. И есть несовершенство коммуникации. Плюс есть слой эго, когда один человек другому говорит, он обиделся, его эго задето — все, коммуникация не случилась.
И у меня гипотеза, что когда появится искусственный интеллект, который приближается, по возможности, к человеческому — он сможет минусы коммуникации человеческой убрать — эго, неэффективность передачи информации из головы в голову, задержки. Ты печатаешь, пока у тебя дойдет время ответить на имейл.. И если artificial general intelligence подключать к разработке кода, то я верю, что, например, скорость роста компании возрастет благодаря тому, что уйдет неэффективный слой коммуникации и, например, костылей.
01:14:16
Правда же, что можно сделать artificial general intelligence, который бегает по всему твоему репозиторию, ищет костыли и переписывает их?
Боря: Ну если это будет действительно general intelligence.. На такие вопросы очень просто отвечать. «Ты можешь для человека это сделать?» Да, значит если у нас есть general intelligence, конечно он может это сделать
Ваня: Соответственно, если ты даешь ему достаточно много вычислительных мощностей, он может очень быстро снижать энтропию в коде до приемлемого уровня так, чтобы можно было быстро добавлять новые блоки. Веришь ли ты — вопрос про сингулярность — что artificial general intelligence может ускорять какие-то вещи настолько быстро, так, что огромный рост?..
01:15:00
Ну например, селф-драйв — из не селф-драйва в селф-драйв — будет измеряться не десятилетиями, а днями и месяцами?
Боря: Короткий ответ на этот вопрос — наверное, да. Вот почему. Я про это всегда думаю так. Вспомню самых талантливых разработчиков, с которыми я работал. Дальше — что если у них не будет никаких эмоций, усталости — ничего, они будут работать 24 часа в сутки, как будто им наркотиков насыпают, в точку, безостановочно. Смогут ли они сделать нечто очень крутое? Да смогут.
Искусственный интеллект, по большому счету, может вот такой штукой стать. Даже если он не будет сильно умнее человека — просто за счет того, что мы сможем целеполагание как-то настроить, убрать эмоции ненужные и усталость, которые нам мешают по большому счету.
01:16:01
Нууу.. Да, можно будет делать великие вещи. Но мне кажется, что к тому моменту сама концепция программирования уже изменится. Вполне возможно, что вот это вот «писать код вручную» — это будет каким-то ретроградством. У нас уже будут штуки, которые пишут код, а мы будем только кнутами их погонять и говорить, какой код им писать. Не знаю. Очень сложно. Не понятно.
Ваня: Комитет в книжке Тегмарка сходится.. 100+ разработчиков поехали в Пуэрто-Рика в 15-м году, в том числе, Илон Маск. И раз в год собираются — или раз в несколько лет собираются. И prediction был сначала — 2054 год, совокупный. Сейчас уже 2045 год.
Боря: Prediction на что? На появление AGI?
Ваня: Да.
Боря: Не знаю. Это, скорее всего, предикшн на основе какой-то экстраполяции.
01:17:02
Условно, научных открытий, прогресса, который происходит.
Ваня: Просто опросили всех людей, который там были — «когда, ты думаешь, это будет?». Это топовые чуваки про general intelligence. И взяли среднее.
Боря: Чтобы делать такие предсказания — можно только на что-то очень простое опираться, типа закона Мура или чего-нибудь такого. И как-то пытаться из этого экстраполировать развитие человеческого общества. Потому что сейчас мы понимаем, что мы вообще даже примерно не представляем, как сделать этот AGI.
То, что мы называем machine learning сейчас, и то, что журналисты любят называть искусственным интеллектом — это настолько узкоспециализированная, частная вещь, которая только определенные прикладные задачи может решать, и это настолько не матчится с тем, что по нашим представлениям должен делать универсальный более-менее интеллект. И мы не знаем точно, какие части туда добавить. Так что это может быть 20 лет, а может быть и очень много. Может в нашем понимании вообще отсутствуют какие-то фундаментально важные куски.
01:18:07
Может что угодно случиться. Может внезапно оказаться, что в сознании какую-то важную роль играют квантовые эффекты. И нужно обязательно сперва построить нормальный квантовый компьютер, прежде чем ты будешь искусственный интеллект делать. Все может поменяться. Мы знаем, как быстро меняется наше представление о реальности и о том, какие...
Ваня: Короче, дискутировать про это — чисто спекуляция. Бессмысленно.
Боря: Не, можно. Это всегда интересно и прикольно. Но надо понимать, что практический выхлоп от этого скорее всего будет нулевой. Будет забавно — вот эти все книжки взять и через 20 лет перечитать. И посмотреть, что ты сейчас про это думаешь. Потому что когда ты читаешь книжки, которые, условно, 20 лет назад были написаны.. Вот я не могу конкретных примеров привести, но я помню свои ощущения. Ты такой все время — «блин, чувак, ну как ты вот это не предвидел, ну это же очевидно, почему ты вообще решил, что так будет?».
01:19:05
Ваня: Но при этом есть книжки — например, я сейчас прочитал Hi Output Management про то.. Эндрю Гроува — третий сотрудник Intel, потом стал CEO. Он написал про то, что такой менеджмент, каково это — быть менеджером, как на встречи ходить, как менеджерить своих сотрудников, нанимать, увольнять и так далее. Там есть неактуальные части, но при этом книжка супер-правильная и до сих пор. Я теперь ее буду своим сотрудникам и своим менеджерам давать первой. В каждый момент времени, когда ты пишешь книгу, у тебя точность того, насколько она актуальна сейчас, насколько она актуальная через десять лет — она далеко не 100%. Допустим, тебе нужно быть как можно выше от 50%. Допустим, 70% сейчас и 60% через десять лет. Но вопрос — есть ли сейчас хотя бы какие-то намеки.. Вот ты говоришь, что сейчас вообще непонятно.. Может быть есть какие-то намеки, что кажется — в этих предикшенах есть точность выше 50%, потому что..
01:20:08
В предикшнах про AGI.
Боря: Да, я думаю что в них есть точность. Хотя бы примерно в десятки процентов, по моим текущим представлениям вероятность этого события попадает. Просто если посмотреть на то, с какой скоростью мы придумываем недостающие техники для этого. Мне кажется, что если оно так пойдет и дальше и не упрется в какой-то bottleneck — что вполне может произойти, то недостающее мы придумаем.
Вычислительная мощность растет достаточно быстро, думаю, что это боттл-неком не станет. Хотя кажется, что для того, чтобы получить что-то, сопоставимое с тем, что происходит в мозге с его количеством нейронов — надо масштабы наших мощностей еще увеличивать на порядки. Это произойдет.
01:21:06
Техники — может быть будут придуманы. Я за это больше всего переживаю. В смысле — как и какие там нейросети обучать, и вообще нейросети ли это — вот за эту часть я переживаю. Но, глядя как она развивается и каких успехов достигает, это возможно. Просто пока точно непонятно, с какой стороны придет ответ.
Ваня: Я еще вот такие компоненты вижу. Сейчас огромное количество бизнесов. Например, операционный бизнес — у тебя сеть аптек 36,6. Хотя плохой пример. Сеть аптек в Китае. У тебя отделений 20 000. И ты неизбежно из операционного ручного бизнеса становишься, скорее, дата-бизнесом. Почему? Потому что невозможно уже в голову человека уместить все процессы, все оптимальности, неоптимальности происходящего в таком масштабе.
01:22:10
Соответственно у тебя появляется слой данных и у тебя появляется слой, где ты над этими данными принимаешь решения. Какие тренды? Датчики и стоимость подключения к интернету датчиков падает. Сейчас Маск все покроет спутниками, интернет будет практически бесплатный, почти у всех датчиков. Вычислительная мощность каждого датчика растет. Соответственно, у каждого датчика — какого-нибудь Филипс Хьюи — будет микропроцессор, который может что-то сам себе предиктить. Например, когда выключаться, чтобы лучше электроэнергию расходовать.
А еще кстати недавно посмотрел видос — чувак говорит следующее, что сейчас, кажется, мы идем в другой цикл децентрализации вычислений. Типа сначала были мейнфреймы, потому что компьютеры были супер-дорогие.
01:23:01
И их могли себе позволить только бизнесы. И только бизнесы получали выгоду. Бизнесы и университеты. Потом были десктопы. Это децентрализация, то есть у тебя большая часть вычислений, от которых бизнес получает выгоду, на локальных компьютерах. Ты считаешь что-то в эксельке — благодаря этому ты стал больше зарабатывать. Потом снова идет централизация в cloud, когда у тебя все считается в Амазоне. И сейчас, кажется, идет следующий этап, когда у тебя децентрализуется все, потому что данные, например, с селф-драйв тачки.. Например, сколько данных селф-драйв тачка генерит за секунду?
Боря: У меня нет из головы точной цифры. Гигабайты — не меньше.
Ваня: Ты не сможешь эти гигабайты в риал тайм передавать
Боря: Нет, не сможешь.
Ваня: Соответственно, у тебя появляется необходимость делать вычисления на устройствах. Почему? Потому что для какого-то количества кейсов у тебя собирается колоссальный объем данных. И ты не можешь их риал тайм передавать. И риал тайм получается...
01:24:10
То есть, например, тормозить или не тормозить в данный момент времени — решение должна принять машина, а не дата-центр.
Боря: Да. В случае с тачкой это продиктовано еще и простыми практическими соображениями. Эта штука должна быть бронебойной, и если с интернетом что-то случилось, она должна продолжать работать. И есть большая проблема с latency — она должна реагировать как можно быстрее. Любой дополнительный коммуникационный канал вносит задержку. Зачем нам на ровном месте создавать себе задержку?
Ваня: И, кажется, идет такой паттерн, что сейчас идет децентрализация вычислений — от cloud к конечным устройствам Начинается тренд децентрализации вычислений. И получается что? У нас все бизнесы — это дата, бизнес, который принимает решение на данных. У тебя куча датчиков, с которых принимают решение на месте.
01:25:01
Почему? Потому что не могут зависеть от наличия интернета, не могут зависеть от латенси. Или у тебя куча данных. И по сути у тебя весь мир покрыт данными. У тебя каждый конкретный элемент — он достаточно мощный. Типа мощность айфона приличная для того, чтобы на нем айфон сири гонял. И у тебя все больше и больше людей. Если они раньше не работали руками, то теперь они работают с этими данными. У тебя все больше и больше становится в мире дата сайентистов. Кажется, что А). колоссальный объем данных Б) колоссальный объем дата сайентистов и колоссальный объем бизнесов, которые хотят получить от этого выгоду — должен ускорить наступление AGI. Почему? Потому что тупо больше людей будет над этим работать, и тупо больше данных будет для него.
Боря: Ты столько всего сказал, я там местами не согласен.
Ваня: С чем не согласен?
01:26:00
Боря: Во-первых, с трендом на децентрализацию очередным. Я вообще не уверен, что согласен, что он есть. И тут есть еще важное соображение, что все эти техники в машинном обучении, deep learning-e, который мы сейчас используем — они требуют все больше и больше вычислительных ресурсов. И не просто вычислительных ресурсов децентрализованных — ты не можешь эти техники применить на компьютерах консьюмерских, соединенных в сеть. Потому что тебе необходимо, чтобы составляющие элементы этой вычислительной системы очень быстро обменивались информацией. Это фундаментальная ключевая вещь. И единственный способ это сделать — это поставить их как можно ближе, в какую-то контролируемую среду. В идеале — в одну стойку или хотя бы в один дата-центр. Хоть немного расстояния ты добавляешь — это сразу очень сильно портит все, связанное с обучением.
01:27:01
При текущих наших возможностях что-то вычислять я не вижу, какая возможна децентрализация, связанная с AI. Наоборот, тренд на то, что обучение с десктопов перенеслось в дата-центры. То есть раньше энтузиасты могли у себя на компьютере поиграться с модельками. Сейчас все меньше и меньше интересных моделек можно обучить на своем компьютере, просто потому что весь state of the art требует колоссальных объемов вычислений. Все переносится, понятно, в облака, потому что это дешевле.
Ваня: Понятно. Я слышал про тренд — только слышал — что сейчас появляются направления в deep learning-e, которые позволяют обучать на очень небольших выборках. Ты слышал что-нибудь про это?
Боря: Да. Есть такая ветвь исследований в deep learning-e — я думаю, она отчасти как раз инспирирована проблемами, нерешенными с AGI.
01:28:03
Про наш мозг можно достаточно очевидное наблюдение сделать — мы можем решать довольно широкий класс задач практически без данных для обучения. Потому что мы очень здорово умеем переносить интуицию с одних областей, с которыми мы умеем работать, на новые. У тебя появляется какая-то новая область, ты говоришь правила игры — как это примерно работает. Ты дальше эти правила свои интуицией наполняешь и вот ты уже примерно понимаешь, что нужно делать.
Вот даже пример с вождением автомобиля. Ты приходишь и первый раз садишься за руль. Тебе говорят — вот руль, вот педали, на красный ехать не надо. И, в принципе, ты уже можешь поехать. Тебя не нужно заново учить концепции, что поворот руля на что-то влияет. Вообще концепции управления механизмом. Или трехмерного пространства.
01:29:01
Ты их уже использовал, взял простые символьные правила — это правила дорожного движения, со своими концепциями смешал, и вот ты, практически без обучающей выборки, херово, но ведешь автомобиль.
Ваня: А дальше переобучаешься на том, что сам едешь.
Боря: Да. Это одна система работала, а дальше ты набираешь данных, и типа твоя интуиция уже начинает постепенно включаться в работу все больше, больше и больше. И вот уже тебе сознательная часть мозга вообще не нужна, у тебя уже нейросеть обучилась, и ты чисто на интуиции выезжаешь. И вот нам нужно научиться воспроизводить то же самое.
Ваня: Перенос, по сути.
Боря: Перенос. Есть такая область transfer learning, называется one shot learning — как раз про то, чтобы что-то где-то на чем-то обучиться, а потом без данных или с очень небольшим количеством данных решать задачи на основе переноса того. Это сейчас очень много исследуют, но там никаких таких сверх-прорывов, я бы сказал, пока не произошло. Но это точно одна из задач, которые нужно будет решить, чтобы AGI сделать.
01:30:04
Ваня: Супер-прикольно с тобой общаться! Мы постепенно заканчиваем. Почему ты, кстати, не поехал в Waymo, Tesla, Uber? Почему Яндекс?
Боря: Почему Яндекс? Ну, честный ответ: я же поработал за рубежом в свое время, ну и сознательно решил вернуться, потому что.. Если вкратце, то мне, во-первых, нравится московская движуха, это очень прикольный город, очень много классных людей заряженных. Здесь много энергии, в этом месте. Там, где я в Англии жил и работал, я этого не почувствовал, мне этого не хватало. Это во-первых.
Во-вторых, я люблю Россию. Это родные мне люди, культуру которых я понимаю, которая прям матчитсяс моей. Ехать в какое-то другое место — это всегда сложный период адаптации к новой культуре.
01:31:04
Много в этом дискомфорта, сложностей. Ты можешь через них пройти, если хочешь, если цель тебе понятна, но не обязательно. Какая цель? Ехать в Google, чтобы что? Делать классные вещи?
Ваня: Классные вещи на масштабе Google’a.
Боря: А там это такая палка о двух концах. С одной стороны, масштаб Google’a. Да, это супер-корпорация с огромным количеством возможностей. С другой стороны, Google нанял очень много умных людей, огромное количество. Возможно, такое количество, что задач даже на всех умных людей не хватает. То есть ты..
Ваня: Не верю в такое. Задач всегда больше, чем людей.
Боря: Ну…
Ваня: Интересных задач в смысле. Так, чтобы им было интересно оставаться там.
Боря: Да. Давай так это сформулируем. В Google очень велик шанс, что ты весь такой умный, а в итоге будешь JSON’ы перекладывать, условно.
01:32:07
Боря: А Яндекс — там совсем другая история. Он, по сравнению с Google’ом очень маленький, но при этом по своему охвату того, чем он занимается, он сравним. И на каждого приходится намного больше ответственности, интересных задач. Ты намного меньше скован и ограничен в том, что можно делать. Много возможностей. Мне это тут пока нравится. Я допускаю, что могут сложиться такие условия в стране, что мне снова захочется куда-нибудь уехать, но пока плюсы перевешивают всё ещё немного.
Ваня: Понял. Представь, что перед тобой сидит Боря Янгель 20-ти лет. Он учится… Ты на физтехе учился?
Боря: Нет, я на ВМК.
Ваня: ВМК. Учится на ВМК, физтех — не важно. Что нужно делать двадцатилетнему Боре, чтобы прийти в твою роль и заниматься тем, чем ты сейчас занимаешься, максимально быстро? Каким надо быть?
01:33:08
Боря: Двадцатилетний Боря? Я бы ничего не стал менять, потому что, видимо, он придет.
Ваня: Сработало. Ок. Ну да. Плюс один дженерик, какой-то разработчик.
Боря: Плюс один дженерик, разработчик? Ну, мне сложно сказать так, чтобы наверняка. Потому что ты же понимаешь, это всегда какое-то количество везения, короче.
Ваня: It’s OK. Но там точно было что-то, что сработало, и работало системно.
Боря: Мне кажется, там есть важные какие-то мировоззренческие факторы что ли, которыми нужно проникнуться, и которые наверно помогут. Я могу попытаться их сформулировать. Что я делаю, как я думаю.
Для меня наверно переломным моментом когда-то стало понимание, что на самом деле в мире почти все вещи — простые. Практически любое знание придумано человеком, таким же человеком, как и ты, который, в принципе, мыслит так же и экстраполирует из примерно такого же опыта, строит такие же системы, как и ты бы построил.
01:34:13
И на самом деле почти ничего сложного в мире нет. Можно взять любую фигню, которая кажется сложной, но, если ты найдешь правильный подход, поймешь систему, которой он руководствовался — она, скорее всего, очень простая, и ты разберешься в этом. Никогда не надо говорить, что что-то — сложно. Ты всегда можешь понять, не останавливайся. Я когда это понял, всё как бы попёрло сразу.
Ваня: Попёрло — и что поменялось в твоём поведении? Что ты поменял?
Боря: Иногда возникал ментальный блок. Ты даже не то, что для себя это формулировал. Ты бессознательно думал, что какая-то магия, какая-то муть. Не то, что даже я не смогу разобраться, а вообще не понятно, можно ли в этом разобраться. Я вот это вообще убрал.
01:35:02
Если я вижу какую-то муть, я понимаю одно из следующего: или я не обладаю какой-то информацией, или мне непонятно объясняют, что там происходит, или, в редких случаях, там действительно что-то очень сложное происходит, но такого практически нет. Значит, нужно просто найти подход, подобраться, не нужно останавливаться. Либо, если тебе это не надо, то надо забить.
Ваня: Давай для понимания — что есть реально сложные вещи? И что тебе казалось сложным, а оказалось не очень сложным.
Боря: Так, первый вопрос наверно проще. Есть реально сложные вещи. Они, в основном, где-нибудь в математике и теоретической физике, в современной, где стандартная модель, общая теория всего. Так очень сложная математика. Нужно потратить годы, чтобы разобраться в этом, просто потому что чуваки зашли настолько далеко в абстракции, что уже нет никаких простых интуиций за тем, что они придумали.
01:36:08
Тебе нужно их последовательно выстроить до каких-то совершенно новых, чуждых концепций.
Ваня: Окей. Хардкорная математика и физика. А что казалось сложным, казалось магией, но оказалось довольно простым.
Боря: Я думаю… Я что-то сходу не могу придумать, что казалось магией. Что тебе кажется магией? Есть такое что-нибудь?
Ваня: Я целиком и полностью разделяю этот принцип. И я тоже понял, что все на самом деле сильно просто.
Боря: Ну давай от банального. Ты понимаешь, что везде есть система. Например, ты раньше читал книги, художественное произведение, и если сильно не вдумываться (я не знаю, может люди вдумываются, я вот никогда не вдумывался), тебе кажется, что это талант автора выплескивается на страницы, ты это никогда не повторишь, а потом ты вдруг понимаешь, что на самом деле что этих людей отличает — они выстроили систему, как писать эти книги, попробовали, что работает, что не работает — поделились.
01:37:17
Ваня: Прочитали много других книг.
Боря: Прочитали много других книг, пообщались с другими авторами, выстроили некую систему и в рамках этой системы занимаются деятельностью. То же самое, что мы делаем на работе. Понятно, талант играет какое-то значение, но на самом деле там система. И дальше, куда ты ни пойдёшь, там, где люди что-то сложное делают, тебе кажется, невероятно талантливые. Да как это? А потом оказывается, что нет, там просто система, и ты, в принципе, если эту систему знаешь, ты можешь что-то похожее делать.
Ваня: Круто! А что-нибудь ещё такого уровня, что всё сильно проще, чем кажется?
Боря: Я этот-то пример еле придумал!
01:38:02
Не знаю, Вань, помоги мне.
Ваня: Что посоветуешь? Вот перед тобой сидит не двадцатилетний ВМК-шник. Что мне делать? Как думать?
Боря: Прежде всего — думать. Что мне кажется важным и что иногда, как мне кажется, сейчас недооценено: я говорил только что, что во всём можно разобраться, а ещё, что мы часто систему принимаем за талант. А ещё мы часто переоцениваем роль таланта и недооцениваем роль вложенных усилий. А я бы сказал — если хочешь научиться что-то делать хорошо, очень важно помнить, никогда не забывать, что это получается не из того, что ты подкасты слушаешь или читаешь блоги, а из того, потратишь ли ты свои 10000 часов на то, что постоянно делать это и заставлять свой мозг работать именно в том режиме, в котором ты хочешь, чтобы он в итоге работал.
01:39:11
Это как с изучением иностранного языка: ты, например, можешь смотреть сериалы на английском языке, всё понимать. И ты думаешь: я великолепно знаю английский, вон я какие изящные конструкции понимаю. А потом оказывается, что тебе вообще-то надо не слушать, а говорить. И одно дело — матчить английский в русские мысли, а другое дело — инвертировать этот процесс своих русских мыслей найти английские выражения. Оказывается, что твой мозг вообще не научился этого делать. Совсем другое. Надо было заниматься этим, а ты все поглощал пассивно и поглощал. Вот, не надо пассивно поглощать — нужно активно действовать, и очень много действовать.
Это не всегда понятно, как делать. Программирование — легко. Берешь садишься, делаешь какие-нибудь прикольные штуки, решаешь какие-нибудь небольшие задачи, проектики. Я не знаю, вот в продакт-менеджменте можно чего-нибудь такое? Ты можешь придумывать какие-то продукты, но ты потом не можешь посмотреть, выстрелит это или нет, если ты не сделаешь его, насколько твои гипотезы верными оказались.
01:40:18
Ваня: В продакт-менеджменте есть хаки. Пойти в какой-нибудь акселератор, YCombinator, ФРИИ, и помогать командам, потому что ты смотришь огромное количество кейсов, и кейсов прадуктовых решений, людей, коммуникацию людей, как они эти решения принимали и к чему они потом приводили. Это самый быстрый способ прокачаться.
Боря: Это какой-то путь, которым может условный двадцатилетний wannabe…
Ваня: Да, абсолютно! Ты можешь пойти во ФРИИ в России и там за 3 года посмотреть. Я не знаю, сейчас живет Акселератор ФРИИ или нет. Но пока он жил, можно было в год на сотни стартапов посмотреть.
Боря: Ну, именно посмотреть… Мой пойнт в том, что нужно…
Ваня: Нет, именно посмотреть и включиться в их работу. Например, на все встречи приходить и советовать им. Чуваки, в этой ситуации делайте вот так. А дальше ты смотришь, пошли — не пошли, сделали — не сделали, и как сделали, и что получилось.
01:41:10
То есть по сути это супер-быстрое обучение — prediction и результат.
Боря: Ну окей. И в своей области деятельности нужно найти какую-то систему, которая позволит с самого начала хотя бы по мелочи делать то, чем вы вообще хотите заниматься. Без этого ничего не получится.
Ваня: Окей. Первое — всё сильно проще, чем тебе кажется. Если тебе кажется, что это магия, то ты просто переоцениваешь сложность. Скорее всего, там какой-то набор не очень сложных систем.
Второе — надо думать и делать, намайнить 10000 часов, так чтобы твой мозг думал в ситуациях, в которых ты будешь потом долго заниматься. Что-нибудь ещё?
Боря: Ну это мы какие-то принципы определяющие перечисляем?
Ваня: Да.
01:42:01
Боря: Я вот ещё в последнее время пришел к такому принципу. Я на скейте не катаюсь, но знаю, у скейтеров есть такое выражение: «go fast and commit». Что это значит? Это значит, иногда, или почти всегда, когда тебе нужно сделать какой-то сложный трюк, ты должен поверить обязательно, что он у тебя получится. Условно, разогнаться — прыгнуть — и что-то сделать. Если ты не разгонишься, тебе не хватит скорости на трюк. Если ты в последний момент начнешь сомневаться, то ты не сможешь его нормально начать, и точно ничем хорошим это не закончится. Очень важно себя привести в такое ментальное состояние, что ты веришь, что у тебя получится. А когда ты занимаешься чем-то сложным или рискованным, то есть ты подумал, получится или нет, принял решение, что я пробую. Всё, отпусти всё остальное. Ты пробуешь — отлично. Теперь сфокусируйся только на том, как это сделать. Любые сомнения на этом этапе будут мешать.
01:43:03
Я стараюсь в сложных ситуациях действовать так. Особенно когда, знаешь, стресс на работе, допустим, от тебя хотят чего-то такого, что не понятно, получится или нет. В этот момент, когда ты уже закомиттился, ты понял — раз тебя попросили это сделать, значит, наверно верят, что у тебя может получиться. Окей, давай попробуем. Всё забыли, и единственный вопрос, которым ты должен задаваться: из всего спектра моих возможностей что надо сделать, чтобы эта вещь получилась. Забудь сомнения.
Надо стараться делать так, если получается.
Ваня: Круто! Да. Что-нибудь еще?
Боря: Да хватит. Три как раз.
Ваня: Очень круто, Борь. Спасибо, что пришел.
Боря: Спасибо тебе, что позвал.
Ваня: Безумно интересный разговор.
Боря: Спасибо, Вань.