Как OpenAI создала приложение №1 за 28 дней: ИИ-агенты, Codex и планы на 2026 год | Александр Эмбирикос
Lenny's Podcast·
Введение в Александра Эмбирикоса [00:00]
- Александр Эмбирикос, руководитель продукта Codex в OpenAI, рассказывает о своем опыте работы в компании.
- Codex позиционируется как начало пути к созданию полноценного ИИ-ассистента для инженеров, способного решать сложные задачи.
- Пример: Codex решил сложнейшие баги, над которыми инженеры бились часами.
- Codex уже используется для управления собственными тренировочными запусками и для ревью кода, выявляя ошибки конфигурации.
- Приложение Sora было создано за 18 дней, а публичный релиз состоялся через 10 дней после этого, всего за 28 дней.
- Цель Codex — проактивность: ИИ-ассистент должен уметь выполнять задачи самостоятельно, используя компьютер.
- Лучший способ для моделей использовать компьютеры — писать код, поэтому ключевым является создание ИИ-агента, который умеет кодировать.
- Команда продукта стремится создавать инструменты, максимально ускоряющие работу людей, а не усложняющие их задачи.
- Текущий ограничивающий фактор — скорость человеческого набора текста и многозадачности.
- Александр Эмбирикос — руководитель продукта Codex, который описывается как один из лучших специалистов, с которым приходилось работать.
- В разговоре обсуждается создание продукта в OpenAI, ускорение благодаря Codex, рост Codex в 20 раз, фокус на ревью кода, сроки разработки AGI и полезность ИИ-агентов.
Скорость и амбиции в OpenAI [05:13]
- OpenAI отличается от предыдущих мест работы Эмбирикоса (стартап, Dropbox) по скорости и амбициям.
- Скорость роста Codex составила 10-кратное увеличение за несколько месяцев, а затем и 20-кратное.
- Опыт работы в OpenAI заставляет переосмыслить понятие скорости и масштаба в разработке.
- Структура OpenAI позволяет двигаться быстро благодаря трансформационной технологии и большому количеству нереализованных продуктовых возможностей.
- Подход OpenAI — «готовься, стреляй, целься» (ready, fire, aim), а не «готовься, целься, стреляй» (ready, aim, fire), что обусловлено неопределенностью будущих возможностей и пользовательского принятия.
- Организация действительно децентрализована и ориентирована на эмпирическое обучение через быстрые эксперименты.
- Высокий уровень талантов и индивидуальной инициативы в OpenAI позволяет реализовать такой подход.
Codex: ИИ-агент OpenAI [11:34]
- Codex — это ИИ-агент OpenAI для написания кода, доступный как расширение для VS Code или как инструмент командной строки.
- Он позволяет писать код, запускать тесты, выполнять код и участвовать в других этапах жизненного цикла разработки ПО.
- Видение Codex — стать полноценным «коллегой» инженера, участвующим в идеях, планировании, валидации, развертывании и поддержке кода.
- Сегодня Codex работает как очень умный стажер, который не читает Slack и не проверяет DataDog без запроса, требуя совместной работы с человеком.
- В будущем Codex должен стать проактивным, как новый сотрудник, который со временем учится и делегирует задачи.
- Цель — сделать ИИ-продукты полезными по умолчанию, а не требовать от пользователя постоянного продумывания промптов.
- Codex стремится дать разработчикам «суперспособности», позволяя им работать быстрее без необходимости постоянно думать, как вызвать ИИ.
- Основная цель — достичь проактивности ИИ-агента, чтобы он помогал тысячами раз в день, а не десятками.
Взрывной рост Codex [15:43]
- Рост Codex начался после запуска GPT-5 в августе и составил более 20 раз с тех пор.
- Модели Codex обрабатывают триллионы токенов в неделю и являются самыми используемыми моделями для кодирования.
- Интегрированная команда продукта и исследований позволяет быстро итерировать модель и ее окружение.
- Модели Codex теперь используются и другими крупными API-клиентами для кодирования.
- Ключевым фактором роста стало изменение подхода: вместо облачного асинхронного агента (Codex Cloud) был предложен интерактивный агент, работающий локально в IDE или CLI.
- Локальный агент работает в безопасной песочнице, но имеет доступ к зависимостям проекта.
- Этот подход упростил первоначальное внедрение и получение ценности для пользователей.
- Изначальная версия Codex Cloud была слишком опережающей для рынка, требуя сложной настройки окружения.
- Внутреннее использование (dogfooding) в OpenAI показало эффективность облачного подхода, но рыночный сигнал указал на необходимость более простого старта.
- Команда продолжает работать над проактивными возможностями, но начальный этап фокусируется на интуитивном использовании.
Будущее ИИ и кодирующих агентов [24:59]
- Победа в этой сфере заключается в создании ИИ-коллеги или супер-ассистента, который будет полезен по умолчанию.
- Такой ассистент должен уметь выполнять задачи, используя компьютер, и лучшим способом для этого является написание кода.
- Идея в том, чтобы разработчики чувствовали себя так, будто у них есть суперспособности, и могли работать намного быстрее, не задумываясь о вызове ИИ.
- Интерфейс чата хорош для общего использования, но для экспертов в конкретных областях (например, кодирование) нужен графический интерфейс для глубокой работы с кодом.
- ChatGPT, доступный всем, приучает пользователей к ускорению с помощью ИИ, что облегчает переход к более специализированным инструментам.
- Кодирование рассматривается как ключевая компетенция любого агента, включая ChatGPT.
- Агенты, пишущие код, могут использовать его композиционность и интероперабельность.
- Важно не только то, что агент может делать, но и как он понимает контекст, команду и их предпочтения.
- Необходима конфигурация агента под нужды команды и пользователя, а также запоминание часто выполняемых задач для повторного использования.
- Кодирующие агенты уже достаточно хороши, а агенты вне сферы кодирования станут лучше, когда смогут использовать код.
- Разработка для инженеров интересна, так как они часто сами создают и предлагают новые способы использования технологий.
Влияние ИИ на инженерию [33:11]
- ИИ-агенты, пишущие код, могут сделать каждого инженера более продуктивным, но не заменят их полностью.
- Кодирование становится все более повсеместным и будет использоваться для большего числа целей, что увеличит потребность в людях с этой компетенцией.
- Продуктовая команда должна создавать инструменты, которые максимально ускоряют людей, а не делают их задачи более неясными.
- Обзор кода, написанного ИИ, может быть менее приятной частью работы, чем само написание кода.
- OpenAI работает над функциями ревью кода и улучшением валидации работы агента, чтобы сделать процесс более приятным и эффективным.
- При разработке интерфейса для агента важно показывать пользователю результат (например, предпросмотр изображения), а не только код.
- Концепция «спецификационно-ориентированной разработки» (spec-driven development) предполагает работу на более высоком уровне абстракции, где ИИ пишет код по спецификации.
- Также существует идея «разработки, управляемой чатом» (chatter-driven development), где код пишется на основе коммуникаций в команде и социальных сетях.
- ИИ-агент может быть проактивным, предлагая идеи и исправления на основе анализа рыночных сигналов и пользовательских потребностей.
Влияние Codex на работу продакт-менеджеров [44:08]
- Codex дает продакт-менеджерам больше возможностей, позволяя им быть более технически подкованными и делать больше.
- Идея «сжатия стека талантов» предполагает, что границы между ролями могут размываться, так как люди могут выполнять больше задач.
- Продакт-менеджеры могут быстрее отвечать на вопросы, анализировать изменения, прототипировать и писать спецификации.
- Часто используется «одноразовый код» (throwaway code) для анализа данных, создания интерактивных просмотрщиков данных или прототипирования анимаций.
- Дизайнеры используют Codex для быстрого прототипирования и даже создания полноценных PR-запросов.
- Пример: команда Sora Android использовала Codex для создания нового приложения за 18 дней, а затем выпустила его за 10 дней.
- Команда Atlas (браузер) использовала Codex для ускорения разработки, сократив время с 2-3 недель для 2-3 инженеров до 1 недели для 1 инженера.
- Codex также помогает в разработке на разных платформах, например, при портировании кода с iOS на Android.
- Разработка браузера Atlas была сложной задачей, но команда активно использовала Codex.
- Codex теперь поддерживает PowerShell, что важно для разработки под Windows.
- Codex ускоряет работу всей компании, включая исследования, дизайн и маркетинг.
Разработка браузера Atlas [49:01]
- Создание браузера — сложная задача, требующая разработки множества систем.
- Команда Atlas активно использует Codex, что значительно ускорило их работу.
- Ранее разработка занимала 2-3 недели для 2-3 инженеров, теперь — 1 неделя для 1 инженера.
- Команда работает над версией Atlas для Windows, что также способствует улучшению Codex для этой платформы.
- Codex помогает в исследованиях, ускоряя обучение моделей.
- Маркетологи используют Codex для внесения изменений в текст и документацию прямо из Slack.
Влияние Codex на производительность [53:34]
- Быстрота создания продуктов меняет важность других аспектов, таких как дистрибуция и идеи.
- Идеи по-прежнему важны, но исполнение остается ключевым фактором.
- Глубокое понимание проблем конкретного клиента становится более важным, чем просто навыки разработки.
- Вертикальные AI-стартапы, решающие специфические проблемы, имеют хорошие перспективы.
- Ключевые метрики для Codex включают D7 retention (удержание пользователей на 7-й день) и анализ обратной связи из социальных сетей (Reddit, Twitter).
- Команда серьезно относится к жалобам пользователей и использует их для улучшения продукта.
- Reddit считается более надежным источником обратной связи из-за механики апвоутинга.
Почему они создают веб-браузер [58:09]
- Изначальная идея Codex — контекстный десктопный ассистент, который понимает, что вы пытаетесь сделать.
- Браузер Atlas позволяет быть контекстуальным в более «первоклассном» режиме, напрямую взаимодействуя с движком рендеринга.
- Это позволяет избежать проблем с парсингом других десктопных приложений и ненадежностью скриншотов.
- Контекстные действия, как в видеоиграх (нажать X, чтобы сделать нужное действие), позволяют ИИ помогать пользователю в нужный момент.
- Вместо тысячи push-уведомлений от ИИ, контекстные действия в браузере позволяют пользователю оставаться в потоке.
- Пользователь может выбрать, открывать ли ссылку в обычном браузере или в AI-браузере Atlas, сохраняя контроль.
- Atlas позволяет создавать UX с «смешанной инициативой», где ИИ предлагает контекстные действия.
Неинженерные варианты использования Codex [01:01:58]
- Основной фокус Codex — кодирование, но ожидается рост использования в других областях.
- Сейчас наблюдается наибольший прогресс в областях, смежных с кодированием, таких как анализ данных.
- Команда пока сосредоточена на кодировании из-за большого объема работы.
Возможности Codex [01:02:53]
- Codex лучше всего пробовать на самых сложных задачах, а не на тривиальных.
- Он предназначен для профессионального использования и написания высококачественного кода в больших кодовых базах.
- Пример: использование Codex для поиска и исправления сложных багов.
- Поддерживает большинство распространенных языков программирования, кроме очень эзотерических или частных.
Советы по началу работы с Codex [01:04:49]
- Попробуйте несколько подходов параллельно: дать сложную задачу, попросить понять кодовую базу, сформулировать план.
- Это похоже на построение доверия с новым коллегой: сначала понять его возможности, затем согласовать подход, потом делегировать задачи.
- Понимание различных способов промптинга Codex важно для его эффективного использования.
Навыки, на которые стоит опираться в эпоху ИИ [01:05:37]
- Быть «делателем вещей» (doer): использовать ИИ-инструменты для повышения продуктивности, особенно для начинающих специалистов.
- Глубокое понимание того, что делает хорошую программную систему в целом (системная инженерия).
- Эффективная коммуникация и сотрудничество в команде.
- Важно уметь рассуждать о системах и факторах, влияющих на эффективность команды.
- Продвижение на переднем крае знаний в определенной области, так как ИИ пока не так хорош в этом.
- Использование ИИ-агентов для ускорения собственного рабочего процесса при работе на переднем крае знаний.
- Пример: настройка Codex для проверки собственной работы при разработке Atlas.
- Важность человеческого участия в настройке и конфигурации кодирующих агентов.
Codex и его роль в обучении моделей [01:09:09]
- Codex пишет значительную часть кода для управления тренировочными запусками OpenAI.
- Ревью кода с помощью Codex помогает выявлять ошибки конфигурации.
- Идея: Codex может быть «дежурным» для собственных тренировочных запусков, анализируя графики и реагируя на сбои.
- Это позволит повысить эффективность обучения моделей, уменьшив необходимость «присматривать» за процессом.
Как далеко мы от человеческой версии ИИ? [01:10:36]
- Ключевой фактор — когда кривые ускорения станут экспоненциальными (hockey stick).
- Текущий недооцененный ограничитель — скорость человеческого набора текста и многозадачности при написании промптов и проверке результатов работы ИИ.
- Необходимо разблокировать эти петли производительности, чтобы ИИ был полезен по умолчанию.
- Ожидается, что с 2025 года ранние последователи начнут экспоненциально наращивать производительность.
- Крупные компании будут постепенно внедрять эти системы, что приведет к дальнейшему ускорению.
- Когда это ускорение начнет влиять на сами ИИ-лаборатории, мы достигнем уровня AGI.
Найм и рост команды Codex [01:13:31]
- Команда Codex растет, и они ищут инженеров, продавцов и продакт-менеджеров.
- Идеальный кандидат — технический специалист, использующий эти инструменты и имеющий четкое представление о будущем инженера-программиста с ИИ-ассистентом.
- Важна страсть к теме и видение будущего с агентами.
Молниеносный раунд и финальные мысли [01:15:47]
- Рекомендованные книги: серия «Культура» Иэна Бэнкса (оптимистичное будущее с ИИ) и «Огонь над бездной» (космическая опера с супер-интеллектом).
- Любимое шоу: аниме «Магическая битва» (Jujutsu Kaisen) за позитивных протагонистов.
- Продукт, который нравится: Tesla за вдохновляющее программное обеспечение и функцию автопилота, позволяющую сохранять контроль.
- Девиз: «Будь добрым и откровенным» (Be kind and candid), что означает быть честным, но с заботой о других.
- Идентификация с греческим поэтом Андреасом Эмбирикосом, который любил родной остров семьи Андрос.
- Контакты: Twitter/X @Embiricos, Reddit r/codex.
- Призыв к действию: попробовать Codex, оставить обратную связь, подать заявку на вакансии в команде Codex.
Это саммари создано в Summa AI
Summa AI — это Telegram-бот,
который смотрит видео за вас
и создает саммари
с ключевыми идеями.