Как OpenAI создала приложение №1 за 28 дней: ИИ-агенты, Codex и планы на 2026 год | Александр Эмбирикос

Lenny's Podcast·

Введение в Александра Эмбирикоса [00:00]

  • Александр Эмбирикос, руководитель продукта Codex в OpenAI, рассказывает о своем опыте работы в компании.
  • Codex позиционируется как начало пути к созданию полноценного ИИ-ассистента для инженеров, способного решать сложные задачи.
  • Пример: Codex решил сложнейшие баги, над которыми инженеры бились часами.
  • Codex уже используется для управления собственными тренировочными запусками и для ревью кода, выявляя ошибки конфигурации.
  • Приложение Sora было создано за 18 дней, а публичный релиз состоялся через 10 дней после этого, всего за 28 дней.
  • Цель Codex — проактивность: ИИ-ассистент должен уметь выполнять задачи самостоятельно, используя компьютер.
  • Лучший способ для моделей использовать компьютеры — писать код, поэтому ключевым является создание ИИ-агента, который умеет кодировать.
  • Команда продукта стремится создавать инструменты, максимально ускоряющие работу людей, а не усложняющие их задачи.
  • Текущий ограничивающий фактор — скорость человеческого набора текста и многозадачности.
  • Александр Эмбирикос — руководитель продукта Codex, который описывается как один из лучших специалистов, с которым приходилось работать.
  • В разговоре обсуждается создание продукта в OpenAI, ускорение благодаря Codex, рост Codex в 20 раз, фокус на ревью кода, сроки разработки AGI и полезность ИИ-агентов.

Скорость и амбиции в OpenAI [05:13]

  • OpenAI отличается от предыдущих мест работы Эмбирикоса (стартап, Dropbox) по скорости и амбициям.
  • Скорость роста Codex составила 10-кратное увеличение за несколько месяцев, а затем и 20-кратное.
  • Опыт работы в OpenAI заставляет переосмыслить понятие скорости и масштаба в разработке.
  • Структура OpenAI позволяет двигаться быстро благодаря трансформационной технологии и большому количеству нереализованных продуктовых возможностей.
  • Подход OpenAI — «готовься, стреляй, целься» (ready, fire, aim), а не «готовься, целься, стреляй» (ready, aim, fire), что обусловлено неопределенностью будущих возможностей и пользовательского принятия.
  • Организация действительно децентрализована и ориентирована на эмпирическое обучение через быстрые эксперименты.
  • Высокий уровень талантов и индивидуальной инициативы в OpenAI позволяет реализовать такой подход.

Codex: ИИ-агент OpenAI [11:34]

  • Codex — это ИИ-агент OpenAI для написания кода, доступный как расширение для VS Code или как инструмент командной строки.
  • Он позволяет писать код, запускать тесты, выполнять код и участвовать в других этапах жизненного цикла разработки ПО.
  • Видение Codex — стать полноценным «коллегой» инженера, участвующим в идеях, планировании, валидации, развертывании и поддержке кода.
  • Сегодня Codex работает как очень умный стажер, который не читает Slack и не проверяет DataDog без запроса, требуя совместной работы с человеком.
  • В будущем Codex должен стать проактивным, как новый сотрудник, который со временем учится и делегирует задачи.
  • Цель — сделать ИИ-продукты полезными по умолчанию, а не требовать от пользователя постоянного продумывания промптов.
  • Codex стремится дать разработчикам «суперспособности», позволяя им работать быстрее без необходимости постоянно думать, как вызвать ИИ.
  • Основная цель — достичь проактивности ИИ-агента, чтобы он помогал тысячами раз в день, а не десятками.

Взрывной рост Codex [15:43]

  • Рост Codex начался после запуска GPT-5 в августе и составил более 20 раз с тех пор.
  • Модели Codex обрабатывают триллионы токенов в неделю и являются самыми используемыми моделями для кодирования.
  • Интегрированная команда продукта и исследований позволяет быстро итерировать модель и ее окружение.
  • Модели Codex теперь используются и другими крупными API-клиентами для кодирования.
  • Ключевым фактором роста стало изменение подхода: вместо облачного асинхронного агента (Codex Cloud) был предложен интерактивный агент, работающий локально в IDE или CLI.
  • Локальный агент работает в безопасной песочнице, но имеет доступ к зависимостям проекта.
  • Этот подход упростил первоначальное внедрение и получение ценности для пользователей.
  • Изначальная версия Codex Cloud была слишком опережающей для рынка, требуя сложной настройки окружения.
  • Внутреннее использование (dogfooding) в OpenAI показало эффективность облачного подхода, но рыночный сигнал указал на необходимость более простого старта.
  • Команда продолжает работать над проактивными возможностями, но начальный этап фокусируется на интуитивном использовании.

Будущее ИИ и кодирующих агентов [24:59]

  • Победа в этой сфере заключается в создании ИИ-коллеги или супер-ассистента, который будет полезен по умолчанию.
  • Такой ассистент должен уметь выполнять задачи, используя компьютер, и лучшим способом для этого является написание кода.
  • Идея в том, чтобы разработчики чувствовали себя так, будто у них есть суперспособности, и могли работать намного быстрее, не задумываясь о вызове ИИ.
  • Интерфейс чата хорош для общего использования, но для экспертов в конкретных областях (например, кодирование) нужен графический интерфейс для глубокой работы с кодом.
  • ChatGPT, доступный всем, приучает пользователей к ускорению с помощью ИИ, что облегчает переход к более специализированным инструментам.
  • Кодирование рассматривается как ключевая компетенция любого агента, включая ChatGPT.
  • Агенты, пишущие код, могут использовать его композиционность и интероперабельность.
  • Важно не только то, что агент может делать, но и как он понимает контекст, команду и их предпочтения.
  • Необходима конфигурация агента под нужды команды и пользователя, а также запоминание часто выполняемых задач для повторного использования.
  • Кодирующие агенты уже достаточно хороши, а агенты вне сферы кодирования станут лучше, когда смогут использовать код.
  • Разработка для инженеров интересна, так как они часто сами создают и предлагают новые способы использования технологий.

Влияние ИИ на инженерию [33:11]

  • ИИ-агенты, пишущие код, могут сделать каждого инженера более продуктивным, но не заменят их полностью.
  • Кодирование становится все более повсеместным и будет использоваться для большего числа целей, что увеличит потребность в людях с этой компетенцией.
  • Продуктовая команда должна создавать инструменты, которые максимально ускоряют людей, а не делают их задачи более неясными.
  • Обзор кода, написанного ИИ, может быть менее приятной частью работы, чем само написание кода.
  • OpenAI работает над функциями ревью кода и улучшением валидации работы агента, чтобы сделать процесс более приятным и эффективным.
  • При разработке интерфейса для агента важно показывать пользователю результат (например, предпросмотр изображения), а не только код.
  • Концепция «спецификационно-ориентированной разработки» (spec-driven development) предполагает работу на более высоком уровне абстракции, где ИИ пишет код по спецификации.
  • Также существует идея «разработки, управляемой чатом» (chatter-driven development), где код пишется на основе коммуникаций в команде и социальных сетях.
  • ИИ-агент может быть проактивным, предлагая идеи и исправления на основе анализа рыночных сигналов и пользовательских потребностей.

Влияние Codex на работу продакт-менеджеров [44:08]

  • Codex дает продакт-менеджерам больше возможностей, позволяя им быть более технически подкованными и делать больше.
  • Идея «сжатия стека талантов» предполагает, что границы между ролями могут размываться, так как люди могут выполнять больше задач.
  • Продакт-менеджеры могут быстрее отвечать на вопросы, анализировать изменения, прототипировать и писать спецификации.
  • Часто используется «одноразовый код» (throwaway code) для анализа данных, создания интерактивных просмотрщиков данных или прототипирования анимаций.
  • Дизайнеры используют Codex для быстрого прототипирования и даже создания полноценных PR-запросов.
  • Пример: команда Sora Android использовала Codex для создания нового приложения за 18 дней, а затем выпустила его за 10 дней.
  • Команда Atlas (браузер) использовала Codex для ускорения разработки, сократив время с 2-3 недель для 2-3 инженеров до 1 недели для 1 инженера.
  • Codex также помогает в разработке на разных платформах, например, при портировании кода с iOS на Android.
  • Разработка браузера Atlas была сложной задачей, но команда активно использовала Codex.
  • Codex теперь поддерживает PowerShell, что важно для разработки под Windows.
  • Codex ускоряет работу всей компании, включая исследования, дизайн и маркетинг.

Разработка браузера Atlas [49:01]

  • Создание браузера — сложная задача, требующая разработки множества систем.
  • Команда Atlas активно использует Codex, что значительно ускорило их работу.
  • Ранее разработка занимала 2-3 недели для 2-3 инженеров, теперь — 1 неделя для 1 инженера.
  • Команда работает над версией Atlas для Windows, что также способствует улучшению Codex для этой платформы.
  • Codex помогает в исследованиях, ускоряя обучение моделей.
  • Маркетологи используют Codex для внесения изменений в текст и документацию прямо из Slack.

Влияние Codex на производительность [53:34]

  • Быстрота создания продуктов меняет важность других аспектов, таких как дистрибуция и идеи.
  • Идеи по-прежнему важны, но исполнение остается ключевым фактором.
  • Глубокое понимание проблем конкретного клиента становится более важным, чем просто навыки разработки.
  • Вертикальные AI-стартапы, решающие специфические проблемы, имеют хорошие перспективы.
  • Ключевые метрики для Codex включают D7 retention (удержание пользователей на 7-й день) и анализ обратной связи из социальных сетей (Reddit, Twitter).
  • Команда серьезно относится к жалобам пользователей и использует их для улучшения продукта.
  • Reddit считается более надежным источником обратной связи из-за механики апвоутинга.

Почему они создают веб-браузер [58:09]

  • Изначальная идея Codex — контекстный десктопный ассистент, который понимает, что вы пытаетесь сделать.
  • Браузер Atlas позволяет быть контекстуальным в более «первоклассном» режиме, напрямую взаимодействуя с движком рендеринга.
  • Это позволяет избежать проблем с парсингом других десктопных приложений и ненадежностью скриншотов.
  • Контекстные действия, как в видеоиграх (нажать X, чтобы сделать нужное действие), позволяют ИИ помогать пользователю в нужный момент.
  • Вместо тысячи push-уведомлений от ИИ, контекстные действия в браузере позволяют пользователю оставаться в потоке.
  • Пользователь может выбрать, открывать ли ссылку в обычном браузере или в AI-браузере Atlas, сохраняя контроль.
  • Atlas позволяет создавать UX с «смешанной инициативой», где ИИ предлагает контекстные действия.

Неинженерные варианты использования Codex [01:01:58]

  • Основной фокус Codex — кодирование, но ожидается рост использования в других областях.
  • Сейчас наблюдается наибольший прогресс в областях, смежных с кодированием, таких как анализ данных.
  • Команда пока сосредоточена на кодировании из-за большого объема работы.

Возможности Codex [01:02:53]

  • Codex лучше всего пробовать на самых сложных задачах, а не на тривиальных.
  • Он предназначен для профессионального использования и написания высококачественного кода в больших кодовых базах.
  • Пример: использование Codex для поиска и исправления сложных багов.
  • Поддерживает большинство распространенных языков программирования, кроме очень эзотерических или частных.

Советы по началу работы с Codex [01:04:49]

  • Попробуйте несколько подходов параллельно: дать сложную задачу, попросить понять кодовую базу, сформулировать план.
  • Это похоже на построение доверия с новым коллегой: сначала понять его возможности, затем согласовать подход, потом делегировать задачи.
  • Понимание различных способов промптинга Codex важно для его эффективного использования.

Навыки, на которые стоит опираться в эпоху ИИ [01:05:37]

  • Быть «делателем вещей» (doer): использовать ИИ-инструменты для повышения продуктивности, особенно для начинающих специалистов.
  • Глубокое понимание того, что делает хорошую программную систему в целом (системная инженерия).
  • Эффективная коммуникация и сотрудничество в команде.
  • Важно уметь рассуждать о системах и факторах, влияющих на эффективность команды.
  • Продвижение на переднем крае знаний в определенной области, так как ИИ пока не так хорош в этом.
  • Использование ИИ-агентов для ускорения собственного рабочего процесса при работе на переднем крае знаний.
  • Пример: настройка Codex для проверки собственной работы при разработке Atlas.
  • Важность человеческого участия в настройке и конфигурации кодирующих агентов.

Codex и его роль в обучении моделей [01:09:09]

  • Codex пишет значительную часть кода для управления тренировочными запусками OpenAI.
  • Ревью кода с помощью Codex помогает выявлять ошибки конфигурации.
  • Идея: Codex может быть «дежурным» для собственных тренировочных запусков, анализируя графики и реагируя на сбои.
  • Это позволит повысить эффективность обучения моделей, уменьшив необходимость «присматривать» за процессом.

Как далеко мы от человеческой версии ИИ? [01:10:36]

  • Ключевой фактор — когда кривые ускорения станут экспоненциальными (hockey stick).
  • Текущий недооцененный ограничитель — скорость человеческого набора текста и многозадачности при написании промптов и проверке результатов работы ИИ.
  • Необходимо разблокировать эти петли производительности, чтобы ИИ был полезен по умолчанию.
  • Ожидается, что с 2025 года ранние последователи начнут экспоненциально наращивать производительность.
  • Крупные компании будут постепенно внедрять эти системы, что приведет к дальнейшему ускорению.
  • Когда это ускорение начнет влиять на сами ИИ-лаборатории, мы достигнем уровня AGI.

Найм и рост команды Codex [01:13:31]

  • Команда Codex растет, и они ищут инженеров, продавцов и продакт-менеджеров.
  • Идеальный кандидат — технический специалист, использующий эти инструменты и имеющий четкое представление о будущем инженера-программиста с ИИ-ассистентом.
  • Важна страсть к теме и видение будущего с агентами.

Молниеносный раунд и финальные мысли [01:15:47]

  • Рекомендованные книги: серия «Культура» Иэна Бэнкса (оптимистичное будущее с ИИ) и «Огонь над бездной» (космическая опера с супер-интеллектом).
  • Любимое шоу: аниме «Магическая битва» (Jujutsu Kaisen) за позитивных протагонистов.
  • Продукт, который нравится: Tesla за вдохновляющее программное обеспечение и функцию автопилота, позволяющую сохранять контроль.
  • Девиз: «Будь добрым и откровенным» (Be kind and candid), что означает быть честным, но с заботой о других.
  • Идентификация с греческим поэтом Андреасом Эмбирикосом, который любил родной остров семьи Андрос.
  • Контакты: Twitter/X @Embiricos, Reddit r/codex.
  • Призыв к действию: попробовать Codex, оставить обратную связь, подать заявку на вакансии в команде Codex.

Это саммари создано в Summa AI

Summa AI — это Telegram-бот,
который смотрит видео за вас
и создает саммари
с ключевыми идеями.