🤭 Claude Code стал использовать в 3 раза меньше токенов после одного изменения:Было: 10.4M токенов · 10 ошибок · $9.21Стало: 3.7M токенов · 0 ошибок · $2.81Причина не в модели.Проблема в том, как бэкенд отдает информацию агенту. Когда контекст неполный, более сильная модель не игнорирует этот пробел.Она тратит больше токенов на рассуждения о недостающем контексте, запускает больше исследовательских запросов и чаще уходит в ретраи. Поэтому нехватка контекста не исчезает с переходом на более сильную модель — она просто начинает обходиться дороже.Вот разбор, почему бэкенды становятся поглотителем токенов для агентов, как выглядит альтернативная архитектура и какая разница по стоимости получается на реальном проекте.*В качестве слоя контекстной инженерии использовались Insforge Skills + CLI (open-source, локально)
Вайб-кодинг
@vibecoding_tg
Авторский канал по ВАЙБ КОДИНГУСсылка для друзей: https://t.me/+ll3pbl442dNkZmYyСвязь: @devmangxПо контенту: @claudemaneРКН: https://clck.ru/3RRVfk
Похожие каналы
Последние посты

Supabase выпустили новый пакет в реестре пакетов Node.js𝚗𝚙𝚖 𝚒𝚗𝚜𝚝𝚊𝚕𝚕 @𝚜𝚞𝚙𝚊𝚋𝚊𝚜𝚎/𝚜𝚎𝚛𝚟𝚎𝚛Он создает клиент Supabase, настроенный для серверных окружений, и автоматически обрабатывает cookies и сессию аутентификации (SSR, API-роуты, edge-функции) 📘

Кэширование критично для клиентов, чтобы снижать как затраты, так и время до первого токена (TTFT).Anthropic запускают дашборд Prompt Caching в Claude Developer Console, чтобы повысить прозрачность и помочь клиентам оптимизировать использование.Что такое кэширование промптов? Подробнее в статье про кэширование промптов в API Claude+ Разбор того, как повысить долю попаданий в кэш промптов 🐝

Microsoft ужесточает лимиты запросов в GitHub Copilot, убирает Opus из подписок за $10 в месяц и планирует перевести пользователей на биллинг на основе токенов/API позже в 2026 году 🤭Это сигнал того, что компания ищет способы сократить расходы на свои ИИ-сервисы.
Что нужно, чтобы локально запускать 3, 5 или даже 10 параллельных инстансов Gemma 4?Google выложили в опенсорс демо, которое позволяет гонять несколько моделей бок о бок на вашем железе.Gemma 4 26B A4B без проблем тянет 10+ параллельных запросов на MacBook Pro M4 Max со скоростью 18 токенов в секунду на каждый запрос. 🤔
Марко Ланчини (директор по безопасности, C|CISO и автор книги «The CloudSec Engineer») сделал разбор своего сетапа Claude Code: глобальные настройки, защитные ограничения, воркфлоу контекст/план/код, сабагенты и плагины, а также кастомизации в стиле StarCraft, из-за которых терминал ощущается как свой. 🔮 🔮 🔮
Новый дроп от OpenAI: EuphonyОпенсорс-инструмент для визуализации данных чатов и логов сессий Codex.Вставляете публичный URL или загружаете локальный файл, и Euphony преобразует сырые данные в удобное для навигации представление. Поддерживает перевод, фильтрацию, редактирование и другое. 🐀
Tencent выложили в опенсорс Cube Sandbox . Мгновенная, конкурентная, безопасная и легковесная рантайм-среда песочницы для ИИ-агентов.Построена на базе RustVMM и KVM, обеспечивает баланс между безопасностью и производительностью:→ холодный старт < 60 мс (в 2.5–50 раз быстрее)→ накладные расходы по памяти < 5 МБ на инстанс (в 6 раз меньше)→ выделенное ядро для каждой песочницы (изоляция на уровне железа)→ тысячи параллельных песочниц на узел→ 100% совместимость с E2B SDK (меняете эндпоинт, код трогать не нужно) 🫡🫡🫡
Google выложили в опенсорс свою черновую спецификацию для DESIGN.md Теперь её можно использовать в любом инструменте и на любой платформеВ DESIGN.md также добавили несколько новых возможностей: секцию токенов, зачатки секции компонентов и CLI-валидатор для проверки файла. Агенты теперь могут понимать семантику дизайна и валидировать решения по WCAG.Читать их блог 🙉
Ещё один файл AGENTS.md, который объединяет четыре принципа отказов агентного программирования от Karpathy и воркфлоу Claude Code от Boris ChernyКлючевые изменения: агент будет оспаривать твои ошибки, вносить только минимально необходимые изменения, не трогать несвязанный код без причины, сначала запускать проверки перед отчётом о завершении и задавать вопросы при любой неоднозначности.Файл занимает около 200 строк, редактируются только два блока (контекст проекта и накопленный опыт проекта), остальная часть — фиксированные и лаконичные правила поведения. Через симлинки для CLAUDE.md и GEMINI.md один файл может централизованно управлять поведением всех агентов.

В Cowork теперь Claude может собирать живые артефакты: дашборды и трекеры, связанные с твоими приложениями и файлами. 🙂Открываешь в любой момент, и они подтягивают актуальные данные автоматически.Всё, что ты создаёшь, сохраняется в новой вкладке Live Artifacts с историей версий.Можно вернуться завтра или через месяц из любой сессии и продолжить с того же места.

Сегодня Kimi выкатил новую модель: K2.6-code-preview.Внезапно, так как на этапе закрытого теста почти не было промо, а перед релизом начали появляться упоминания от пользователей. На сайте даже нет подробного технического описания.Но реакция сообщества заметная. Кто-то говорит, что уровень как у Claude Sonnet 4.6, кто-то - что стиль рассуждений похож на Opus.А кто то вообще говорит, что это открытая модель №1 в агентной разработке 👂Что показывают бенчмарки по данным сообщества:— общий скор: с 83 → 89— SWE-Bench Verified: 76.8%— LiveCodeBench: 85%Общая оценка на уровне Sonnet 4.6. Если подтвердится, это серьёзный шаг для китайских моделей в кодинге.Но важно, это лишь preview. Полных техдеталей нет, данные в основном из тестов сообщества. Финальные выводы только после релиза.Цена приятная, Kimi K2.6 стоит $0.95 за миллион входных токенов и $4 за миллион выходных токенов.Claude Opus 4.6 стоит $5 и $25.С учётом кэш-хитов разрыв увеличивается. K2.6 падает до $0.16 за миллион закэшированных входных токенов. Opus 4.6 — до $0.50.В среднем это примерно в 5–6 раз дешевле во всех сценариях — как без кэша, так и с кэшем.Для программистов это отличное соотношение цены и возможностей, а остальным пока можно просто наблюдать.

🧙♂️ Codex Update 0.122.0 Это небольшое обновление добавляет давно ожидаемую фичу: Side Quests. С ней можно быстро задать вопрос, пока агент выполняет задачу.1. Используйте команду /side, чтобы создать эфемерный форк, который не мешает основной задаче агента.Просто введите /side и ведите параллельный диалог. Нажмите ESC, чтобы вернуться в основной поток.2. В режиме /plan тоже появилась новая команда. После составления плана можно запустить его реализацию в новом контекстном окне.3. Генерация изображений теперь включена по умолчанию4. Плагины тоже получили улучшения:> Теперь можно собирать собственный маркетплейс сразу из нескольких GitHub-репозиториев> Можно переключаться между маркетплейсами в меню /plugin с помощью стрелок: All, OpenAI Curated, Installed и Custom Marketplaces> Команда codex marketplace remove <name> поддерживает удаление маркетплейсов> Маркетплейсы теперь автоматически синхронизируют изменения и обновления, новые плагины подтягиваются без ручного апдейта5. Инструмент ToolSearch теперь включён по умолчанию (экономия токенов в MCP)Стоит отметить, что не рекомендуется сбрасывать контекст при реализации плана.Модель всё равно не деградирует, а ты просто выкидываешь релевантный контекст без веской причины.
Новая браузерная фича: функция «html-in-canvas», которая позволяет рендерить HTML напрямую в память GPU и использовать его как текстуру.Сложные экраны интерфейса можно размещать прямо в 3D-пространстве, используя стандартные возможности браузера.Сейчас это экспериментальная функция в Chrome (через флаг:chrome://flags/#canvas-draw-element), но это ожидаемая технология с потенциалом существенно упростить разработку Web3D-интерфейсов. 😎https://github.com/fimbox/html-in-canvas/blob/main/plugins/html-cloth.mjs
68 готовых дизайн-систем в формате DESIGN.md, которые можно использовать как источник вдохновения: Awesome Claude Design 🤯🤯Загружаешь один файл, и получаешь полный каркас интерфейса за один проход.Покрывает такие индустрии, как ИИ, инструменты разработки, SaaS, финансы, электронная коммерция, медиа, автомобилестроение и другие. Каждый документ оформлен в фиксированной структуре из 9 разделов — визуальная тема, роли цветов, типографика, стили компонентов, лэйаут, иерархия, гайдлайны, адаптивность, агентные промпты
Чувак дал двум MoE-моделям один и тот же вайбкодинг-челлендж.Qwen3.6 35B A3B (31.8 ГБ) vs Gemma4 26B A4B (23.3 ГБ)Стек:> Unsloth Q6_K_XL> llama.cpp> для каждой — семплирование, рекомендованное в model card4 промпта, бок о бок. Как думаешь, кто победит? 🤨
Codex (полный гайд для новичков)ТАЙМКОДЫ:Часть 1: основы Codex00:00 Введение02:54 Загрузка Codex03:20 Обзор интерфейса Codex03:56 Чаты, промптинг и встроенный поиск04:53 Создание проектов07:37 Создание таблицы09:43 Как хранятся файлы и как на них ссылаться внутри проектов10:42 Быстрый обзор Codex12:47 Поиск (CMD+G) и организация папок14:29 Навыки и плагины16:29 Использование плагина календаря18:07 Создание автоматизаций в Codex19:18 Обзор плагинов (Figma)21:37 Встроенная генерация изображений22:37 Пример MCP (документ для дизайна)24:17 Открытие чатов в мини-окне25:26 Управление агентом vs постановка задач в очередь27:35 Создание собственного навыка с API31:34 Использование навыка YouTube Researcher (созданного нами)33:24 Создание автоматизации с кастомным навыкомЧасть 2: мультизадачность (более хаотично и весело)35:27 Часть 2: мультизадачность — сборка iOS-приложения, веб-приложения, презентации для инвесторов, видео запуска, мобильного дизайна и автоматизированных постов в X37:54 Создание проекта38:31 Планирование 6 проектов40:25 Навык мобильного дизайна41:47 Настройка iOS-приложения45:08 Интеграция дизайна в мобильное приложение46:13 Создание лендинга для сбора пользовательских данных46:45 Tally для отправки форм (подходит для лид-магнитов)49:43 Организация и переименование чатов для мультизадачности52:12 База данных для мобильного приложения (Supabase)53:19 Генерация иконок приложения54:08 Видео запуска (Remotion)59:32 Таймлайн Remotion и интерфейс видеоредактора01:05:37 Редактирование инструкций для Remotion (сетка)01:07:11 Редактирование веб-приложения01:09:46 Использование CLAUDE CODE внутри Codex для дизайна (терминал)01:17:20 Форк чата для создания презентации01:19:09 Использование Claude 4.7 Opus для дизайна презентации01:20:22 Проверка экспорта в Canva (работает нормально)01:22:33 Запуск мобильного приложения на реальном устройстве (не эмулятор)01:28:58 Завершение всех проектов (мобильное приложение, лендинг, видео запуска)01:31:56 Экспорт презентации и до
Забавный факт: чтобы сжечь 5 часов кредитов Opus на плане Claude Code Max 20x, достаточно 32 минут.12 агентов пытаются починить 3 528 ошибок в TypeScript.