[Факторы будущего]

Gaming

iGaming

NFT

Авто

Банкинг

Биотехнологии

Дроны

Женский взгляд

Интервью

Интернет

Искусственный интеллект

Квантовый скачок

Кибербезопасность

Космос

Майнинг

Маркетплейсы

Метавселенные

Монеты

На острие

Недвижимость

Правовое поле

Робототехника

Рынки

Событие

Стартапы

Сценарии и прогнозы

Технический анализ

Технологии

Технологические достижения

Финтех

Эйрдропы

Развернуть

Свернуть

Google представила DiffusionGemma: ИИ-модель, быстрый локальный ИИ для текста, кода и разработчиков

МД

Максим Долженков

Искусственный интеллект

12 июн 2026

Подписаться на автора Отписаться от автора

Подписаться Отписаться

Google выпустила новую открытую ИИ-модель DiffusionGemma, которая может заметно изменить подход к генерации текста. Если большинство современных языковых моделей работают как печатная машинка — последовательно создают ответ токен за токеном, — то DiffusionGemma использует другой принцип. Она генерирует сразу целые блоки текста, постепенно уточняя результат, примерно так же, как диффузионные нейросети создают изображения из шума. DiffusionGemma способна достигать скорости более 1000 токенов в секунду на NVIDIA H100. В официальном блоге Google также говорится о 700+ токенах в секунду на NVIDIA GeForce RTX 5090 и о приросте скорости до четырех раз по сравнению с обычными авторегрессионными моделями. Это делает новинку особенно интересной для разработчиков, которым важна не только точность, но и минимальная задержка: автодополнение кода, быстрые редакторы текста, локальные ИИ-ассистенты и интерактивные инструменты.

Главная особенность DiffusionGemma — text diffusion, или текстовая диффузия. В обычных LLM каждое следующее слово зависит от предыдущего. Модель как бы идет слева направо и не может заранее «видеть» весь будущий ответ. DiffusionGemma работает иначе: она создает «черновой холст» из случайных токенов, а затем несколькими проходами исправляет и уточняет весь блок. Google описывает это как переход от последовательной печатной машинки к «печатному прессу», который обрабатывает сразу большой фрагмент текста.

Читайте также

Tether разрабатывает децентрализованный поисковик Hypersearch

Максим Долженков

Интернет

Технически модель построена на архитектуре Gemma 4 26B A4B Mixture-of-Experts. Это означает, что всего в модели 26 млрд параметров, но при инференсе активируется только часть — около 3,8 млрд. Благодаря этому DiffusionGemma может быть пригодна для запуска на мощных потребительских GPU после квантования. Модель доступна на Hugging Face, распространяется под лицензией Apache 2.0 и поддерживает мультимодальные входные данные: текст, изображения и видео, хотя на выходе генерирует текст. Однако это не «убийца» обычных языковых моделей. Google прямо отмечает: DiffusionGemma — экспериментальная модель, созданная прежде всего ради скорости. По качеству универсальных ответов она уступает стандартным Gemma 4. Поэтому для задач, где важны максимально точные, длинные и аккуратные ответы, классические авторегрессионные модели пока остаются предпочтительным выбором.

Зато у DiffusionGemma есть сильная сторона: она лучше подходит для задач, где начало ответа зависит от конца. Например, для заполнения пропусков в коде, структурированной генерации, сложной разметки, математических зависимостей или биологических последовательностей. В демонстрации Google модель после дообучения смогла решать Sudoku с точностью около 80%, тогда как базовая версия почти не справлялась. Пока главный минус — практический запуск. Модель еще не так просто использовать на обычных пользовательских системах: часть инструментов и оптимизаций только догоняет релиз. Google, в свою очередь, указывает поддержку vLLM, Hugging Face Transformers, SGLang, MLX, NVIDIA NIM и Google Cloud Model Garden.

Читать еще

Эфириум и ИИ: как Виталик Бутерин видит ближайшее будущее блокчейна Ethereum в мире нейросетей

Как Ethereum станет базовым слоем для ИИ: видение Виталика Бутерина.

Максим Долженков

Искусственный интеллект

Anthropic против Пентагона: почему разработчик ИИ отказался снимать ограничения с Claude

ИИ Claude, Пентагон и Defense Production Act: чем закончится конфликт Anthropic с военными.

U-Gen

Дроны

ИИ уже разгоняет не только технологии, но и инфляцию: почему память DRAM и NAND влияет на смартфоны

Как дефицит памяти влияет на инфляцию и на электронные устройства…

U-Gen

Искусственный интеллект

Шампуни будущего: персонализация и даже сезонность

Подходы к гигиене и экологии при изготовлении и применении этого массового продукта очень сильно изменятся и станут более "природными"

Юрий Пономаренко

Биотехнологии

Мега-сделка по слиянию SpaceX и xAI: что будет с 8300 биткоинами Илона Маска перед IPO

Илон Маск готовится к слиянию SpaceX и xAI. Что будет с биткоинами SpaceX на балансе.

U-Gen

Искусственный интеллект

Активисты требуют от Riot Platforms переходить от майнинга BTC к ИИ и HPC

От майнинга -- к искусственному интеллекту. Riot Platforms и HPC.

Максим Долженков

Искусственный интеллект