int(1885)
array(0) {
}

Google представила DiffusionGemma: ИИ-модель, быстрый локальный ИИ для текста, кода и разработчиков

Fgjhjpg

Google выпустила новую открытую ИИ-модель DiffusionGemma, которая может заметно изменить подход к генерации текста. Если большинство современных языковых моделей работают как печатная машинка — последовательно создают ответ токен за токеном, — то DiffusionGemma использует другой принцип. Она генерирует сразу целые блоки текста, постепенно уточняя результат, примерно так же, как диффузионные нейросети создают изображения из шума. DiffusionGemma способна достигать скорости более 1000 токенов в секунду на NVIDIA H100. В официальном блоге Google также говорится о 700+ токенах в секунду на NVIDIA GeForce RTX 5090 и о приросте скорости до четырех раз по сравнению с обычными авторегрессионными моделями. Это делает новинку особенно интересной для разработчиков, которым важна не только точность, но и минимальная задержка: автодополнение кода, быстрые редакторы текста, локальные ИИ-ассистенты и интерактивные инструменты.

Главная особенность DiffusionGemma — text diffusion, или текстовая диффузия. В обычных LLM каждое следующее слово зависит от предыдущего. Модель как бы идет слева направо и не может заранее «видеть» весь будущий ответ. DiffusionGemma работает иначе: она создает «черновой холст» из случайных токенов, а затем несколькими проходами исправляет и уточняет весь блок. Google описывает это как переход от последовательной печатной машинки к «печатному прессу», который обрабатывает сразу большой фрагмент текста.

Читайте также
Apnopenojpg Читайте также

Tether разрабатывает децентрализованный поисковик Hypersearch

Технически модель построена на архитектуре Gemma 4 26B A4B Mixture-of-Experts. Это означает, что всего в модели 26 млрд параметров, но при инференсе активируется только часть — около 3,8 млрд. Благодаря этому DiffusionGemma может быть пригодна для запуска на мощных потребительских GPU после квантования. Модель доступна на Hugging Face, распространяется под лицензией Apache 2.0 и поддерживает мультимодальные входные данные: текст, изображения и видео, хотя на выходе генерирует текст. Однако это не «убийца» обычных языковых моделей. Google прямо отмечает: DiffusionGemma — экспериментальная модель, созданная прежде всего ради скорости. По качеству универсальных ответов она уступает стандартным Gemma 4. Поэтому для задач, где важны максимально точные, длинные и аккуратные ответы, классические авторегрессионные модели пока остаются предпочтительным выбором.

Зато у DiffusionGemma есть сильная сторона: она лучше подходит для задач, где начало ответа зависит от конца. Например, для заполнения пропусков в коде, структурированной генерации, сложной разметки, математических зависимостей или биологических последовательностей. В демонстрации Google модель после дообучения смогла решать Sudoku с точностью около 80%, тогда как базовая версия почти не справлялась. Пока главный минус — практический запуск. Модель еще не так просто использовать на обычных пользовательских системах: часть инструментов и оптимизаций только догоняет релиз. Google, в свою очередь, указывает поддержку vLLM, Hugging Face Transformers, SGLang, MLX, NVIDIA NIM и Google Cloud Model Garden.

Знания События Новости Курсы валют
Автор специализируется в тематике сайта, постоянно отслеживает её по влиятельным русскоязычным и ведущим интернациональным ресурсам. Его высокая квалификация подтверждается руководством FUTUREBY.INFO