Хотите запустить мощную нейросеть прямо на смартфоне — без интернета, облака и передачи данных? В этом гайде: выбор версии Gemma 4 (e2b/e4b), установка через Off Grid за 5 минут и настройки для стабильной работы. Для владельцев Xiaomi и Redmi важно также проверить разрешения приложений перед запуском тяжёлых процессов. Всё локально, приватно и бесплатно. Честно — это проще, чем кажется.
Оглавление:
Требования и выбор версии: e2b или e4b?
Сначала — про железо. Запуск больших языковых моделей на телефоне требует ресурсов. И да, ваш старый аппарат может не потянуть. Однако это не повод расстраиваться: есть варианты.
Gemma 4 системные требования выглядят так:
| Параметр | Версия e2b (лёгкая) | Версия e4b (качественная) |
|---|---|---|
| ОЗУ | от 6 ГБ | от 12 ГБ |
| Память под модель | ~3,5 ГБ | ~7 ГБ |
| Процессор | Snapdragon 8 Gen 2, Dimensity 8200 | Snapdragon 8 Gen 3/4, Tensor G5 |
| Скорость генерации | 8–15 токенов/сек | 4–9 токенов/сек |
| Для каких задач | Короткие ответы, заметки | Сложные рассуждения, код |
Если коротко: e2b — для повседневных задач, e4b — когда нужно качество. Я, кстати, начинал с e2b на Xiaomi 11T — работало, но с паузами, ответ нейросеть давала за полторы-две минуты. Если вы будете использовать современный телефон, ответ будет получен гораздо быстрее.
💡 Совет: Не гонитесь за самой тяжёлой версией. Лучше стабильные 10 токенов в секунду, чем вылеты каждые две минуты.
Подготовка смартфона: что сделать до установки
Перед тем как установить модель, подготовьте систему. Локальный инференс — это нагрузка, и ОС может мешать.
- Закройте фоновые приложения.
- Отключите «Оптимизацию батареи» для клиента офлайн-ИИ.
- Установите последнюю версию стабильной прошивки.
- Освободите 8–10 ГБ места: модели весят немало.
Кстати, про место. Я однажды забыл проверить свободное пространство — загрузка прервалась на 90%. Пришлось начинать заново. Не повторяйте.
Однако подготовка — это не только технические шаги. Подумайте, для чего вам нужен локальный ИИ. Если для черновиков и заметок — хватит лёгкой версии. Если для работы с кодом или анализа документов — берите e4b и готовьтесь ждать.
Установка по шагам: как запустить Gemma 4 на Android
- Страница приложения „Off Grid — Private AI Chat“ (Wednesday Solutions) в Google Play — запуск ИИ без облачных сервисов
- Выбор ИИ-модели для локального использования: Gemma 4 и Qwen 3.5 с детализацией параметров и требований к памяти
- Стартовый экран Off Grid — Private AI Chat: подготовка к работе с локальными ИИ-моделями (текстовые и визуальные задачи)
- Настройка текстовой модели в Off Grid — Private AI Chat: модель gemma-4-E2B-it-GGUF готова к использованию (с учётом ограничений по ОЗУ)
- Настройка и запуск чатов в Off Grid — Private AI Chat: выбранная модель gemma-4-E2B-it-G… и готовность к общению
- Пример работы распознавания образов Gemma 4 e2b
- Как сделать скриншот на Xiaomi – пример работы Gemma 4 e2b
Процесс простой. Без root, без сложных манипуляций.
- Скачайте приложение Off Grid для запуска нейросети из надёжного источника.
- Откройте раздел «Models» и выберите
gemma-4-e4b-Q4_K_M.gguf(или e2b, если у вас не флагман). - Нажмите «Download». Файлы сохранятся в
/Android/data/off.grid/models/. - В настройках инференса укажите потоки: 6–8 для современных чипов.
- Запустите тестовый диалог.
Всё. Если модель загрузилась и ответила — вы молодец.
Если скачиваете модели через сторонние источники, проверяйте хеш-суммы файлов — это защитит от повреждённых загрузок.
Особенности для владельцев Xiaomi и Redmi
HyperOS и MIUI любят «убивать» фоновые процессы. Это проблема для локального ИИ. Разумная оптимизация MIUI помогает сохранить баланс между автономностью и производительностью.
Что сделать:
- Закрепите приложение Off Grid в памяти.
- Опционально возможно разрешить «Автозапуск».
- Если программа работает нормально, то больше ничего делать не нужно. Если же она периодически вылетает, попробуйте отключить для Off Grid оптимизацию энергопотребления: Настройки – Приложения – Все приложения – Off Grid – Батарея – Нет ограничений.
Кстати, на Xiaomi 11T я потратил вечер, чтобы разобраться с этим. Потом написал чек-лист — теперь делюсь.
Если что-то пошло не так: частые ошибки
Бывает, что модель не запускается. Или вылетает. Это нормально.
Типичные проблемы:
- Вылет при загрузке весов — проверьте, хватает ли ОЗУ. Или файл повреждён — скачайте заново.
- Ошибки токенизации — обновите клиент до актуальной версии.
- Не сохраняется история — дайте приложению доступ к хранилищу.
Однако не все ошибки решаются настройками. Иногда проще выбрать более лёгкую версию модели.
Вопросы и ответы
Нужен ли интернет после установки?
Нет. После загрузки весов все вычисления идут локально. Интернет нужен только для скачивания модели и обновлений.
Какая версия лучше: e2b или e4b?
Зависит от задач. e2b быстрее и экономнее, e4b — точнее. Если не уверены — начните с e2b, потом попробуете перейти.
Почему модель работает медленно?
Возможно, включён режим энергосбережения, мало свободной памяти или выбран не тот бэкенд. Проверьте настройки Off Grid.
Можно ли запускать несколько моделей сразу?
Технически — да, но это сильно грузит память. Лучше одна модель за раз, особенно на смартфонах с 8–12 ГБ ОЗУ.
Безопасно ли хранить диалоги локально?
Да, данные не покидают устройство. Однако рекомендуем шифровать хранилище и чистить кэш время от времени.
Что делать, если приложение вылетает?
Перезагрузите телефон, освободите память, попробуйте более лёгкую версию модели (Q4 → Q3) или обновите клиент.
Альтернативы: почему локальный запуск, а не облако?
Облачные сервисы удобнее: не грузят телефон, работают на любом устройстве. Однако у них есть минусы: зависимость от сети, подписки, передача данных.
Локальный запуск выигрывает, если:
- Вам важна приватность.
- Нет стабильного интернета.
- Хотите полный контроль над моделью.
Облако лучше, если:
- Нужна максимальная скорость.
- Телефон слабый.
- Не хотите разбираться с настройками.
Чтобы было нагляднее, вот быстрое сравнение:
| Критерий | Локальный (Off Grid) | Облачный сервис |
|---|---|---|
| Приватность | ✅ Данные на устройстве | ⚠️ Передача на сервер |
| Скорость ответа | ⚠️ Зависит от железа | ✅ Мгновенная |
| Интернет | ❌ Не нужен после установки | ✅ Обязателен |
| Стоимость | 💰 Бесплатно | 💳 Часто по подписке |
Честно: я использую оба варианта. Локально — для черновиков и личных заметок. В облаке — когда нужен быстрый ответ по сложному запросу.
Готовы попробовать? Проверьте совместимость вашего устройства с таблицей выше, скачайте Off Grid и запустите тестовый диалог. Если что-то не получится — вернитесь к разделу с ошибками. Или напишите в комментариях, поможем.






