Ещё несколько лет назад идея запускать нейросеть на микроконтроллере воспринималась как эксперимент. В 2025 году Embedded AI и tinyML стали рабочим инструментом инженера, таким же привычным, как RTOS или SPI. Причина проста: Edge AI позволяет устройствам принимать решения локально, быстро и автономно — без облака и постоянного подключения к сети.
Сегодня в микроконтроллерах всё чаще появляются NPU, DSP и SIMD-блоки, а фреймворки для tinyML стали достаточно зрелыми, чтобы использовать их в серийных продуктах. Разберёмся, как внедрять Embedded AI без компромиссов по стабильности, энергии и real-time.
Что такое Embedded AI и tinyML на практике
Embedded AI — это выполнение инференса нейросети непосредственно на устройстве: микроконтроллере, SoC или edge-модуле.
TinyML — подмножество Embedded AI, ориентированное на сверхограниченные платформы:
-
десятки–сотни килобайт RAM,
-
мегабайты Flash,
-
жёсткие требования по энергопотреблению.
Типичные задачи:
-
распознавание аудиособытий (wake word, шумы, утечки);
-
детекция аномалий по вибрациям и токам;
-
простое компьютерное зрение (presence, counting, classification).
Платформы: Cortex-M и не только
В 2025 году Embedded AI активно используется на:
-
ARM Cortex-M4 / M7 / M33 — основа большинства tinyML-проектов;
-
Cortex-M55 + Ethos-U — аппаратное ускорение ML;
-
ESP32-S3 (векторные инструкции);
-
RISC-V MCU с DSP-расширениями.
Ключевое правило: нейросеть всегда подбирается под железо, а не наоборот.
Оптимизация — сердце Embedded AI
Без оптимизации нейросеть на микроконтроллере не живёт. Основные техники в реальных проектах:
Квантование (INT8)
Переход от float32 к int8:
-
уменьшение размера модели в 4 раза;
-
ускорение инференса;
-
снижение энергопотребления.
В большинстве задач точность падает менее чем на 1–2%.
Pruning и архитектурные ограничения
-
уменьшение числа фильтров;
-
отказ от тяжёлых слоёв;
-
использование depthwise-свёрток.
Модель должна быть плоской и предсказуемой.
Статическое выделение памяти
Dynamic allocation — враг real-time. В tinyML вся память выделяется заранее, без malloc во время инференса.
Реальные сценарии применения
Vision
-
детекция присутствия;
-
классификация объектов низкого разрешения;
-
анализ движения.
Обычно используются входы 96×96 или 128×128 grayscale.
Anomaly detection
Один из самых популярных сценариев:
-
анализ вибраций,
-
контроль электродвигателей,
-
предиктивная диагностика.
Часто применяется автоэнкодер или лёгкая CNN.
Audio AI
-
распознавание команд,
-
детекция утечек газа или воды,
-
мониторинг промышленного шума.
Работа идёт не с «сырым» аудио, а со спектрограммами (MFCC).
Инструменты: что выбрать в 2025 году
TensorFlow Lite for Microcontrollers
Плюсы:
-
гибкость,
-
поддержка большинства MCU,
-
контроль над кодом.
Минусы:
-
высокий порог входа,
-
много ручной оптимизации.
Edge Impulse
Плюсы:
-
быстрый старт,
-
удобный pipeline данных,
-
автоматическая оптимизация.
Минусы:
-
меньше контроля,
-
зависимость от платформы.
CMSIS-NN
Плюсы:
-
максимальная производительность на ARM;
-
детерминизм и real-time.
Минусы:
-
низкоуровневая работа,
-
подходит опытным инженерам.