Вы не улавливаете одну простую истину - хороших оффлайн распознавалок не существует.
Хороших онлайновых бесплатных - тоже.
А гугловский API, к вашему сведению, не свободный, а уже платный, и за немаленькие деньги.
Отсюда получаем, что качественное и бесплатное распознавание возможно только на андроиде, на ios, и на умных колонках.
Умные колонки и ios можно завязать на общий универсальный сервер (которого пока не существует, но есть реализации отдельные), а вот для андроида пока нет такой возможности (нет стандартного API для связи с сервером у родного google now).
Так вот, я как раз и хочу писать общий сервер. А мое приложение под андроид с этой идеей не расходится, оно как раз является недостающим звеном для андроида, и в будущем перестанет самостоятельно связываться с контроллерами, а будет делать это через мой сервер.
Отсюда мы получим много клиентов с микрофонами и простой логикой, и сервер который их всех объединяет, но получает лишь текстовые команды, а не звуковой поток.
Это не просто мои мысли, это реально и достаточно легко сделать. Это даже не что-то новое, это просто нужно замиксовать кучу готового, давно написанного кода, в виде различных API. Все уже давно разработано и изучено, но к жизни все еще никто не применил.