Jeżeli miałbyś dostęp do Internetu, to istnieje opcja wykorzystania porządnych bibliotek od Google, a mianowicie cloud speech api. Traktujesz to jako czarną skrzynkę, do której wrzucasz dźwięk a zwracany jest wypowiedziany text. Wiadomo, że biblioteka działa lepiej dla języka angielskiego a nie polskiego. Haczyk jest taki, że bez połączenia z Internetem z niej nie skorzystasz.
Osobiście nie miałem z tym większej styczności. Miałem okazje natomiast oglądać projekt robota, który był sterowany (w bardzo prosty sposób) głosem. Telefon z Android OS wykorzystywał tą bibliotekę i reagował na proste komendy: "jedź", "przód", "tył", itp, a następnie wysyłał odpowiednie komunikaty do robota stosując Bluetooth. Działanie było oczywiście obarczone pewnym (<1s) opóźnieniem.