Technologie rozpoznávání řeči je stejně jako jiné složité mechanizmy v Googlu postavená na neuronových sítích, které váš hlas pečlivě analyzují a s pomocí složitého statistického modelu nahranému zvuku rozděleného do několikamilisekundových sekvencí přidělují nejpravděpodobnější slova, která asi právě vyslovujete.
Nyní se výzkumníci z hlasového týmu na blogu Google Research pochlubili, že technologii rozpoznávání opět vylepšili, takže by si měla poradit a hlas korektně rozpoznat i ve ztížených podmínkách – například na hlučnější ulici, kde je vedle vlastního hlasu příliš mnoho rušivého šumu. Celý převod by měl být také rychlejší.
Článek vyšel na serveru Živě.cz