Menu Zavřít

Microsoft dosáhl milníku. Hlas rozpozná stejně dobře jako člověk

21. 8. 2017
Autor: Cortana

Výzkumný tým Microsoftu vylepšil svou neuronovou síť určenou pro rozpoznávání a přepis mluveného slova do textové podoby. Už loni dosáhl míry chybovosti jen 5,9 procenta, což podle výzkumu odpovídá i lidským zapisovatelům. Pokud by ale zapisovatelů na stejném vzorku pracovalo více, chybovost by klesla na 5,1 procenta. A stejný milník teď po úpravě algoritmů pokořil i software Microsoftu.

Měření proběhlo dle metodiky Switchboard založené na vzorku 2400 telefonických záznamů s více než 500 lidmi. Switchboard se pro testování úspěšnosti rozpoznávání používá již přes 20 let. IBM ji už zpochybňuje a samo používá náročnější korpus CallHome. V něm lidští zapisovatelé dosahují chybovosti v průměru 6,8 procenta, software pak 10,3 procenta.

  • Našli jste v článku chybu?

Byl pro vás článek přínosný?

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).