Autor Téma: Proram na rozpoznání hlasu/zvuku  (Přečteno 1012 krát)

Offline vangog

  • Hrdina
  • ****
  • Příspěvků: 422
  • Karma: 0
    • Verze Delphi: 7
Proram na rozpoznání hlasu/zvuku
« kdy: 05-09-2018, 12:07:21 »
Existuje nějaký program (ve zdrojích pro delphi pokud možno), který by uměl rozpoznat hlas? Myšleno, tak aby to obsahovalo nahrávání a uložení nahrávky (i když toto není až tak nutné - spíš možná nějaké řešení, kde součástí programu je schopnost ukládat nahrávky slov do vlastní databáze, kterou si ten program vytvoří). Nahraju například zásobu slovíček "ahoj", "jak", "se", "máte" slovičkám přiřadím textovou hodnotu (význam) a uložím do databáze. Pak když řeknu "Ahoj jak se máte" by program dokázal rozpoznat můj hlas a jednotlivá slovíčka, která jsem řekl.

Využití bych viděl takové, že bych vytvořil program ve kterém si uživatel nahraje slovíčka (tj. výslovnost slovíček), jak je vyslovuje on a potom může dělat testy z těchto slovíček tak, že si pustí slovíčko buďto v rodném jazyce nebo v cizím jazyce (to se přehraje) a on na to bude muset odpovědět. Tedy jestli slovíčko přečte či vysloví správně, vyhodnotím to jako správnou odpověď.

Mě jde tedy hlavně o tu rozpoznávací část, kde by program mohl i určit jak velká shoda zvuku je. Třeba by rozdílné rychlosti řeči by klesla pravděpodobnost shody, ale stále by bylo možné vyhodnotit na 60-70% shodu.

Offline Radek Červinka

  • Administrátoři
  • Padawan
  • *****
  • Příspěvků: 3449
  • Karma: 112
    • Verze Delphi: D2007, DXE + 2 poslední
    • O Delphi v češtině
Re:Proram na rozpoznání hlasu/zvuku
« Odpověď #1 kdy: 05-09-2018, 12:38:30 »
Zkus hledat na google "delphi speech api", coz je asi nejblize tomu co potrebujes
Embarcadero MVP - Czech republic

101401

  • Host
Re:Proram na rozpoznání hlasu/zvuku
« Odpověď #2 kdy: 05-09-2018, 15:00:56 »
Mohl bys vyuzit MS SAPI (speech API). Pro Tvuj pripad bys mohl vytvorit uzivatelsky lexicon. Hodnotu "shody vyhodnoceni" pak muzes vycist z ISpRecoResult, z vlastnosti SREngineConfidence fraze SPPHRASE ziskane pres ISpRecoResult::ISpPhrase. Nezkousel jsem a kod nemam ;)

Systemove rozpoznavani hlasu udajne uroven shody neposkytuji (stejne tak nevim zda se tato hodnota kdy objevi s vlastnim lexikonem). Muzu zkusit, ale radeji pockam na rozhodnuti o vyuziti.
« Poslední změna: 05-09-2018, 15:05:35 od 101401 »

Offline vangog

  • Hrdina
  • ****
  • Příspěvků: 422
  • Karma: 0
    • Verze Delphi: 7
Re:Proram na rozpoznání hlasu/zvuku
« Odpověď #3 kdy: 05-09-2018, 23:02:15 »
Je fajn vědět, že něco takového existuje  :)  A to SAPI 5.4 by jelo i na XP nebo až v novějších systémech? Zatím se zajímám jen teoreticky, než bych se k tomu dostal by uplynulo ještě hodně času.

Díky za odkazy.

101414

  • Host
Re:Proram na rozpoznání hlasu/zvuku
« Odpověď #4 kdy: 06-09-2018, 00:27:13 »
Je fajn vědět, že něco takového existuje  :)  A to SAPI 5.4 by jelo i na XP nebo až v novějších systémech? Zatím se zajímám jen teoreticky, než bych se k tomu dostal by uplynulo ještě hodně času.

Díky za odkazy.

Neni zac, bohuzel ohledne XP nevim. Asi ne. Windows XP is dead! ;) Ale bylo i starsi SAPI, mozna zkusit prozkoumat i tuto verzi...
« Poslední změna: 06-09-2018, 00:28:52 od 101414 »