Balso atpažinimo moduliai: darbo tvarka ir programos

Išbandykite Mūsų Instrumentą, Kaip Pašalinti Problemas





Pažangios technologijos sukūrė pažangią žmogaus ir mašinos sąsajos techniką, kuri palengvina kompiuterių, mašinų ar robotų valdymą naudojant žmogaus balso komandas nenaudojant jokių įvesties sistemų, tokių kaip klaviatūros ar pelė. Šią žmogaus ir mašinos sąsają (HMI) galima pasiekti naudojant balso atpažinimas moduliai. Šiame straipsnyje aptarsime balso atpažinimo modulius, jų darbo tvarką ir programas.

Balso modulis

Balso modulis



Balso atpažinimo modulis

Balso atpažinimas yra technika, palengvinanti natūralų ir patogų žmogaus ir mašinos sąsaja naudojant balso atpažinimo modulį. Jis ištraukia ir analizuoja žmogaus, pristatomo į mašiną ar kompiuterį per mikrofoną, balso ypatybes. Balso atpažinimo technika skirstoma į daugelį tipų, remiantis skirtingais kriterijais, tokiais kaip vartotojų aprėptis, keli atpažinti naudojami žodžiai, kalbėjimo natūralumas. Jei balso atpažinimo lygis yra didesnis nei 95%, praktiškai naudojamas tik balso atpažinimas.


Balso atpažinimo modulio darbo principas

HM2007 yra vienos mikroschemos CMOS balso atpažinimo modulis. Tai mikroschemoje esanti didelio masto integruota grandinė su balso analizės, kalbos atpažinimo ir balso atpažinimo sistemos valdymo procesais. „HM2007“ galima valdyti dviem režimais: rankiniu režimu ir procesoriaus valdymo režimu.



HM2007

HM2007 kaiščių schema

Rankiniu režimu balso atpažinimo modulis HM2007 naudojamas sukurti paprastą atpažinimo sistemą, prijungiant komponentus, tokius kaip klaviatūra, 8Kbyte atminties SRAM ir kitus komponentus. Jei maitinimas įjungtas, HM2007 pradeda inicializavimo procesą ir, jei WAIT kaištis yra L, tada HM2007 patikrina išorinę atmintį: 8Kbyte SRAM - ar ji tobula, ar ne. Bet jei WAIT yra H, tada atminties tikrinimo procesą praleis HM2007. Po šio inicijavimo proceso HM2007 pereina į atpažinimo režimą. Atpažinimo režimu, jei WAIT kaištis yra H, HM2007 yra pasirengęs priimti balsą ir pradeda atpažinimo procesą. Jei WAIT kaištis yra L, tada HM2007 nepriima balso, kurį reikia atpažinti. Tuomet naujų modelių mokymas išvalius apmokytus modelius yra dvi operacijos, atliekamos naudojant funkcinius mygtukus: TRN ir CLR. Visus „HM2007“ modelius galima išvalyti įvedus skaičių klavišą 99 ir paspaudus CLR.

Veikiant procesoriaus valdymo režimui, šiame režime yra numatytos kelios balso atpažinimo modulio HM2007 funkcijos, tokios kaip RECOG, TRAIN, RESULT, UPLOAD, DOWNLOAD, RESET. Panašiai kaip rankiniu režimu, šiame režime taip pat įjungimo, atpažinimo, mokymo, rezultato, įkėlimo, atsisiuntimo ir atstatymo operacijos atliekamos remiantis skirtingais kriterijais.

Balso atpažinimo modulio programos

Balsu valdoma robotizuota transporto priemonė

Balsu valdomų robotizuotų transporto priemonių projekto rinkinys

Balsu valdomų robotizuotų transporto priemonių projekto rinkinys

Balsu valdoma robotizuota transporto priemonė su tolimojo kalbos atpažinimo sistema yra suprojektuota valdyti naudojant nuotolinę robotinės transporto priemonės valdymą naudojant žmogaus ir mašinos sąsają ir balso komandas. An 8051 mikrovaldiklis yra naudojamas kartu su balso atpažinimo moduliu arba kalbos atpažinimo moduliu norimai operacijai pasiekti. Roboto transporto priemonės judėjimo kryptį galima valdyti naudojant balso komandas ar mygtukus. Balso komandas RF siunčia nuo perdavimo galo link priimančiojo galo. Taigi robotinė transporto priemonė juda pirmyn, atgal, kairėn arba dešinėn, remdamasi imtuvo gautomis komandomis.


Balsu valdomos robotizuotos transporto priemonės siųstuvo blokinė schema

Balsu valdomos robotizuotos transporto priemonės siųstuvo blokinė schema

Šis judėjimas robotinė transporto priemonė tam tikra kryptimi galima valdyti dviem varikliais, kurie yra susieti su 8051 serijos mikrovaldikliu. RF siųstuvas konvertuoja komandas perjungimo paspaudimu arba balso komandomis, kurios paverčiamos koduotais skaitmeniniais duomenimis, kad būtų pasiektas priimtinas atstumas (iki 200 metrų) nuo robotizuotos transporto priemonės. Užkoduoti duomenys, gaunami imtuvo grandinėje, yra dekoduojami siuntimui į kitą mikrovaldiklį nuolatinės srovės varikliams valdyti, naudojant variklio tvarkyklę IC, skirtą valdyti variklių kryptį ir judėjimą naudojant dekoduotus balso komandų duomenis.

Balsu valdomos robotizuotos transporto priemonės imtuvo blokinė schema

Balsu valdomos robotizuotos transporto priemonės imtuvo blokinė schema

Ši balsu valdoma robotinė transporto priemonė su tolimojo kalbos atpažinimo projektais gali būti integruota su a DTMF technologija tai palengvina robotinės transporto priemonės valdymą naudojant mobilųjį telefoną. Ši DTMF technologija užtikrina labai tolimą ryšį, palyginti su RF technologija - taigi robotizuotas transporto priemones galima valdyti nuotoliniu būdu iš labai didelio atstumo.

Balso įrašymo ir atkūrimo grandinė

APR 9301 IC

APR 9301 IC

APR 9301 IC

APR 9301 IC sudaro 28 kontaktai ir nepastovi „flash“ atmintis. Tai palengvina 100K ciklų įrašymą ir atminties saugojimą maždaug 100 metų. Normaliam APR 9301 integrinės grandinės darbui reikalinga tik žemos įtampos 5 V ir 25 mA srovė.

Balso įrašymo ir atkūrimo grandinės veikimas

Atlieka APR 9301 IC balso įrašymas ir atkūrimas operacijos. Įrašymo operaciją galima atlikti priimant balso signalus naudojant geros kokybės (bet kokios rūšies) kondensatoriaus mikrofoną, prijungtą prie integruoto grandyno 17 ir 18 kontaktų. Jei uždarysime jungiklį S1, bus galima paleisti įrašymo režimą, kad būtų galima lengvai įrašyti balso pranešimą 20–30 sekundžių. Įrašymo indikatorius, prijungtas prie APR 9301 IC 25 kaiščio, mirksi tol, kol L kaištis 27 yra įžemintas.

Balso įrašymo ir atkūrimo grandinė

Balso įrašymo ir atkūrimo grandinė

Baigus 20 ciklų su paskutine atmintimi, įrašymo procesas automatiškai baigiasi pakeitus rezistoriaus R1, prijungto prie APR 9301 IC 6 ir 7 kaiščių, vertę. Maksimalią 20 sekundžių, 24 sekundžių ir 30 sekundžių trukmės įrašymo trukmę galima gauti pakeitus rezistoriaus R1 reikšmes atitinkamai kaip 52K, 67K ir 89K.

Atkūrimo režimu įvesties skyrius automatiškai nutildomas. Jei jungiklis S2 yra uždarytas, garsiakalbis gaus pranešimą nuo įrašytų pranešimų pradžios. Jei įrašymo ar atkūrimo funkcijos bus baigtos, APR 9301 IC įsijungs laukimo režimu.

Šią grandinę galima kaupti bendroje PCB. Kruopščiai lituokite APR 9301 IC pagrindą taip, kad tarp integruoto grandinės kaiščių neturėtų atsirasti trumpalaikis ryšys. Surinkę ant PCB, patikrinkite grandinę, tada prijunkite IC prie IC pagrindo. Prieš maitindami grandinę, atidžiai patikrinkite kaiščių jungtis. 5 voltų reguliatorius IC pagrįstas maitinimo šaltinis naudojamas maitinti grandinę. Norint gauti aiškų garsą, naudojamas 2 colių 8 omų geros kokybės garsiakalbis. Įrašyti galima paspaudus jungiklį S1. Garso signalus (kalbą ar muziką) paima mikrofonas ir jie perduodami IC, kur balso signalai yra saugomi atminties ląstelėse. Jei uždarysime jungiklį S2, prasidės atkūrimas ir per garsiakalbį galėsime išgirsti įrašytą pranešimą.

Balso atpažinimo modulis gali būti naudojamas daugelyje programų, pavyzdžiui, valdant orlaivio sistemas naudojant pilotų balso komandas, valdant motorizuotą ratinį automobilį naudojant balso įjungiamą daugiaprocesorių ir pan. Jei jus domina sužinoti apie elektros ir elektronikos projektai remiantis balso atpažinimo moduliu, tada galite kreiptis į mus, paskelbdami savo komentarus žemiau esančiame komentarų skyriuje.

Nuotraukų kreditai: