Bár a számítógépek manapság már a telefonjainkba is beköltöztek, sokan még mindig nem tudnak arról, hány területen használhatjuk már saját hangunkat is a velük való kommunikációban.
Az informatika általánossá válása közben egyvalami szinte mindenhol ugyanolyan maradt a kezdetek óta, méghozzá a szövegek bevitele. Billentyűzeten pötyögjük be a szavakat, és a képernyőn keresgélve kattintgatjuk le vagy írjuk le a parancsokat. Bár az még mindig messze van, hogy kedélyesen elbeszélgessünk saját házi robotunkkal, de már manapság is több helyen használjuk a digitális beszédfelismerés valamilyen formáját, csak épp nem tudunk róla.


Egy biztos: ne így kezdjünk hozzá...

Alapszintű nyelvtudás Az automatikus beszédfelismerés (Advanced Speech Recognition, ASR) több szinten létező tudomány. A legfelsőbb szint természetesen az lenne, ha egy számítógép azonnal megismerné és megértené minden szavunkat, ezért diktálhatnánk ugyanúgy, mintha a titkárnőnknek mondanánk valamilyen folyó szöveget. Ehelyett a manapság létező diktálóprogramokba még mindig kissé körülményesen, speciális módon kell "belepréselni" a mondanivalónkat, valahogy így:

"Ehelyett a manapság létező diktálóprogramokba még mindig kissé körülményesen VESSZŐ speciális módon kell IDÉZŐJEL belepréselni IDÉZŐJEL a mondanivalónkat VESSZŐ valahogy így KETTŐSPONT SORTÖRÉS."

Látható, hogy, bár vannak már kifejezetten diktálásra kifejlesztett szoftverek, ezek használatához még mindig alapos betanulás szükséges. Ez ráadásul nem csak a felhasználót érinti, hanem magát a szoftvert is: hosszú hangmintavételezési procedúra során kell előre megadott szavakat, mondatokat beolvasnunk, hogy a gép megjegyezze saját hangkarakterünket, beszédmodorunkat.

Félszavakból is A beszédfelismerés sokkal jobban működik olyan környezetekben, ahol nem egy teljes nyelvi szókészletet kell felismernie és értelmeznie a gépnek. Jó példa ezekre a főként angol nyelvterületen használt üzenetrögzítők illetve telefonos "útválasztók" új generációja. Itt már nem a telefon billentyűzetének megnyomásával kell opciókat választani, hanem a gép által felkínált lehetőségek valamelyikét szóban kell bemondanunk. Ilyenkor jóval kevesebb a válaszadási lehetőség (gyakran a yes / no lehetőségekre korlátozódik), ezért a válaszok detektálása sokkal egyszerűbb.

Az ASR egyik legfrissebb felhasználási területei az okostelefonok hang alapú keresési és vezérlési szolgáltatásai. Az iPhone-okon is elérhető ilyen megoldás, ám a szakértők szerint az Android még nagyobb lehetőség előtt áll a Google hatalmas szöveges keresési adatbázisának köszönhetően.

A képre kattintva az infografika eredeti méretben, új ablakban nyílik meg


Forrás: Medicaltranscription, Mashable

Támadás az okostelefonok ellen [infografika]
Jövőkép: mi az a "dolgok internete?" [infografika]
Az email rövid története - grafikus kronológia

Jobb lesz attól a Claude, hogy kódjának 80 százalékát a Claude írja?

Igen, jobb lesz, hatékonyabb lesz – ám ez nem lesz ingyen. Az IT-irányítás, a biztonság, a megfelelés és a csapatkohézió is megszenvedheti.
 
Hirdetés

Szintet lép a Synology: Érkezik a PAS7700 csúcskategóriás vállalati flash tároló

Ahogy a vállalati IT-környezetek az AI-alapú folyamatok, a virtualizáció, a nagy teljesítményű adatbázisok és a folyamatosan elérhető digitális szolgáltatások nyomása alatt fejlődnek, a szervezetek egyre inkább olyan tárolóinfrastruktúrát igényelnek, amely kompromisszumok nélküli teljesítményt, rugalmasságot és skálázhatóságot biztosít.

Önmagukban a sikeres pilotprojektek nem kövezik ki a hosszútávon is jól működő AIaaS- és RPAaaS-használat útját. A szemléletváltáson kívül akad még pár dolog, amit figyelembe kell venni.
Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Ön sem informatikus, de munkája során az információtechnológia is gyakran befolyásolja döntéseit? Ön is informatikus, de pénzügyi és gazdasági szempontból kell igazolnia a projektek hasznosságát? Mi közérthető módon, üzleti szemmel dolgozzuk fel az infokommunikációs híreket, trendeket, megoldásokat. A Bitport tizennegyedik éve közvetít sikeresen az informatikai piac és a technológiát hasznosító döntéshozók között.
© 2010-2026 Bitport.hu Média Kft. Minden jog fenntartva.