Szóból ért nemcsak az ember, már a gép is (2. rész)

MTI Sajtóadatbank, 2012. május 6. 08:42

A hangfelismerő szoftver úgy működik, hogy a beszédet olyan processzorokhoz továbbítja, amelyek a kimondott szavakat hanghullámokra bontják le, és speciális algoritmusokkal azonosítják a hangokból összeállítható legvalószínűbb szót. A rendszer rögzíti és tárolja a beszédet, úgyhogy képes tanítani magát, hogy az idő múlásával egyre pontosabbá váljon.

A Nuance által adott biztosítékok ellenére a hangfelismerő szoftver elegendő kockázatot jelent az emberek magánszférájára számára ahhoz, hogy a használatának szabályozásáért felelősök odafigyeljenek rá. "Ahogy az arcfelismerés alkalmazási lehetőségei miatt aggódunk, úgy más biometrikus azonosításokról, köztük a hangfelismerésről is az a véleményünk, hogy problémákat vet fel" - szögezte le David C. Vladeck, a Szövetségi Kereskedelmi Hivatal (FTC) Fogyasztóvédelmi Irodájának vezetője általában a hangtechnológiáról, nem kifejezetten a Nuance által alkalmazott megoldásról.
   
A felhasználók gyorsabban jutnak célba
   

    "Dragon Go! - szól bele iPhone-jába Sejnoha. - Három személyre akarok helyet foglalni holnap estére a Craigie-ben, a Mainen."
    A Dragon Go a Nuance saját virtuális asszisztense, az az alkalmazás, amelyet bevezetése óta több milliószor töltöttek le.
     A Siritől eltérően azonban a Dragon Go nem válaszol. Sejnoha azt közölte vele, hogy helyet akar foglalni a massachusettsi Cambridge egyik éttermébe: az alkalmazás azonnal felvette a kapcsolatot az OpenTable-lel, és megjelenítette a lehetőségeket.
    A legegyszerűbb keresések esetén a Dragon Go rendszerint megkerüli a keresőmotorokat, és egyenesen olyan vállalatok internetes oldalára irányítja a felhasználókat, mint a Nuance partnerei, az Emazon, az Expedia és az OpenTable. Ha ott nem találják meg azt, amit keresnek, akkor a Dragon Go felajánlja a hagyományos internetes keresés lehetőségét.
    A felhasználók így kevesebb lépésben, gyorsabban jutnak célhoz. Sok esetben, ha például éttermi helyfoglalásról vagy vásárlásról van szó, a Nuance mérsékelt díjat számít fel a partneroldalaknak. Az alkalmazás kihívást jelent a Google-nak és a Microsoftnak, amelyeknek van saját hangtermékük - a Google Voice Actions és a Microsoft Tellme -, valamint a keresőmotoroknak is.
    Christopher Katsaros, a Google szóvivője nem volt hajlandó nyilatkozni erről a kérdésről. A cég nemrég korszerűsítette az Android telefonoknál használatos hangutasítási rendszert, a Google Voice Actionst: képessé tette arra, hogy az emberi beszédet folyamatosan írott szöveggé alakítsa át, és ezzel gyorsabbá és egyszerűbbé vált a szöveges üzenetek diktálása és küldése, a Google hangos keresése vagy útbaigazítások kérése.
    Lezli Goheen, a Microfost szóvivője elmondta, hogy cége a fogyasztók elvárásának megfelelően többféle módon is könnyített az információk megszerzésén. A minden Windows-termékben szereplő Tellme programon kívül, amely lehetővé teszi üzenetek diktálását és alkalmazások hangvezérlését, bevezették a Bing Voice Search programot is a keresések beszéddel történő irányítására.
   
Illúziókeltő, de könnyű a használata

   
    A US Airways törzsutasprogramjának azokat a résztvevőit, akik regisztrálták mobiltelefonjukat, név szerint üdvözli a Wally, a Nuance által a légitársaságnak kifejlesztett interaktív hangrendszer.
    A Wallyt tavaly nyáron vezették be annak az átalakításnak a részeként, amelynek során a US Airway telefonos ügyfélszolgálatát külföldről visszatelepítik az Egyesült Államokba. A rendszer képes például megmondani a törzsutasoknak, hogy milyen helyre szól a jegyük, egyszersmind jelenteni, ha magasabb szintre kerültek a programban. Az emberi beszédet írott szöveggé alakítja át, úgyhogy ha egy ügyfél úgy dönt, hogy élő személlyel kíván tovább tárgyalni, az eredeti kérdést nem kell megismételnie.
    A hangrendszer - amelyhez Wally Wingert, a Jay Leno vezette népszerű televíziós showműsor bemondója kölcsönözte a hangját - nemcsak azoknak a számát csökkentette, akik ragaszkodnak az élő munkatárshoz, hanem az ügyfélhívások átlagos hosszát is. Kerry Hester, a légitársaság alelnöke szerint ha nincs a rendszer, több száz új ügyfélszolgálati munkatársat kellett volna felvenniük.
    A Wally - amely nem árulja el, hogy automatizált rendszer - annyira élőnek tűnik, hogy sok ügyfél "Köszönöm"-mel köszön el tőle, mielőtt lerakja a kagylót.
    Ez az anonimitás azonban nem mindenkinek tetszik. Sherry Turkle, az MIT professzora szerint ahogy a hangfelismerő rendszerek kifinomultabbá válnak, megteremtik annak az illúzióját, hogy nem gépekkel, hanem más emberekkel kommunikálunk. Szerinte hosszú távon a rendszerek illúziókeltő volta és könnyű használata miatt háttérbe szorulnak a lassúbb, rendezetlenebb, valódi emberi kapcsolatokat. Ha emlékeztetik a felhasználókat, hogy egy géppel beszélnek, akkor talán jobban tudatosodik bennük, hogy mennyire felszínes a kapcsolat.
    "Kultúránkat érintő döntést kell hoznunk. El kell határoznunk, megmondjuk-e az embereknek, hogy géppel beszélnek vagy sem" - húzta alá a professzor.

Kulcsszavak: tudomány hangfelismerés

E-világ ROVAT TOVÁBBI HÍREI

Lehet egyszerre mobil és otthoni az internet?

A mobiltelefon ma már szinte mindenki zsebében ott lapul, de a mobilozást lehetővé tévő technológia új értelmet ad az eddig vezetékkel elért otthoni internetezésnek is. Még nem szoktunk hozzá teljesen, de érdemes: nemcsak kábelen lehet otthon netezni, hanem mobilinterneten is, méghozzá úgy, hogy teljes értékű otthoni internetszolgáltatáshoz jutunk. Ez nemcsak azokon a helyeken jelent alternatívát, ahol a vezetékes internet nem elérhető, hanem önmagában is jár előnyökkel, főleg, ha 5G-mobilhálózatról van szó.

2024. május 8. 09:55

A Rakuten Viber itthon is bevezeti a hívószám azonosítást Android felhasználói számára

A Rakuten Viber, a privát és biztonságos üzenetküldés és hangalapú kommunikáció globális vezetője bemutatja új hívóazonosító funkcióját, amely nemcsak megvédi a felhasználókat a spamektől, de segítségével a felhasználók maguk dönthetik el, hogy mikor válaszolnak ismeretlen hívásokra. A hívószám-azonosító funkció mostantól Magyarországon is elérhető az Android-felhasználók számára, így ők is élvezhetik az ezzel járó hatékony spam-védelem előnyeit. A hívószám-azonosító funkciónak köszönhetően a Viber-felhasználók egy figyelmeztető üzenetet kapnak a Vibertől, amikor ismeretlen számról érkezik a hívás, amit a rendszer „biztonságosnak” vagy „potenciálisan spamnek” jelöl. 

2024. május 7. 20:30

Három hónapig díjmentesen használhatják az Apple Music alkalmazást az LG okostévék tulajdonosai

Izgalmas újdonságot mutat be okostévéin a zenestreaminget kedvelő felhasználók számára az LG Electronics (LG). A gyártó OLED modelljei és Dolby Atmos funkcióval*  ellátott QNED készülékei az első olyan okostelevíziók, amelyek támogatják az Apple Music Dolby Atmos-szal kiegészített térhatású hangzását (Spatial Audio with Dolby Atmos). A Magyarországon is e héttől elérhető, úttörő technológia lenyűgöző zenei élménnyel, a hangzásminőség új szintjével kecsegteti a hallgatókat.

2024. május 7. 19:26

Új jelölés lesz a fenntarthatóság ismérve

Új minősítési kategóriát hozott létre a Siemens az EcoTech megjelöléssel, amivel az iparban, az energiaelosztásban használatos termékeinek fenntarthatósági jellemzőiről ad átfogó képet. Segítségével a vásárlók könnyen megtalálják a számukra egyszerre előnyös és környezetbarát megoldásokat.

2024. május 7. 17:59

NMHH-kutatás: egyre többen választanak több streamingszolgáltatót

2023-ban is folytatódott a lekérhető filmszolgáltatások (streaming) használatának előretörése Magyarországon. A Nemzeti Média- és Hírközlési Hatóság (NMHH) éves fogyasztói felmérésének legújabb eredményei szerint a tavalyi év végén a 15 év feletti lakosság 41 százaléka nézett rendszeresen mozgóképes tartalmat valamelyik streamingszolgáltatónál.

2024. május 7. 16:24

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Továbbra is Christian Klein az SAP első embere

2024. május 7. 13:17

Magyar siker: Nemzetközi díjat nyert a TIME magazintól a nyelvtanuló-applikáció

2024. május 3. 19:59

Megvannak 2024 legvonzóbb hazai munkaadói

2024. április 29. 11:38

Ingyenes digitális platform segít a tanároknak és diákoknak az érettségire való felkészülésben

2024. április 20. 11:36