Com funcionen les aplicacions de traducció de veu del gat?

Com funcionen les aplicacions de traducció de veu del gat?

Probablement heu vist aplicacions que pretenen traduir el que diu el vostre gat. Però, de debò, poden traduir el miol del vostre gat a l’anglès? La resposta breu és sí, una mica. És difícil a causa de l’únic “llenguatge” de cada gat, però poden apropar-se bastant amb la tecnologia moderna.





Les aplicacions de traducció de gats com MeowTalk utilitzen una forma de reconeixement de veu que posa l’èmfasi en l’aprenentatge automàtic. Mirem més a prop.





Reconeixement de la parla i aprenentatge automàtic

Mary Theresa McLean / Pixabay





El reconeixement de veu funciona gravant veu i convertint l'àudio en un fitxer de dades digitals. Codifica dades com el to i el volum com a punts de dades que l’aplicació pot analitzar i relacionar amb significats. Micròfons DPA explica que aquests punts de dades poden tenir un aspecte molt diferent en funció dels sons de fons i de com es pronuncia una paraula.

De vegades donem per fet el reconeixement de veu, però és una increïble gesta de tecnologia. Sobretot tenint en compte la complexitat de la parla humana. Com El científic explica, cada paraula implica una àmplia gamma de sons o 'fonemes' barrejats entre si. Aconseguir que un ordinador entengui la parla és molt difícil. La nova frontera dels sons del gat serà encara més dura.



Les aplicacions que utilitzen el reconeixement de veu es programen amb un 'vocabulari' de paraules anomenat conjunt de dades. A continuació, l'aplicació fa coincidir el vostre discurs amb l'opció més propera del seu vocabulari de dades.

Quan s’equivoca, el corregiu i desa les dades per a la propera vegada. Això forma part de l’aprenentatge automàtic. És com un programa aprèn a reconèixer la parla fins i tot quan no és idèntic al conjunt de dades amb què va començar.





Relacionat: Què són els algoritmes d'aprenentatge automàtic? Aquí teniu com funcionen

El reconeixement de veu encara té problemes, sobretot amb impediments de parla i accents. Algunes empreses estan millorant l’aprenentatge automàtic per superar aquests problemes. Amb el pas del temps, l’aprenentatge automàtic pot convertir el reconeixement de veu en una eina poderosa.





com executar el diagnòstic de Windows 10

Així funciona el reconeixement de parla per als humans. Però, funciona per als gats?

Reconeixement de la parla vs. Reconeixement de Miau

Ariana Suárez / Unsplash

En primer lloc, hem d’entendre per què la traducció d’un cert tipus de miau com a “tinc gana” és diferent d’analitzar la parla humana. El problema és principalment que la comunicació del gat es basa més en indicacions no verbals com la postura. Un altre problema és l'absència d'un 'llenguatge de gats' universal.

D'acord amb la ASPCA , els gats assilvestrats adults mai es maullen, només a les persones. Altres investigacions de la Societat Humana afegeix que aquests sons 'no es produeixen al buit'. Els hem d’interpretar al costat del llenguatge corporal i altres contextos. En molts casos, aquests senyals silenciosos són l'única diferència entre un miau que significa 'tinc gana' i un que significa 'vull jugar'.

A més, no hi ha dos gats que tinguin el mateix llenguatge. Els gats desenvolupen 'idiomes' personalitzats per als seus propietaris. Aquests es basen en part en la imitació de la veu del propietari i en part en la personalitat del gat. No hi ha dos gats que sonin igual, fins i tot quan transmeten la mateixa necessitat o necessitat. Llavors, com es pot traduir el vocabulari de parla d'una aplicació per a tots ells?

Aprenentatge automàtic flexible per a gats

Sons gratuïts / Unsplash

Tot i que a alguns assistents virtuals els agrada Automàtic intent de comprendre el to i l’emoció, el reconeixement de la parla encara és terrible davant els senyals no verbals. Però això no vol dir que sigui impossible interpretar-los.

millors aplicacions d'edició de vídeo per a iphone

MeowTalk utilitza un tipus d’aprenentatge automàtic més flexible per ajudar a superar aquests problemes.

Descarregar: MeowTalk per Android | iOS (Gratuït)

Meowtalk va ser creat per Javier Sánchez, que també treballava a l'equip Alexa. Va imaginar l’aplicació com un pas cap a colls intel·ligents. Aquests collars traduirien els sons dels gats en parla humana, basant-se en complexes estratègies d’aprenentatge automàtic per ajudar els humans a comprendre i cuidar millor els seus gats.

L’equip de MeowTalk va compensar els problemes d’unicitat creant perfils més específics per a cada gat. A l'aplicació, registreu cada gat per separat. Ciència Noruega informa que els gatets mauen de manera diferent que els gats adults, de manera que l'aplicació també demana l'aniversari del gat. Cada perfil genera una xarxa de dades única per al gat, que incorpora una mica d’aprenentatge profund a l’aprenentatge automàtic.

Relacionat: Aprenentatge profund vs. Aprenentatge automàtic vs. IA: Com van junts?

Per al vocabulari, MeowTalk comença amb 10 perfils de so al seu conjunt de dades. Cadascun té un significat diferent, com ara 'feliç' o 'caçar'. Quan l'aplicació sent un so i s'equivoca, podeu corregir-lo o crear una nova interpretació.

Dades de CATSOUNDS recollides de Akvelon

Correcció indica a l'aplicació que substitueixi el vocabulari base pel nou so.

com silenciar el ventilador de l'ordinador portàtil

Per exemple, podeu indicar a l'aplicació que coincideixi amb 'Caça' amb xips curts en lloc d'un llançament llarg. Aquest tipus de correcció és més útil que afegir diversos sons perquè coincideixin amb un significat de la manera com es fa el reconeixement de veu, que seria com dir-li a l’aplicació que un xup llarg i un xisclet curt tots dos significa 'trucada mare'.

L’aprenentatge automàtic a les aplicacions de reconeixement de veu sol resistir aquest tipus de sobreescriptura. Seria com intentar ensenyar a Siri que quan dius 'bloc tecnològic' realment vols dir 'pera'. Però la forma més flexible d’aprenentatge automàtic que utilitza MeowTalk pot gestionar aquesta correcció amb més facilitat.

La creació d’una nova interpretació afegeix un significat que no estava codificat anteriorment. Per exemple, si el vostre gat té una trucada específica quan vol la seva joguina preferida, podeu afegir 'Vull el meu ratolí' com a opció. És similar a afegir una paraula al diccionari d’autocorrecció.

Relacionat: Com definir les vostres pròpies paraules d’autocorrecció a Android

Amb el temps, podeu desenvolupar un perfil de parla altament personalitzat per al vostre gat. Finalment, fins i tot pot ser prou sofisticat com per ser útil per a les mascotes o per resoldre problemes de comportament. Si no res, ajuda els propietaris de gats a estar més atents a les seves mascotes.

El veredicte: funcionen les aplicacions de traducció de gats?

Al final, la 'traducció del gat' encara depèn molt de que l'usuari ensenyi a l'aplicació com parla el seu gat. Probablement sempre serà així per la singularitat de la comunicació de cada gat.

Però el fet que l'aprenentatge automàtic hagi arribat tan lluny que els desenvolupadors fins i tot puguin tenir èxit parcialment és increïble. L’aprenentatge automàtic i la IA avancen a velocitats vertiginoses i no podem esperar a veure cap a on van a continuació.

Compartir Compartir Tweet Correu electrònic Temes relacionats
  • Tecnologia explicada
  • Aprenentatge d’idiomes
  • Aprenentatge automàtic
Sobre l'autor Natalie Stewart(47 articles publicats)

Natalie Stewart és escriptora de MakeUseOf. Va començar a interessar-se per la tecnologia a la universitat i va desenvolupar una passió per la redacció de mitjans a la universitat. L’atenció de Natalie se centra en la tecnologia accessible i fàcil d’utilitzar, i li encanten les aplicacions i els dispositius que fan la vida més senzilla per a la gent quotidiana.

Més de Natalie Stewart

Subscriu-te al nostre butlletí

Uniu-vos al nostre butlletí per obtenir consells tècnics, ressenyes, llibres electrònics gratuïts i ofertes exclusives.

Feu clic aquí per subscriure-us