Com reconeix Shazam la música amb precisió?

Com reconeix Shazam la música amb precisió?

Us heu preguntat mai com Shazam «sent» la música que toqueu i la identifica amb tanta precisió? Bé, no estàs sol.





La tecnologia que potencia el servei de reconeixement de música és un misteri per a molts, sobretot des que el servei es va llançar anys abans que els telèfons intel·ligents i l’aprenentatge automàtic esdevinguessin una cosa.





En aquest article, veurem com funciona Shazam i com pot reconèixer la música amb precisió.





Què és Shazam?

Shazam és una aplicació de reconeixement de música popular que podeu utilitzar per trobar informació sobre una nova cançó que us agrada però que no coneixeu el títol ni el nom de l’artista.

Digueu que sou a una cafeteria o que passegeu per una botiga de la cantonada i que sentiu una cançó nova que voldríeu tenir a la biblioteca musical. Shazam us ajuda a trobar la cançó amb facilitat. Tot el que heu de fer és enregistrar uns segons de la cançó a l’aplicació.



L’aplicació Shazam utilitza una sofisticada tecnologia de reconeixement d’àudio per identificar la música que escolteu en qüestió de segons, de manera que pugueu conèixer el nom de l’artista i la pista, veure vídeos i fins i tot comprar o reproduir la cançó al vostre dispositiu.

Descarregar: Shazam per iOS | Android (Gratuït)





Com funciona Shazam?

Galeria d'imatges (4 imatges) Amplia Amplia Amplia Amplia Tanca

Shazam utilitza una tecnologia propietària desenvolupada per Avery Lin-Chun Wang, cofundador de l'aplicació i científic principal de dades, per identificar coincidències de cançons consultades a la seva plataforma. La tecnologia crea empremtes digitals per a enregistraments d’àudio, que és la salsa secreta darrere de les impressionants habilitats de reconeixement de Shazam.

Shazam crea i emmagatzema empremtes digitals d’àudio que consisteixen en col·leccions de dades numèriques per a cada més de 15.000 milions de cançons. Quan un usuari analitza una cançó, Shazam crea ràpidament una empremta digital d’àudio del so rebut del telèfon intel·ligent o del micròfon de la PC.





Un cop acabat de crear l’empremta digital d’àudio per a la gravació, Shazam penja l’empremta digital d’àudio (no l’àudio) al seu servidor, on executa una cerca a la base de dades de coincidències. Si es troba una coincidència, torna la informació de la cançó amb opcions sobre on reproduir-la o comprar-la, juntament amb la informació identificativa.

Què és una empremta digital d'àudio?

Una empremta digital d’àudio és un resum digital condensat de senyals d’àudio. S’utilitzen per identificar una mostra d’àudio o per localitzar elements similars en una base de dades d’àudio.

La tecnologia d’empremtes digitals d’àudio de Shazam pot fer coincidir peces de contingut d’àudio sense etiquetar amb les coincidències corresponents de la seva base de dades d’àudio. Shazam identifica el títol de la cançó que heu gravat (un contingut d’àudio sense etiquetar) fent coincidir l’empremta digital de la cançó amb l’empremta digital de les cançons de la base de dades.

Shazam crea empremtes digitals úniques per a cançons a la seva base de dades mitjançant l’ús de determinats punts de dades identificats amb l’ajut d’un espectrograma.

Què és un espectrograma?

Un espectrograma és un gràfic tridimensional utilitzat com a representació del so. L'espectrograma mostra el canvi de freqüències durant un període, tot tenint en compte l'amplitud o el volum. La foto següent és un exemple de lectura d’espectrogrames.

Crèdit de la imatge: Changhua Coast Conservation Action / https://search.creativecommons.org/photos/e6b0b0f3-79ea-4621-9029-1b73365a52ac

En una entrevista del 2003 amb Scientific American , Avery Wang va revelar que l'algorisme Shazam utilitza punts d'espectrograma que representen notes amb la màxima energia per generar empremtes digitals d'àudio.

Ignorant la major part de la informació d’una cançó i concentrant-se només en les poques notes que defineixen, Shazam pot buscar a la base de dades i proporcionar coincidències precises per a les consultes de cançons a una velocitat increïble.

Com és capaç Shazam d’identificar cançons en llocs sorollosos?

Shazam utilitza enregistraments de cançons lliures de sorolls de fons i distorsions per crear empremtes digitals per a la seva base de dades. Quan enregistreu una cançó amb l’aplicació en un lloc sorollós, es crea una empremta digital d’àudio de la gravació identificant les notes amb més energia de la gravació.

A continuació, busca a la base de dades una coincidència per a les empremtes digitals d’àudio de la gravació, sempre que el nivell de soroll de fons no sigui prou alt com per distorsionar les dades utilitzades per crear l’empremta digital d’àudio.

Temps en què Shazam no us pot ajudar a identificar una cançó

Shazam és fantàstic combinant cançons, fins i tot música fosca que creieu que potser no té a la base de dades. Però hi ha moments en què Shazam no pot identificar una pista?

Gravació distorsionada

Quan feu una cançó en un lloc on el nivell de soroll de fons és massa alt, el soroll distorsiona les dades de l’espectrograma. Per això, l’empremta digital d’àudio de la vostra gravació serà diferent de la de la cançó original.

Quan això passa, Shazam retorna el fitxer Cançó no coneguda diàleg perquè no troba cap coincidència amb l'empremta digital d'àudio.

Música en viu

Shazam es queda curta en la seva capacitat per identificar la música de les actuacions en directe. Això es deu al fet que l'àudio que enregistreu en actuacions en directe sovint difereix de la versió original de la cançó que Shazam utilitza per crear empremtes digitals d'àudio.

L'única forma en què Shazam pot identificar una cançó durant una actuació en viu és si la banda és prou hàbil per interpretar la cançó exactament tal com va ser enregistrada. Molta sort amb la banda que intenta fer això ...

La vostra gravació de veu

Puc aconseguir que Shazam reconegui una cançó que cantava si fos un bon cantant?

En resum, no.

L’algorisme de Shazam només pot identificar música preregistrada. Perquè Shazam identifiqui una cançó que canteu, haureu de tenir la mateixa veu amb els instrumentals al tempo exacte amb l’enregistrament original de la cançó.

PC no es connectarà a Internet

El vostre taral·le

Shazam no pot identificar les coincidències dels roncs perquè el seu algorisme fa servir freqüències i amplituds exactes per crear empremtes digitals d’àudio per a les cançons de la seva base de dades.

Quan tarareixes una cançó, Shazam hi crea una empremta digital. Però com que un brunzit només és un intent de resintetitzar una cançó, l'algorisme no coincidirà amb la gravació.

Shazam és l’única aplicació d’identificació musical?

Shazam va ser el primer servei d’identificació musical i actualment és l’aplicació d’identificació de cançons més utilitzada. No obstant això, n’hi ha altres aplicacions que podeu utilitzar per identificar una cançó jugant al teu voltant. Alguns fins i tot poden identificar una cançó que canteu o tarareja.

Tres de les alternatives Shazam més populars són SoundHound, Musixmatch Lyrics i Genius. Musixmatch i Genius us ajuden principalment a identificar les lletres de la música que es reprodueix al vostre voltant, mentre que SoundHound és el competidor més proper de Shazam.

Relacionat: Les millors aplicacions de reconeixement musical per trobar cançons segons la seva melodia

Podeu utilitzar l'aplicació SoundHound per fer pràcticament tot el que fa Shazam. El seu principal avantatge respecte a Shazam és que té la funcionalitat addicional d’identificar les cançons que canteu o tarareu.

Crèdit de la imatge: Sulastri Sulastri / Shutterstock.com

Compartir Compartir Tweet Correu electrònic Com identificar música i cançons en vídeos de YouTube: 5 maneres

Apreneu a trobar una cançó d’un vídeo a YouTube o en altres llocs, utilitzant Shazam i diversos altres mètodes.

Llegiu a continuació
Temes relacionats
  • Tecnologia explicada
  • Shazam
  • Descobriment musical
  • SoundHound
  • Musixmatch
Sobre l'autor John Awa-abuon(62 articles publicats)

John és un amant de la tecnologia per naixement, creador de contingut digital de formació i tècnic d’estil de vida per professió. John creu en ajudar les persones a resoldre problemes i escriu articles que fan això.

Més de John Awa-abuon

Subscriu-te al nostre butlletí

Uniu-vos al nostre butlletí per obtenir consells tècnics, ressenyes, llibres electrònics gratuïts i ofertes exclusives.

Feu clic aquí per subscriure-us