MusicLM de Google està a l'altura del bombo?

MusicLM de Google està a l'altura del bombo?
Lectors com tu ajuden a donar suport a MUO. Quan feu una compra mitjançant enllaços al nostre lloc, podem guanyar una comissió d'afiliats. Llegeix més.

El gener de 2023, Google va anunciar MusicLM, una eina experimental d'IA que podria generar música a partir de descripcions de text. Paral·lelament a la notícia, Google va publicar un treball de recerca impressionant per a MusicLM que va deixar moltes persones enlluernades per la capacitat d'evocar música des de l'aire.





MAKEUSEO VÍDEO DEL DIA DESPLACEU PER CONTINUAR AMB EL CONTINGUT

Amb un missatge de text, el model va prometre produir música d'alta fidelitat que oferia tot tipus de descripcions, des del gènere fins a l'instrument fins a subtítols abstractes que descriuen obres d'art famoses. Ara que MusicLM està obert al públic, hem decidit posar-ho a prova.





L'intent de Google de crear un generador de música AI

  Aplicació web per a Google's MusicLM AI music generator

Convertir un missatge de text com 'jazz relaxant' en una cançó llesta per reproduir és, sens dubte, el sant grial dels experiments en música d'IA. De manera semblant als famosos generadors d'imatges d'IA com Dall-E o Midjourney, no cal que tingueu una mica de coneixements musicals per produir una pista que tingui una melodia i un ritme.





El maig de 2023, els que es van registrar a l'AI Test Kitchen de Google van poder provar la demostració per primera vegada. Benvingut per una pàgina web fàcil d'utilitzar i un parell de regles guia (els instruments electrònics i clàssics funcionen millor, i no us oblideu d'especificar una 'vibració'), produir un fragment de música és inimaginablement fàcil.

La velocitat és una de les poques coses que realment ofereix MusicLM, juntament amb mostres d'alta fidelitat. Tanmateix, la veritable prova no s'havia de mesurar només amb un cronòmetre. MusicLM pot produir música real i escoltable a partir d'unes poques paraules? No exactament (en breu en parlarem).



Com utilitzar MusicLM a la cuina de prova d'IA de Google

Utilitzar MusicLM és fàcil, pots registrar-te a la llista d'espera Cuina de prova d'IA de Google si vols donar-hi una oportunitat.

A l'aplicació web, veureu un quadre de text on podeu redactar un missatge des d'unes poques paraules fins a unes quantes frases que descriguin el tipus de música que voleu escoltar. Per obtenir els millors resultats, Google us aconsella que 'sigueu molt descriptius', i afegeix que heu d'intentar incloure l'estat d'ànim i l'emoció de la música.





tancar la sessió de netflix al roku

Quan estigueu preparat, premeu Intro per començar el processament. En uns 30 segons, hi haurà dos fragments d'àudio disponibles per a audicions. D'entre els dos, teniu l'opció d'atorgar un trofeu a la millor mostra que coincideixi amb la vostra indicació, que al seu torn ajuda a Google a entrenar el model i millorar-ne la producció.

Com sona MusicLM

Els humans hem estat fent música des de fa almenys 40.000 anys sense tenir una idea definitiva de si la música va venir abans, després o al mateix temps que el desenvolupament del llenguatge. Per tant, d'alguna manera, no és d'estranyar que MusicLM no hagi descobert el codi d'aquest antic art universal.





Document d'investigació MusicLM de Google va suggerir que MusicLM podria generar música a partir de subtítols que pertanyen a obres d'art famoses i seguir instruccions com canviar el gènere o l'estat d'ànim d'una manera suau seguint una seqüència d'indicacions diferents.

Abans d'arribar a ordres tan grans, però, vam descobrir que MusicLM tenia diversos problemes fonamentals per superar primer.

Dificultat per mantenir el tempo

La feina més bàsica de qualsevol músic és simplement tocar a temps. En altres paraules, seguiu el ritme. Sorprenentment, això no és una cosa que MusicLM pugui fer el 100% del temps.

De fet, utilitzant la mateixa indicació 10 vegades, que produeix 20 pistes de música, només tres eren a temps. Les 17 mostres restants eren més ràpides o més lent que el tempo especificat que estava escrit en 'ritmes per minut', un terme molt utilitzat per descriure la música.

En aquest exemple, hem utilitzat el missatge 'piano clàssic sol tocat a 80 pulsacions per minut, tranquil i meditatiu'. En escoltar-la més de prop, la música sovint s'accelera o s'alenteix dins la petita durada de la mostra.

instal·leu Google Play a Fire HD 8

A la música també li faltava un ritme fort i sonava com si algú hagués tocat el joc a mig camí de la peça. Tant si això va ser intencionat com si no, dificulta jutjar si MusicLM pot compondre un inici o un final adequats per a una peça de música a més de seguir el ritme.

Selecció aleatòria d'instruments

Potser MusicLM encara no havia après a tocar en un temps estricte, així que vam passar a un altre paràmetre musical comú. Volíem veure si acceptaria la nostra petició de determinats instruments.

Vam escriure diverses indicacions diferents que incloïen descripcions com 'Sintetitzador solista' i 'Guitarra baix solista'. Altres eren conjunts més grans com 'Quartet de corda' o 'Banda de jazz'. En general, semblava una possibilitat de 50:50 d'obtenir el que demanàveu.

Una teoria és que el model associa alguns instruments amb gèneres musicals populars. Preneu, per exemple, el missatge 'Sintetitzador solista, progressió d'acords. Viva i optimista'. En lloc d'aconseguir un so de sintetitzador per si sol, MusicLM va produir una pista electrònica completa amb bateria i baix.

És possible que el model no tingui prou dades i formació suficient per entendre la sol·licitud específica d'un instrument.

Les veus estan fora de l'equació

Segons les restriccions de l'època, el model no produiria música que contingués veus. Problemes espinosos de drets d'autor de MusicLM i veus amb errors és un factor probable en el motiu pel qual Google va decidir jugar amb seguretat establint aquesta limitació.

Però després d'experimentar amb MusicLM durant un temps, ens vam adonar que el control de Google sobre la sortida del model no era exactament incòmode. Curiosament, un missatge com 'guitarra acústica' produiria una pista que contenia veus semblants a un fantasma de fons que sonaven apagades i distants.

Tot i que això no és un fet habitual, us deixa preguntar-vos sobre la capacitat de MusicLM per crear veus convincents en primer lloc.

Amb programari com VOCALOID i Synthesizer V liderant el camí Tecnologia de síntesi vocal assistida per IA , ometre les veus del model actual ens fa preguntar-nos si encara no és prou bo per competir amb la tecnologia existent. MusicLM podria tenir un llarg camí per recórrer abans que els músics cantin els seus elogis.

El futur dels generadors de música AI

  Diferents suggeriments ràpids sobre MusicLM's web application

Tot i que MusicLM ha fet avançar la tecnologia musical d'IA generativa, ha de tornar a l'escola i aprendre algunes coses més abans de poder ocupar un treball pràctic a la indústria de la música.

Abans d'ara, el millor intent de música d'IA generativa era un model anomenat JukeboxAI per OpenAI. No estava exactament en un estat llest per al seu ús, i va trigar nou hores a reproduir només un minut de música.

combina dues fotos en un mateix marc en línia

Pels vostres esforços, és probable que recupereu una pista de so veritablement alienígena plena de distorsió d'àudio i artefactes. A l'avantatge, no t'aniries a avorrir escoltant les estranyes creacions que evoca Jukebox .

A la llum d'això, MusicLM ha fet alguns avenços significatius cap a un generador de música AI fàcil d'utilitzar. Gairebé podríem perdonar el model per les seves sortides aleatòries quan us atureu a pensar com de complicat és generar música en forma d'àudio en brut.

Després de posar en funcionament el model, però, MusicLM se sent a mig fer en comparació amb el que Google va publicar al seu treball de recerca inicial. Poques vegades un generador d'imatges d'IA s'equivoca amb la imatge d'un Apple, de la mateixa manera un generador de música d'IA hauria d'aconseguir alguns conceptes bàsics com el tempo i els instruments.

MusicLM de Google no compleix les expectatives

Amb les empreses tecnològiques que corren per competir entre si en el front de l'IA, MusicLM se sent com si entrés a proves públiques abans d'estar a punt. En lloc d'encertar els fonaments, el model sembla adoptar un enfocament molt més vague i subjectiu per produir música.

Google us pot animar a ser específic amb la vostra indicació, però no pot gestionar bé el ritme i no us garanteix que obtingueu els instruments que heu demanat cada vegada. MusicLM pot ser interessant i una bona demostració dels poderosos avenços de la IA, però si la música és l'objectiu final, encara té un llarg camí per recórrer.