La mort dels MP3: una breu història del format d'àudio preferit del món

La mort dels MP3: una breu història del format d'àudio preferit del món

La fundació alemanya propietària de la patent del venerable format de música 'vell' MP3 va anunciar recentment que deixarien caducar la seva patent. El MP3 va compartir els fitxers d'àudio de manera oberta durant els anys noranta i principis del 2000. La combinació de compressió de dades, mida de fitxer i qualitat d’àudio conservada va assegurar que el format d’àudio es disparés fins a la notorietat a banda i banda de l’argument de la pirateria.





Els titulars deien 'MP3 is dead', però qualsevol audiòfil real sap que una veritable mort és molt improbable. Tot i això, és hora d’examinar la història d’un format d’àudio de renom mundial i el que pot venir en un futur proper.





Com funciona exactament el MP3?

Depenent de l'edat i l'abús que hagin patit les vostres orelles, el vostre rang de freqüència auditiva oscil·la entre els 20 Hz i els 20.000 Hz. A més, les nostres oïdes són més sensibles a les freqüències de so entre 2 kHz i 5 kHz. La nostra audició també està limitada per la nostra capacitat de filtrar i processar els senyals d’àudio a mesura que arriben.





Crèdit de la imatge: flatvector a través de Shutterstock

L’emmascarament de freqüència, la clau de la compressió MP3, es basa en la incapacitat del cervell de distingir entre certs senyals.



Imagineu-vos que tenim dos sons. Tenen freqüències molt similars (per exemple, 200 Hz i 210 Hz), però es reprodueixen a diferents volums. El so més feble és audible per si sol, però el més fort només es distingeix si es toquen simultàniament. El procés de cobertura d’una freqüència amb una altra freqüència pròxima s’anomena “emmascarament”. L'emmascarament de freqüència funciona de manera eficient a la part superior i inferior de l'espectre d'àudio.

Arrencant un CD

Suposem que estem copiant un CD a l'ordinador. La música del CD es mostra a 44.100 vegades per segon (44,1 kHz). Les mostres tenen una longitud de 2 bytes (1 byte és de 16 bits). El MP3 admet diverses tarifes, però normalment utilitza la norma CD de 44,1 kHz.





com sincronitzar el correu electrònic a Android

Un fitxer MP3 individual consta de marcs MP3, amb capçalera i bloc de dades. Cada fotograma conté 1.152 mostres. Tècnicament, es tracta de dos 'grànuls' de 576 mostres. Les mostres s’executen a través d’un filtre que divideix encara més el so en un conjunt específic de 32 rangs de freqüència. A continuació, l'algorisme MP3 divideix aquestes 32 bandes de freqüència per un factor de 18, creant 576 bandes encara més petites. Cada banda conté 1/576 del rang de freqüències de la mostra original (quan vam començar a extreure el CD a l'ordinador).

Crèdit de la imatge: Kim Meyrick a través de Wikimedia





En aquesta etapa, fan dos algorismes matemàtics complexos: el Transformada de cosinus discret modificada (MDCT) i Transformades de Fourier ràpides (FFT). Cadascun realitza un procés diferent sobre el material font desglossat.

Els FFT analitzen cada banda de freqüència per obtenir sons que es puguin emmascarar fàcilment, assegurant-se que l’emmascarament de freqüència conserva els sons vitals de la pista.

Les mostres s’ordenen i es passen al MDCT. MDCT converteix cada banda en un conjunt de valors espectrals. Els valors espectrals representen amb més precisió la manera com la nostra audició interpreta l’àudio. Per tant, molts codificadors d'àudio comprimits utilitzen valors espectrals per eliminar les dades d'àudio. Un cop finalitzada la informació espectral i l’anàlisi del grànul, comença el procés de compressió real.

Una breu història de MP3

Recordes el teu primer reproductor de MP3? Vaig tenir la sort de tenir un iPod original, fins que un home amb un ganivet el va alliberar del meu poder. MiniDiscs eren molt més frescos, de totes maneres.

Malgrat tot, en el moment en què l'iPod original va augmentar ràpidament el desig de dispositius MP3 (el 2001), el format ja tenia vuit anys. A més, MP3 ja feia onades a Internet i altres dispositius de música digital portàtils.

D’on va sorgir l’MP3?

MP3 era un M oving Pàg ictura I xperts G roup (MPEG), com a part del seu estàndard original de compressió d'àudio i vídeo MPEG-1. MP3 és una abreviatura de MPEG-1 Audio Layer III, aprovada per al seu ús el 1991 i finalment publicada el 1993.

La idea que hi ha darrere del MP3 és bastant genial.

L’algorisme MP3 aprofita les limitacions perceptives de l’audició humana, conegudes com a emmascarament auditiu. L’emmascarament auditiu es produeix quan la percepció d’un so es veu afectada per la presència d’un altre. A més, cada cançó conté elements d'àudio imperceptibles per a l'experiència auditiva general. Manfred R. Schroeder va proposar per primera vegada un còdec d’emmascarament psicoacústic el 1979. No obstant això, no va ser fins a la formació del MPEG (com a subcomitè de la ISO / IEC) el 1988 que va començar una iniciativa concertada per a una norma global.

Hi ha un altre nom important en la història del MP3: Karlheinz Brandenburg. Brandenburg va començar a treballar en la compressió de música digital als anys vuitanta, completant la seva tesi doctoral el 1989. The diversos modes de compressió en què havia treballat es van trobar limitacions en les dues tecnologies disponibles en aquell moment, així com en el disseny dels primers processos de codificació. Ell, juntament amb altres membres fundadors del MPEG, es va adonar que només n’hi hauria prou amb un sistema nou.

L’Institut Fraunhofer

El 1990, Brandenburg es va convertir en professor ajudant a la Universitat d'Erlangen-Nuremberg. Va continuar el seu treball de compressió amb la Fraunhofer Society (finalment s'uniria a Fraunhofer el 1993).

'Teníem el subgrup d'àudio dins del grup de pel·lícules [MPEG]', explicava Brandenburg en un Entrevista NPR . 'Al final, tots junts vam tenir un compromís que tenia diferents modes, els anomenats capa I, capa II, capa III. . . I la majoria de les nostres idees van entrar en els modes de compressió en àudio MPEG. . . que era el més complex i el que donava la millor qualitat a baixes taxes de bits, que es deia capa III.

Brandenburg va utilitzar la cançó 'Tom's Diner' de Suzanne Vega per perfeccionar l'algoritme de compressió, escoltant-la una i altra vegada, per assegurar-se que la seva manipulació no afectés negativament la gravació de la veu de Vega.

El MP3 explota

El MP3 va romandre a la seca durant un parell d'anys després del seu llançament oficial, el còdec es considerava 'massa complicat' per a un ús generalitzat.

Tanmateix, el 1997 les coses van canviar ràpidament.

En primer lloc, un 'estudiant australià' va comprar programari de codificació professional l3enc d’una empresa alemanya. Va invertir el disseny del programari, el va recompilar i el va penjar a una universitat dels Estats Units FTP amb un README arxiu que diu: 'Aquest és un programa gratuït gràcies a Fraunhofer.' Aquest petit acte va canviar instantàniament l'accés a la codificació i descodificació MP3. De sobte, si enganxeu un CD a l'ordinador es produeix un àudio d'alta qualitat en mides de fitxer minúscules.

En segon lloc, Nullsoft va llançar el venerable reproductor d'àudio Winamp. Els fitxers MP3 extrets d’un CD es podrien reproduir fàcilment en un ordinador.

Al mateix temps, Internet s’havia estès a milions de llars de tot el món. Milions de discs durs s’omplien de fitxers MP3 , i el format es va convertir en el format preferit per compartir fitxers d’àudio per als primers serveis d’intercanvi de fitxers peer-to-peer, com Napster, Gnutella i eDonkey (Gnutella era un altre projecte de Nullsoft). La pirateria musical era viva i desenfrenada i no va ser gaire ajudada per l'augment de MP3.

Reproductors MP3

En un altre benefici per a la indústria de l'àudio establerta, van aparèixer reproductors de MP3 portàtils. A principis dels anys noranta, l’Institut Fraunhofer havia intentat i no va poder crear un reproductor MP3 comercialitzable. Simplement era massa aviat per a una adopció generalitzada. Necessitava la combinació esmentada d’intercanvi de fitxers, proliferació d’Internet i programari d’extracció per donar impuls als reproductors de MP3 portàtils.

L'empresa sud-coreana, Elger Labs, va presentar el MPMAN F10 de 250 dòlars, amb una enorme memòria de 32 MB. No va ser l’espurna al·lucinant per a la indústria tal com la coneixem. Aquest reconeixement correspon al Diamond Rio PMP300, que també compta amb 32 MB.

L'èxit del Diamond Rio va atreure l'atenció no desitjada. La Recording Industry Association of America (RIAA) va demandar Diamond Multimedia Systems (el fabricant) i va perdre. Tot i això, la RIAA va assumir correctament que aquest era el començament de la pirateria musical endèmica, que continua fins als nostres dies.

Què va passar després?

Bé, un dispositiu poc conegut anomenat iPod va arribar als mercats, legitimant completament MP3 com el format d'àudio de facto de l'època, i la RIAA va iniciar la seva (en curs) croada contra pirates de tot el món.

La resta, com diem, és història.

Per què mor MP3 després?

L’Institut Fraunhofer era propietari de la patent MP3. El 23 d'abril de 2017, les seves patents restants vencien. Per tant, Fraunhofer ja no pot emetre llicències MP3 noves. Hem explicat exactament què està passant amb aquests titulars 'apocalíptics', així com com us afectarà.

Voleu el TL; DR? MP3 no està mort i no va enlloc.

Un dels principals motius que va donar Fraunhofer per deixar anar MP3 era l'edat. Ja no pot competir amb els seus cosins codec més nous i brillants. El seu suggeriment? Utilitzeu la codificació d’àudio avançada (AAC). Casualment, Fraunhofer també té la patent (en curs) d'AAC, de manera que a continuació tenim algunes alternatives MP3 que podeu triar.

MP3 Alternatives

La vostra col·lecció de MP3 no cremarà de sobte, de la mateixa manera que els codificadors i descodificadors existents continuaran produint fitxers MP3. Dit això, ara el MP3 té una mica de data. Hi ha diversos formats d’àudio alternatius gratuïts podeu utilitzar per emmagatzemar la vostra música digital ara.

  • AAC - La codificació d'àudio avançada, com s'ha esmentat anteriorment, és la successora de MP3. L'únic problema és que el format en si mateix ara sembla una mica antiquat. Tot i això, AAC generalment aconsegueix una millor fidelitat d'àudio que MP3, amb taxes de bits i mides de fitxers similars. AAC també és un format amb pèrdues.
  • Ogg Vorbis - Format Vorbis, utilitzat habitualment juntament amb el format contenidor Ogg. És el cosí de codi obert millor, una mica més jove, de MP3. Tot i que Ogg presenta una millor compressió, velocitats de bits més altes i, en general, una millor qualitat d’àudio, Ogg mai no s’enlaira de la mateixa manera que el MP3 a causa de la manca de dispositius compatibles. Ogg també és un format amb pèrdues.
  • FLAC - El còdec d’àudio sense pèrdues és el format de còdec d’àudio sense pèrdues més popular. Per què? FLAC ofereix una còpia d’àudio exacta del material font, a la meitat de la mida d’un CD tradicional. Els sons més afectats per MP3 (per exemple, guitarres, plats, reverb, etc.) continuen sent nítids tot i estar comprimits significativament. FLAC és un format sense pèrdues.

MP3 No està mort

No té res de què preocupar-se. Podeu continuar extret a MP3 i els vostres dispositius continuaran reproduint la vostra música. A la llarga, valdrà la pena, com a mínim, investigar un format d’àudio més recent per a la vostra col·lecció. Les tècniques de compressió avançaran i les mides dels fitxers de les còpies exactes disminuiran.

A més, val la pena considerar la capacitat d’emmagatzematge. Quan van arribar els primers reproductors de MP3 portàtils amb 32 MB d’emmagatzematge, sí guai , però evidentment no és suficient. L’emmagatzematge més gran per a un iPod Classic era de 160 GB. Això es podria superar amb una actualització d'emmagatzematge personalitzada a la friolera de 240 GB, més de 1.000.000 de pistes MP3 individuals. El punt és que a mesura que augmenta la mida de l’emmagatzematge i disminueix la mida física, podem fer més amb menys.

Finalment, Internet continua canviant la manera com escoltem música. Abans piratejava la música perquè no em podia permetre el luxe de pagar entre 12 i 20 dòlars per cada nou disc que sortís. Ara tinc un compte del pla familiar de Spotify amb accés a milions de cançons i un compte d’Amazon Prime amb milions més. L'única cosa que em limita és la meva connexió a Internet i, fins i tot, tots dos tenen opcions per descarregar-les fora de línia en formats d'alta qualitat.

No és tan important com abans, però el MP3 no està mort.

Quin és el vostre format d'àudio preferit? Necessiteu la realitat nítida de lossless? O una compressió extrema d’un format amb pèrdues? Ha canviat l’ús de la vostra música des que es van generalitzar els serveis de transmissió? Deixeu-me una línia als comentaris i us respondré.

Crèdit de la imatge: Ti Santi a través de Shutterstock.com

Compartir Compartir Tweet Correu electrònic Una guia per a principiants d’animació de la parla

Animar la parla pot ser un repte. Si esteu preparat per començar a afegir diàlegs al vostre projecte, us desglossarem el procés.

Llegiu a continuació
Temes relacionats
  • Tecnologia explicada
  • Entreteniment
  • MP3
  • Compressió de fitxers
  • Audio Converter
Sobre l'autor Gavin Phillips(945 articles publicats)

Gavin és l'editor júnior de Windows and Technology Explained, col·laborador habitual del Podcast Really Useful i revisor de productes habitual. Té un BA (Hons) Contemporary Writing with Digital Art Practices saquejat des dels turons de Devon, així com més d’una dècada d’experiència en escriptura professional. Li agrada una gran quantitat de te, jocs de taula i futbol.

Més de Gavin Phillips

Subscriu-te al nostre butlletí

Uniu-vos al nostre butlletí per obtenir consells tècnics, ressenyes, llibres electrònics gratuïts i ofertes exclusives.

Feu clic aquí per subscriure-us