Movatterモバイル変換

Przejdź do zawartości

MP3

Z Wikipedii, wolnej encyklopedii

Zobacz też:inne znaczenia.

MP3
Rozszerzenia pliku	.mp3
Typ MIME	audio/mpeg audio/MPA audio/mpa-robust
Producent	Moving Picture Experts Group
Data opracowania	1993
Typ	stratna kompresja dźwięku

MP3 (ang. MPEG-1/MPEG-2 Audio Layer 3) –algorytm kompresji stratnej dźwięku zapisanego w postacisygnału cyfrowego. Popularnie zwany formatem MP3 lub standardem MP3. Jest zdefiniowany przezInternet Engineering Task Force (IETF) w dokumencieRFC 5219 ↓. Ochrona patentowa formatu MP3 w Unii Europejskiej wygasła w 2012, w kwietniu 2017 wygasł ostatni patent chroniący MP3 w Stanach Zjednoczonych. Częściową ochronę zapewniały dwa patenty, które wygasły w 2017^[1]. W związku z tym zakończono wydawanie licencji^[2].

Informacje ogólne

[edytuj |edytuj kod]

StandardyMPEG-1 iMPEG-2 są przeznaczone dokompresji ruchomych obrazów oraz towarzyszącego imdźwięku. W ich realizacji wykorzystano algorytmzmodyfikowanej dyskretnej transformacji cosinusowej. Standardy te oferują możliwość kompresjistrumienia danych reprezentującego dźwięk na trzy sposoby, tzw. warstwy (ang.layer): Layer 1, Layer 2 i Layer 3. Sposób „Layer 3”, charakteryzujący się najwyższym stopniem kompresji i dobrą jakością dźwięku, został następnie wykorzystany do zapisu (utrwalania) dźwięku cyfrowego jako format lub standard MP3.

Standard MP3 udostępniono do użytku publicznego w grudniu 1991 roku, przede wszystkim w ramach działań prowadzonych przez niemieckie stowarzyszenie naukowo-badawcze występujące pod nazwąStowarzyszenie Fraunhofer^[3] (Fraunhofer IIS)^[4].

Pliki zawierające dane w tym formacie otrzymują zwyczajoworozszerzenie „mp3”.

Opis działania

[edytuj |edytuj kod]

Dźwięk może zostać zapisany na wiele sposobów (np. mechaniczny, elektromechaniczny, optyczny, cyfrowy). Jednym z nich jest zamianafal dźwiękowych w proporcjonalne zmianynapięcia lubnatężenia prądu elektrycznego. Uzyskany w ten sposóbsygnał analogowy dźwięku może zostać przekształcony do postacisygnału cyfrowego. Przekształcenia dokonuje się za pomocąprzetwornika analogowo-cyfrowego. Podczas konwersji sygnału analogowego na cyfrowy należy pamiętać oczęstotliwości Nyquista, która jest równa połowie częstotliwości próbkowania. Oznacza to, że dlaczęstotliwości próbkowania 44,1 kHz częstotliwość Nyquista to 22,05 kHz (44,1:2=22,05). Jest ona najwyższą częstotliwością dźwięku możliwą do zapisania przy częstotliwości próbkowania 44,1 kHz. W celu wykonania zapisu w postaci cyfrowej, dźwięk w postaci sygnału analogowego jest przepuszczany przezfiltr dolnoprzepustowy o odcięciu w granicach 20-22kHz (ograniczenie pasma), a następniepróbkowany zczęstotliwością 44,1kHz i rozdzielczością 16bitów. Wytwarza tostrumień danych oprzepływności ok. 1,5Mb/s dla sygnałustereofonicznego i jest to zapis dźwięku w nieskompresowanym formacie (zob. np.PCM,WAV,AIFF,CD-Audio). Aby zmniejszyć ilość danych należałoby zmniejszyć częstotliwość próbkowania i/lub rozdzielczość, ale to może powodować zbyt dużą różnicę w porównaniu do oryginalnego sygnału, nieakceptowalną dla słuchacza. Wykorzystuje się więc specyficzne właściwości ludzkiegosłuchu i dlatego w standardzie MP3 używane sąmodele psychoakustyczne w celu osiągnięcia pożądanegostopnia kompresji stratnej. Polega to na usunięciu tych informacji z dźwięku, które są niezauważalne lub mało istotne dla słuchu człowieka. Z modeli psychoakustycznych wynika, że człowiek najlepiejsłyszy dźwięki z przedziału około 2–4 kHz (mowa). Im częstotliwośćdźwięku bardziej odbiega od tego pasma, tym słyszalność jest słabsza (zob.granice słyszalności). Zatem jeżelifala akustyczna, wraz zszumem kwantyzacji, będzie cichsza oddolnej granicy słyszalności, to nie będzie on słyszalny. Z tego wynika, że skrajne częstotliwości mogą zostać zapisane z mniejszą dokładnością, przy mniejszej rozdzielczości bitowej, a nawet częściowo usunięte. Ze wspomnianego modelu słuchu człowieka wynika również zjawiskomaskowania – w uproszczeniu dźwięki głośniejsze zagłuszają cichsze. W pobliżu głośnych dźwięków (tzn. podobna częstotliwość tuż przed i tuż po wystąpieniu tego dźwięku) również można zmniejszyć liczbę bitów, ponieważ szum kwantyzacji nie będzie słyszalny. Człowiek słyszy dźwięki o częstotliwości do 20 kHz, jednak często w praktyceelektroakustycznej granicę tę określa się na poziomie 16 kHz. Uwzględniono to w standardzie MP3, stosując filtr dolnoprzepustowy, dzięki czemu dźwięki o częstotliwości powyżej 16 kHz są w większości usuwane.

W pierwszym etapie konwersji na format MP3, wejściowy sygnał cyfrowy, pobrany np. z pliku w formacieWAV, o szerokości pasma 20 Hz – 20 kHz, jest dzielony na 576, odpowiednio węższych pasm częstotliwościowych, za pomocącyfrowych filtrów w procesiecyfrowego przetwarzania sygnałów. W rezultacie otrzymuje się 576 odrębnych sygnałów. Pasmo każdego z nich jest 576 razy węższe od wejściowej szerokości pasma, zatem do próbkowania można użyć odpowiednio niższej częstotliwości.

Kodek MP3 analizuje poszczególne pasma i na podstawie modelu psychoakustycznego określa z jaką dokładnością należy zakodować każde z nich i czy jest potrzeba uwzględnienia danego pasma. W ten sposób znacznie ograniczono ilość bitów potrzebnych do zakodowania, a szum kwantyzacji, mimo że znacznie większy niż w oryginale, jest tak ukształtowany, że jest niesłyszalny. Ponadto, powstałe dane zapisuje się w postaci zmiennoprzecinkowej, co dodatkowo zmniejsza ich rozmiar.

Tak przygotowane dane łączy się, dodając dane sterujące umożliwiające odkodowanie dźwięku, na końcu poddaje się jekompresji bezstratnej i powstaje plik dźwiękowy w formacie MP3.

Często okazuje się, że użytkownik kodeka, wymuszając jegostałą przepływność, nie zapewnia warunków dla odpowiednio wiernego (dokładnego) zakodowania cyfrowego sygnału dźwiękowego. Dlatego, jeśli po kompresji okaże się, że rozmiar danych przekracza założenia, zmniejsza się liczbę bitów, w których koduje się pasma. Stąd najlepsze efekty jakościowe dają kompresory działające zezmienną przepływnością, oszczędzając miejsce na dane, a zwiększając przepływność wtedy, gdy to jest konieczne dla zachowania jakości (percepcyjnej zgodności skompresowanego dźwięku z oryginałem). Jakość dźwięku ponadto zależy od zastosowanego modelu psychoakustycznego oraz od słuchacza. Jeśli jego słuch będzie odbiegał od modelu psychoakustycznego używanego w kodeku, jakość dźwięku może zostać przez niego oceniona jako różniąca się od oryginału. W celu zbadania percepcji jakości skompresowanego dźwięku stosuje się metodę badawczą określaną jakopodwójnie ślepa próba.

Przepływność danych

[edytuj |edytuj kod]

Pierwotnie, do kompresji (kodowania) MP3 stosowanostałą przepływność (CBR), czyli do zapisu każdej ramki używano tej samej liczby bitów. W miarę rozwoju oprogramowania kodującego udostępniony został trybprzepływności zmiennej (VBR), charakteryzujący się zmiennością w wybranym przedziale czasu podczas kompresji i nastawiony na utrzymywanie stałej jakości dźwięku. Istnieje również trybprzepływności dostępnej (ABR), który jest połączeniem obu poprzednich trybów. W tym przypadku wykonywana jest kompresja podobnie jak w trybie VBR i ograniczanie średniego strumienia danych do określonej na początku wartości.

Stałe przepływności dostępne w standardzie MP3, to: 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 i 320kbps.

Dźwięk wielokanałowy

[edytuj |edytuj kod]

Kodowany dźwięk może posiadać postać zarówno jednokanałową (trybmono), jak i dwukanałową (stereo). Istnieje też formatMP3 Surround przeznaczony do zapisudźwięku wielokanałowego 5.1, zgodny z wcześniejszym standardem MP3.

Stereo

[edytuj |edytuj kod]

Podstawowe tryby pracy kodeka MP3 dla sygnału stereo:

dual channel – zapis jako dwa odrębne kanały monofoniczne;
stereo (stereo mode 0) – każda ramka zapisywana jest algorytmemleft/right stereo;
joint stereo (stereo mode 1) – dla każdej ramki wybierany jest najlepszy algorytm kompresji.

Algorytmy kompresji kodeka MP3 dla sygnału stereo:

left/right stereo (simple stereo,independent channel) – kanał prawy i lewy jest kodowany niezależnie, może jednak zmieniać się liczba bitów przeznaczonych na każdy z kanałów. Korzystny dla ramek danych, w których oba kanały różnią się w dużym stopniu;
middle/side stereo – sygnał stereo kodowany jest w postaci pary wartości oznaczających sumę (L+R) oraz różnicę (L-R) kanałów. Korzystny dla ramek, w których oba kanały przyjmują podobne wartości;
intensity stereo – w którym sygnał stereo dla niektórych (głównie wysokich) częstotliwości kodowany jest monofonicznie, wartość uzupełniona jest o wektor określający kierunek, z którego dochodzi dźwięk. W praktyce stosowany tylko przy niskiej przepływności, poniżej 80 kbps. Niektóre programy kodujące, jak np.LAME, nie posiadają tej opcji.

MP3 Surround

[edytuj |edytuj kod]

MP3 Surround to rozszerzenie formatu MP3 pozwalające na zapisdźwięku wielokanałowego 5.1. Zapisywane są dwa kanały tak jak w zwykłym MP3, a informacja potrzebna do wygenerowania dodatkowych kanałów jest zapisana wtagach MP3. Dzięki temu pliki w formacie MP3 Surround można odtwarzać jako zwykłe stereo w odtwarzaczach MP3.

mp3HD

[edytuj |edytuj kod]

Format mp3HD, wprowadzony przez firmęThomson, umożliwia bezstratną kompresję audio, zachowujączgodność ze standardem MP3. Przepływność strumieni audio zapisanych w mp3HD zawiera się w granicach 500-900 kb/s. Aby słuchać muzyki zapisanej w tym formacie, należy użyć odpowiedniego programu^[5].

MP3 jako domyślny format w serwisach muzycznych

[edytuj |edytuj kod]

Format mp3 jest wciąż wykorzystywany jako domyślny lub jedyny w niektórych serwisach z muzyką. Np. we „Free Music Archive”, czy „Music Screen” (np. dział „Free Symphony Music”), gdzie muzyka jest możliwa do ściągnięcia w tym formacie bezpłatnie do prywatnego, niekomercyjnego użytkowania. W tym drugim na własny użytek można ściągnąć muzykę w mp3, natomiast, by mieć dostęp do nieskompresowanego pliku dźwiękowego i prawa wykorzystania komercyjnego, należy uiścić opłatę^[6]^[7].

Przypisy

[edytuj |edytuj kod]

↑To już koniec formatu MP3? [online], nt.interia.pl [dostęp 2017-11-25] (pol.).
↑mp3 [online], www.iis.fraunhofer.de [dostęp 2017-11-25] (ang.).
↑Mary Bellis: Historia MP3. Stowarzyszenie Fraunhofer i MP3. inventors.about.com. (ang.).
↑Historia standardu mp3 (The History of mp3). mp3licensing.com. (ang.).
↑Wypróbuj mp3HD. all4mp3.com. (ang.).
↑Free Music Archive [online], freemusicarchive.org [dostęp 2018-09-05] .
↑Royalty free symphony, orchestral and classical music [online], www.musicscreen.org [dostęp 2018-05-09] (ang.).

Linki zewnętrzne

[edytuj |edytuj kod]

R.R. Finlayson R.R.,A More Loss-Tolerant RTP Payload Format for MP3 Audio,RFC 5219,IETF, luty 2008,DOI: 10.17487/RFC5219,ISSN 2070-1721,OCLC 943595667 (ang.).
Karlheinz Brandenburg i tajemnicza historia MP3(ang.)

Zobacz hasłoMP3 w Wikisłowniku

p
d
e

Formaty kompresji danych audiowizualnych

Obrazy

IEC, ISO, ITU-T, W3C, IETF	BMP GIF JBIG HDP JPEG JPEG 2000 JPEG XL MNG PCX PGF PNG SVG TIFF XPM HEVC
Pozostałe	APNG BPG DjVu EXR FLIF ICER MNG PGF QTVR WBMP WebP

ISO/IEC	MPEG-1 MPEG-2 MPEG-4 ASP H.264 (MPEG-4 AVC) H.265/HEVC H.266/VVC H.267/ECM MPEG-5 Part1 EVC Part2 LC EVC MJPEG
ITU-T	H.120 H.261 H.262 H.263 H.264 H.265 H.266 H.267
SMPTE	VC-1 VC-2 VC-3 VC-5 VC-6
Pozostałe	Apple Video AV1 AVS Bink Video Cinepak Daala Dirac DV DVI FFV1 HuffYUV Indeo Lagarith Pixlet ProRes QuickTime RealVideo RTVideo SheerVideo Smacker Theora Thor VP3 VP6 VP7 VP8 VP9 WMV XEB YULS

Audio

ISO/IEC	MP1 MP2 MP3 AAC AAC+
ITU-T	G.711 G.718 G.719 G.722 G.722.1 G.722.2 G.723 G.723.1 G.726 G.728 G.729 G.729.1
IETF	Opus iLBC
3GPP	AMR AMR-WB AMR-WB+ EVRC EVRC-B GSM-HR GSM-FR GSM-EFR
Pozostałe	ACELP AC-3 AC-4 ALAC Asao ATRAC CELT Codec2 DRA DTS FLAC iSAC Lyra Monkey’s Audio TTA MT9 Musepack OptimFROG Opus OSQ QCELP RCELP RealAudio RTAudio SD2 SHN SILK Siren SMV Speex SVOPC TwinVQ VMR-WB Vorbis VSELP WavPack WMA MQA aptX

ISO/IEC	MPEG-ES MPEG-PS MPEG-TS ISO Motion JPEG 2000 MPEG-21 MPEG MP4 M4A
ITU-T	H.222.0 T.802
IETF	RTP
Pozostałe	3GP AMV ASF AIFF AVI AU BPG BMP DivX EVO Flash Video GXF IFF M2TS Matroska WebM MXF Ogg QuickTime RatDVD RealMedia WAV MOD VOB IFO BUP 22.2 E-AC-3 GSM RealAudio TAK TTA

Kontrola autorytatywna (kompresja stratna):

Encyklopedie internetowe:

Źródło: „https://pl.wikipedia.org/w/index.php?title=MP3&oldid=78736650”

Ukryta kategoria:

Szablony cytowania – problemy – cytuj – strona główna

[8]ページ先頭

©2009-2026 Movatter.jp