Formaty plików dźwiękowych cd-audio



Pobieranie 52.37 Kb.
Data02.05.2016
Rozmiar52.37 Kb.

Formaty plików dźwiękowych

CD-Audio


CD-Audio' to standard cyfrowego zapisu dźwięku na płycie kompaktowej, wykorzystujący do tego celu kodowanie PCM o częstotliwości próbkowania 44,1 kHz i rozdzielczości 16 bitów na próbkę.

pozwala na zapis dwóch kanałów (stereo). Muzyka jest podzielona na ścieżki, po których można przeskakiwać bez konieczności przewijania. Jeśli płyta została zapisana w systemie Track-At-Once (TAO) między ścieżkami będzie 3-sekundowa przerwa, można to ominąć nagrywając płytę w systemie Disc-At-Once (DAO).

Dane zapisywane na dysku CD-Audio poddawane są kodowaniu CIRC, służącemu do korekcji błędów, a następnie kodowaniu kanałowemu EFM, zwiększającemu upakowanie danych.

CD-DA zawiera standardowo 74 minuty nagrania podzielonego na maksymalnie 99 części. Przy największym dopuszczalnym zwężeniu rowka (1,497 μm) długość nagrania można zwiększyć do 79 minut i 40 sekund (przy przekroczeniu standardów - nawet do 90 albo 99 minut, przy czym takie płyty powodują dużo problemów z odczytem, szczególnie w starszych odtwarzaczach).

Płyty CD-DA charakteryzują się dosyć wysoką jakością dźwięku, a przy tym są stosunkowo odporne na zabrudzenia (kurz, odciski palców) i zarysowania.

MIDI


usical Instruments Digital Interface) ze względu na małe rozmiary plików jest często wykorzystywany do tworzenia podkładu muzycznego dla stron WWW, automatycznie odtwarzanego podczas jej oglądania w przeglądarce (poprzez użycie znacznika i odpowiedniej wtyczki). Plik w tym formacie charakteryzuje się małym rozmiarem - kilkuminutowy utwór muzyczny może być zawarty w pliku o rozmiarze 30-40 kB, w efekcie wczytanie takiego pliku nie zwiększa ogólnego czasu ładowania całej strony.

Mały rozmiar możliwy jest dzięki oparciu na innej zasadzie niż w przypadku pozostałych formatów dźwiękowych: plik nie zawiera spróbkowanego dźwięku, lecz specyficzny rodzaj zapisu nutowego danego utworu.

Standard MIDI opracowany został pierwotnie dla komunikowania się ze sobą elektronicznych instrumentów muzycznych; plik w tym formacie składa się z wielu tzw. ścieżek, z których każda odpowiada brzmieniu określonego instrumentu. Każda ścieżka zawiera szereg tzw. komunikatów MIDI, nakazujących w określonym momencie (każdy komunikat opatrzony jest kodem czasowym) zagrać dźwięk o określonej wysokości i czasie trwania, zmienić głośność danej ścieżki, zmienić tempo itd. Karta dźwiękowa odtwarza takie pliki wykorzystując brzmienia swojego wewnętrznego syntezatora zamiast reprodukować nagrany wcześniej oryginał. Plik taki może zawierać jedynie "czystą" muzykę - niemożliwe jest zawarcie w nim np. śpiewu, mowy czy efektów dźwiękowych (innych niż przewidziane w standardzie MIDI); do tego wszystkiego potrzebne byłoby wykorzystanie dźwięku spróbkowanego.

Konsekwencją założeń MIDI jest rzecz jasna fakt, że ten sam plik będzie brzmiał różnie na różnych kartach dźwiękowych. Najlepszą jakość dźwięku uzyskamy na kartach z tzw. syntezą wavetable, gdzie syntezator wykorzystuje zapisane w pamięci karty próbki dźwięku autentycznych instrumentów muzycznych, znacznie gorsze brzmienie (typowo "syntezatorowe") - na kartach ze "zwykłą" syntezą FM, gdzie dźwięki uzyskuje się poprzez składanie drgań o odpowiednio dobranych częstotliwościach (posiadacze tych ostatnich kart mogą natomiast wykorzystać odtwarzacze plików MIDI realizujące programową syntezę wavetable, jak np. TiMidity). Twórca pliku MIDI nie jest w stanie z góry przewidzieć, jak będzie brzmiało jego dzieło - może to określić jedynie w przybliżeniu.

Obecnie karty dźwiękowe korzystają z tabeli wavetable ładowanej do pamięci RAM komputera. Tabela wavetable może być instalowana wraz ze sterownikami karty dźwiękowej i wtedy można wybrać we właściwościach sterownika jej rozmiar, typowo 2, 4 lub 8 MB. Inną możliwością jest skorzystanie z gotowej tabeli instalowanej przez system Windows XP zawartej w pliku C:\Windows\System32\drivers\gm.dls o rozmiarze 3.28 MB. Rozwiązanie to wymaga dużej mocy obliczeniowej procesora, co obecnie nie jest problemem choć było w przeszłości, stąd wcześniejsze rozwiązanie polegające na wbudowaniu tabeli wavetable w kartę dźwiękową.

Rozszerzenia: *.MID, *.MIDI, *.RMI

Przed erą empetrójek powstały pliki MOD, które korzystają z próbek dźwięku zawartych w samym pliku. Drugą ich część stanowi zapis komunikatów podobny do MIDI. Gdyby nie rozwój mp3, mogłyby być obecnie dużo popularniejsze.

WAV


Format charakterystyczny dla platformy Windows, pozwala na zapis muzyki z jakością płyty kompaktowej (44.1 kHz, 16 bit, stereo). Pliki w tym formacie mają jednak jedną zasadniczą wadę - wielkość. Na 1 sekundę dźwięku potrzeba 172 kB. Z tego właśnie powodu format ten nie bardzo nadaje się do Internetu. Aby zmniejszyć objętość należy niestety zrezygnować z jakości, i tak można: zmniejszyć rozdzielczość do 8 bitów, zrezygnować z dźwięku stereo i zmniejszyć częstotliwość próbkowania np. do 22050 Hz lub nawet do 8000 Hz. Sekunda pliku zapisanego z minimalnymi ustawieniami (8 bit, mono, 8000 Hz) zajmuje 8 kB.

Aby nagrać dźwięk w formacie WAV pod Windows można posłużyć się systemowym rejestratorem dźwięku lub skorzystać z bardziej zaawansowanych programów jak np. Cool Edit.

Ścieżki skopiowane z audio CD daje się zapisać w tym formacie za pomocą programów zwanych ripper.

AIF, AIFF, AIFC, AIFR


Format popularny niegdyś na Macintoshach, obecnie rozpowszechniony również na pecetach. Pliki AIFF nie są kompresowane, chociaż istnieje format AIFF-C, który umożliwia kompresję nawet w stopniu 6:1.

Windows Media Player, QuickTime Player, DeliPlayer

MP2, MPG, MPE, MPEG, MPEG2


Pliki o dużym stopniu kompresji, poprzednicy standardu MP3. Zapis muzyki w tym formacie łączy się ze stratami jakości. Pliki o takich rozszerzeniach mogą zawierać także filmy komputerowe.

Windows Media Player, Deli Player, Winamp


MP3


Format wykorzystujący standard kompresji MPEG-1 Audio Layer 3.

Grupa Motion Picture Expert Group przy współpracy z Instytutem Frauenhofera z niemieckiego Erlangen, stworzyła algorytm kompresji i zapisu plików multimedialnych, ze szczególnym naciskiem na obraz (format MPEG). Jednak format ten można było wykorzystać również do zapisu audio i tak powstał format MP3. Największą zaletą tego zapisu jest możliwość skompresowania pliku typu WAV do MP3 nawet 12,13-krotnie, czyli dużo bardziej niż przy pomocy popularnych programów kompresujących (ZIP, RAR, ARJ).

Jakość bliska CD wymaga strumienia 128 Kbitów/sek, około 1 MB/minutę, spotykane zakresy od kilkunastu Kb/s (mowa, wiadomości strumieniowo, monofonicznie) do 320 Kb/s (wysoka jakość), stereofoniczne. Kodowanie VBR (Variable Bit Rate) daje nieco lepszą jakość przy tej samej wielkości plików.

Na popularność MP3 wpływa przede wszystkim wysoki stopień kompresji danych dźwiękowych, dzięki czemu pliki w tym formacie mają stosunkowo niewielkie rozmiary przy jednoczesnej wysokiej jakości brzmienia.

Pliki MP3 można odtwarzać przy pomocy różnych programów komputerowych (na przykład Winampa dla systemów Microsoft Windows, Macamp dla Macintosha, XMMS dla systemów uniksowych), natomiast do ich tworzenia służy na przykład program MP3 Compressor. Niektóre discmany potrafią odtwarzać płyty CD-R i CD-RW zawierające pliki MP3.

MP3 (ang. MPEG-1/2 Audio Layer-3) to format stratnej kompresji dźwięku opierający się na zmodyfikowanej dyskretnej transformacie cosinusowej i używający modelu psychoakustycznego. Format został stworzony we Fraunhofer-Institut für Integrierte Schaltungen. Przy tworzeniu jego pierwszej implementacji wykorzystywany był m.in. utwór Suzanne Vegi Tom's Diner w celu dostosowania kompresji do brzmienia ludzkiego głosu. Pliki w tym formacie posiadają rozszerzenie .mp3.

Kompresja


Pierwotnie do kompresji MP3 stosowano Constant Bit Rate (CBR), czyli do każdej ramki używano tej samej ilości bitów. Współcześnie używa się częściej Variable Bit Rate (VBR) charakteryzującego się zmienną przepływnością w wybranym przedziale podczas kodowania.

CBR dostępne w MP3:



  • 8 kb/s

  • 16 kb/s

  • 32 kb/s

  • 40 kb/s

  • 64 kb/s

  • 80 kb/s

  • 96 kb/s

  • 112 kb/s

  • 128 kb/s

  • 160 kb/s

  • 192 kb/s

  • 224 kb/s

  • 256 kb/s

  • 320 kb/s

Kanały


Kodowany dźwięk może posiadać postać zarówno jednokanałową (mono) jak i dwukanałową (stereo). Istnieje też format MP3 Surround (do zapisu dźwięku wielokanałowego 5.1) wstecznie zgodny z wcześniejszym standardem.

Stereo


Dla dźwięku stereofonicznego format MP3 posiada trzy tryby kompresji:

  • dual channel – w którym dźwięk jest zapisywany jako dwa odrębne kanały monofoniczne.

  • stereo (stereo mode 0) – w którym każda ramka zapisywana jest algorytmem left/right stereo.

  • joint stereo (stereo mode 1) – w którym dla każdej ramki wybierany jest najlepszy dla niej algorytm zapisu dźwięku stereo.

Stosowanymi w kompresji MP3 algorytmami kodowania ramki dźwięku stereofonicznego są:

  • left/right stereo (simple stereo, independent channel) – w którym dźwięk w kanałach prawym i lewym jest kodowany niezależnie, może jednak zmieniać się liczba bitów przeznaczonych na każdy z kanałów. Efektywny dla ramek, w których oba kanały różnią się w dużym stopniu.

  • middle/side stereo – w którym sygnał stereo kodowany jest w postaci pary wartości oznaczających sumę (L+R) oraz różnicę (L-R) kanałów. Efektywny dla ramek, w których oba kanały przyjmują podobne wartości.

  • intensity stereo – w którym sygnał stereo dla niektórych (głównie wysokich) częstotliwości kodowany jest jako monofoniczna wartość uzupełniona o wektor określający kierunek, z którego dochodzi dźwięk. W praktyce stosowany tylko przy niskiej przepływności (poniżej 80 kbps). Niektóre enkodery (np. LAME) w ogóle nie stosują tego algorytmu.

MP3 Surround


Rozszerzenie formatu mp3 stworzone przez twórców tego formatu pozwalające na zapis formatu 5.1. Zapisywane są dwa kanały tak jak we zwykłej mp3, a informacja potrzebna do wygenerowania dodatkowych kanałów jest zapisana w Tagach mp3. Dzięki temu rozwiązaniu mp3 można odtwarzać jako zwykłe stereo na odtwarzaczach sprzętowych. Zapisanie dodatkowych kanałów zajmuje mało miejsca.(ponieważ ich zapisywana jest informacja jak z dwóch kanałów wygenerować inne). Najprawdopodobniej to rozwiązanie zostanie skopiowanie do innych kompresorów dźwięku.

Programy odtwarzające


Najpopularniejszymi programami służącymi do odsłuchiwania plików MP3 są:

  • Winamp (Windows)

  • foobar2000 (Windows)

  • Windows Media Player (Windows, instalowany wraz z systemem)

  • iTunes firmy Apple (Mac OS i Windows).

  • XMMS (Linux)

  • Amarok (Linux)

  • Beep Media Player (Linux)


Mp3Pro


Technologia opracowana przez szwedzką firmę Coding Technologies, a licencjonowana przez Thomson Multimedia. W założeniach miała ona całkowicie zastąpić bardzo popularny format MP3.

Nowa technologia, w której powstał Mp3Pro, pozwala na zmniejszenie objętości plików dźwiękowych nawet o 50% w porównaniu z MP3. Utwór zakodowany w MP3Pro z gęstością 64 kb/s odpowiada teoretycznie jakością utworowi MP3 zakodowanemu z gęstością 128 kb/s. W praktyce jakość tych plików jest wyższa, gdyż MP3Pro nie usuwa dźwięków o najwyższych częstotliwościach, jak to robi MP3. Zmniejszenie wielkości plików ma przede wszystkim zaspokoić potrzeby użytkowników Internetu - o wiele łatwiej przesyłać je pocztą elektroniczną. Ponadto pozwala to na zmieszczenie dwukrotnie większej liczby plików w pamięci przenośnych odtwarzaczy. MP3Pro jest w pełni kompatybilne jedynie z odtwarzaczami MP3 produkowanymi przez firmę Thomson, przez co format ten jest mało rozpowszechniony. Opłaty za korzystanie z nowego formatu są niewiele wyższe niż za "zwykłe" MP3.

Do konwersji na format Mp3Pro przydatne są programy Adobe Audition, Nero Wave Editor oraz darmowy Thomson mp3Pro audio player.

MP4


Koder o nazwie MP4 to swego rodzaju oszustwo. Format ten oparty jest na technologii MPEG-4 i standardzie AAC, lecz stanowi zastrzeżone rozwiązanie firmowe. Twórca formatu MP4, firma Global Music One, zdecydował się nazwać swoje dzieło w taki sposób licząc zapewne na "podczepienie się" pod ewentualny sukces formatu MPEG-4.

Format zapewniający wysoką jakość i dobrą kompresję. Każdy plik MP4 zawiera w sobie odtwarzacz, więc użytkownik nie musi posiadać programu obsługującego ten format. Pliki MP4 ?opakowane w format DAP (Digital Audio Postcard, czyli cyfrowa pocztówka dźwiękowa) mogą być rozprowadzane za darmo przez właściciela praw autorskich i przekazywane dalej przez użytkowników.

Pliki takie mogą zawierać łącza do witryn internetowych udostępniających dodatkowe informacje lub umożliwiających zakup albumu. Pomimo swoich zalet, format DAP nie rozpowszechnia się zbyt szybko. Firma Global Music, wraz z kilkoma wytwórniami, które do niej dołączyły, regularnie publikuje nowe utwory w formacie MP4, jednak działalność ta ma stosunkowo ograniczony zakres, a liczba dostępnych utworów MP4 jest praktycznie niezauważalna w stosunku do liczby legalnych i nielegalnych plików w formacie MP3 i innych.

Wielu uważa, że Global Music, poprzez zawłaszczenie nazwy nowo powstającego, otwartego standardu, postąpiła nieuczciwie. W ten sposób naraziła się na krytykę ze strony użytkowników innych formatów. Otwarte standardy, takie jak MPEG-4, zapewniają w pewnej mierze możliwość przenośności i współpracy różnych rozwiązań, zaś standardy zamknięte mają za zadanie jedynie opanować fragment rynku, przynosząc zysk pojedynczej firmie. Udostępnione w Internecie zamknięte rozwiązanie nie cieszą się więc wielkim zainteresowaniem. Poza tym, Global Music jak na razie woli współpracować bezpośrednio z wytwórniami i dotychczas nie udostępniła wersji kodera przeznaczonej dla zwykłych użytkowników. Powyższe cechy formatu MP4 przesądzają o jego przegranej w rywalizacji z MP3.


Ogg


Ogg to format kontenera strumieni danych, popularyzowany przez fundację Xiph.org, stworzony by wspierać inicjatywy związane z rozwojem wolnego oprogramowania do kodowania i dekodowania multimediów. Jest to także rodzina kodeków: zarówno stratnych, ze Speeksem i najbardziej znanym (Ogg) Vorbis, jak i bezstratnych, z formatami Squish i FLAC.

QuickTime Audio


Pomimo długiej obecności na rynku QuickTime nie zdobył większej popularności jako format rozpowszechniania plików dźwiękowych. Co więcej, niewielu użytkowników wie, iż formatu QuickTime można używać także do tworzenia plików zawierających wyłącznie dźwięk. Z tego względu w Internecie bardzo ciężko znaleźć takie pliki. Wynika to zapewne z faktu, iż system ten nie oferuje możliwości ripowania płyt CDAudio, co utrudnia tworzenie plików dźwiękowych.

  • .qt

W takiej sytuacji warto jedynie wspomnieć, że do kompresji dźwięku użyto kodera QDesign, który charakteryzuje się bardzo dobrym współczynnikiem kompresji.

RealAudio


Format RealAudio został przedstawiony w 1995 roku przez firmę RealNetworks specjalnie z myślą o Internecie. Obecnie jest on standardem strumieniowego przesyłania dźwięku przez Internet. Do odbioru jego zawartości wystarczy modem 28,8 Kbps, ale możliwe jest także przesyłanie dźwięku o bardzo wysokiej jakości dla odpowiednio szybkich łącz.

Przy odpowiednim oprogramowaniu system RealAudio pozwala na nadawanie audycji na żywo. Jakość dźwięku zależy głównie od możliwości naszego modemu i łącza. Kłopoty te można jednak ominąć wybierając podczas zapisu pliku Real Audio docelową prędkość transmisji. RealSystem G2, ma możliwość przesyłania również plików w innych formatach.

Obecne wersje kodera Real mogą generować pliki o wysokiej jakości przy praktycznie wszystkich gęstościach strumienia bitowego a jakość porównywalna z radiem FM osiągalna jest już przy gęstości 20 do 34 kb/s (przy wyższych gęstościach strumienia bitowego dokładne testy wykazują niewielkie zniekształcenia wysokich tonów).

Poza wysoką jakością kompresji, koder Real charakteryzuje się dużą szybkością działania. Być może jednym z najważniejszych powodów, dla których produkt firmy Real nie osiągnął popularności MP3, jest fakt, iż MP3 postrzegany jest głównie jako format plikowy, umożliwiający tworzenie i przechowywanie kolekcji utworów, podczas gdy Real kształtował swój obraz jako firmy zajmującej się głównie transmisją strumieniową.

Pliki RealAudio o jakości podobnej do MP3 są mniejsze i od razu gotowe do transmisji strumieniowej, jednak koszt oprogramowania serwera jest zbyt duży dla przeciętnego użytkownika co czyni tą cechę nieistotną.

Pliki *.ra *.rm możemy udostępnić do pobrania zamieszczając odsyłacz bezpośrednio do niego na stronie WWW. Poza innym formatem pliku, sytuacja ta nie różni się niczym od występującej w przypadku plików WAV czy MP3 - plik zostanie pobrany przez przeglądarkę na dysk, a następnie odtworzony przez odtwarzacz RealPlayer.

Możemy jednak go także strumieniować - wówczas na stronie umieścimy tylko odsyłacz do metapliku (tradycyjnie metapliki RealMedia mają rozszerzenie *.ram), a w metapliku wpiszemy adres właściwego pliku *.rm. RealPlayer będzie wówczas odtwarzał plik w miarę pobierania danych z sieci.

WMA (Windows Media Audio)


Windows Media Audio został stworzony przez firmę Microsoft.

Użytkownicy zauważyli, że o ile WMA znakomicie radzi sobie z kompresją muzyki, to kompresja nagranej mowy pozostawia wiele do życzenia. Wprawdzie wiele z tych wad wyeliminowano lub chociaż poprawiono w najnowszej wersji kodeka Windows Media Audio 8 ale jakościowo nadal ustępuje on MP3.

Zgodnie z zapewnieniem producenta funkcja kodowania Windows Media Audio 8 dostarcza dźwięk o jakości jak z płyty CD i rozmiarze dwukrotnie mniejszym niż pliki w formacie MP3, dzięki czemu podwaja ilość miejsca przeznaczonego na przechowywanie muzyki i skraca czas pobierania muzyki cyfrowej o jakości płyt CD.

Atutem tego standardu jest strumieniowa obsługa plików i łatwa integracja ze środowiskiem XML. Najczęściej dane zakodowane za pomocą WMA umieszcza się w kontenerze ASF.


Beatnik


Beatnik, firmy Headspace, obsługuje format RMF, czyli Rich Music Format. Jest to zaawansowana technika, pozwalająca uzyskać bardzo bogate brzmienie, przy niewielkiej objętości pliku.

Liquid Audio


To szyfrowany format plików muzycznych zaproponowany przez wytwórnię EMI. Standard ten, jak twierdzą twórcy, ma zabezpieczać utwór przed nielegalnym kopiowaniem. Aktualnie format jest na dobrej drodze do sukcesu - w Internecie istnieje już firmowy sklep Liquid, w którym można kupić wybrane utwory, a niektórych posłuchać bezpłatnie.

Jakością jest zbliżony do mp3, a wielkie koncerny typu BMG Entertainment czy Universal Music skłaniają się do sprzedaży utworów swoich artystów właśnie w Liquid Audio.

Aby móc skorzystać z tej oferty, trzeba zaopatrzyć się w firmowy odtwarzacz Liquid Player i zarejestrować się na stronie producenta.

a2bmusic


Firma AT&T Labs sprzedaje muzykę w formacie a2bmusic. Tak jak w Liquid Audio dźwięk przesyłany poprzez sieć jest zaszyfrowany, co ma uniemożliwić nielegalne kopiowanie, jakość zaś dźwięku jest porównywalna z muzyką z płyt CD.

Sam plik a2bmusic zajmuje mniej miejsca niż mp3. Przy zakupie utworu dostaje się także okładkę płyty i teksty. Dotychczas w tym formacie jest kilkaset utworów, co nie sprzyja jego popularności, na dodatek nie można wśród nich znaleźć znanych nazwisk i tytułów.



Mimo nowości formatów, można już znaleźć programy konwertujące pliki a2bmusic oraz Liquid Audio na WAV. A dalej droga do mp3 jest dziecinnie prosta.
Źródło: Wikipedia


©absta.pl 2016
wyślij wiadomość

    Strona główna