Teknillinen Korkeakoulu, Otaniemi

Sähkö- ja Tietoliikennetekniikan osasto

 

S-38.116 Teletietotekniikka

Seminaariesitelmä 5.3.1996

 

 

 

 

 

 

 

Antti Partanen

Antti.Partanen@hut.fi

41767F, SN

 


1 MPEG – Mikä, Miksi, Milloin ? Siirry sille sivulle tästä!

2 Digitaalisen äänenkoodauksen perusta Siirry sille sivulle tästä!

3 MPEG-audiostandardit Siirry sille sivulle tästä!

3.1 MPEG-1 Siirry sille sivulle tästä!

3.2 MPEG-2 Siirry sille sivulle tästä!

4 MPEG-audiostandardien rakenne Siirry sille sivulle tästä!

5 MPEG-koodauksen rakenne Siirry sille sivulle tästä!

5.1 Enkooderi Siirry sille sivulle tästä!

5.2 Dekooderi Siirry sille sivulle tästä!

6 MPEG-audiokerrosten (layers) rakenne Siirry sille sivulle tästä!

6.1 MPEG - Layer 3 Siirry sille sivulle tästä!

6.2 Layer 3 -sovellukset Siirry sille sivulle tästä!

7 MPEG-4 Siirry sille sivulle tästä!

8 YHTEENVETO Siirry sille sivulle tästä!

9 LÄHDELUETTELO Siirry sille sivulle tästä!


 

  1. MPEG – Mikä, Miksi, Milloin ?
  2.  

    MPEG on lyhenne sanoista : Moving Pictures Experts Group

     

    MPEG on ISO:n (International Standards Organisation), eli kansainvälisen standardoimisliiton komitea, joka työskentelee kehittääkseen standardeja liikkuvan kuvan sekä audion pakkaamiseen. Komitea perustettiin vuonna 1988, jolloin komiteassa oli mukana 25 asiantuntijaa. Nyt sen laajuus on jo yli 300 henkilöä, jotka edustavat alan yrityksiä ja yhteisöjä yli 20:stä maasta. Vaikkakin komitean alkuperäisenä tarkoituksena ol i k

     

    MPEG-komitea on ottanut strategiakseen, kuten standardoinnissa yleensäkin, luoda standardeja askel kerrallaan. Aina kun on siirrytty kehityksessä askel ylöspäin, on MPEG julkaissut uuden standardin. Nämä se on nimennyt yksinkertaisesti numeroimalla ne.

     

    Taulukko1. MPEG-standardit

    MPEG-1

    Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to about 1.5 Mbit/s (valmistui 10/92)

    MPEG-2

    Generic Coding of Moving Pictures and Associated Audio

    (valmistui 11/94)

    MPEG-3

    Suunniteltiin HDTV-sovelluksiin, mutta on nyttemmin sisällytetty MPEG-2:een. Ei siis enää olemassa.

    MPEG-4

    Very Low Bitrate Audio-Visual Coding (MPEG-komitean päätehtävä nyt, kehitellään vielä, mutta periaattelliset speksit valmistuivat 1995)

     

    MPEG-1 ja 2 ovat täysin valmiita standardeja, joita useimmat äänen/kuvan pakkausta tarvitsevat sovellukset käyttävät. Molemmat standardit koostuvat neljästä pääosasta:

     

    Taulukko 2. MPEG-1&2 –standardien 4 pääosaa

    System

    Määrittelee audio- ja videosignaalin synkronoinnin ja multipleksauksen

    Video

    Määrittelee videosignaalin kompression

    Audio

    Määrittelee audiosignaalin kompression

    Testaus

    Määrittelee koodekin bittivuon ominaisuudet ja dekoodausprosessin

     

  3. Digitaalisen äänenkoodauksen perusta
  4.  

    Digitaalitekniikalla pystytään koodaamaan virheettömästi koko äänikaista, mutta sen laadukas toteuttaminen vaatii suuren bittinopeuden. Studiokäytössä yleisessä DAT-järjestelm&aum l;ssä (Digital Audio Tape) käytetään 48 kHz:n näytteenottotaajuutta sekä lineaarisesti 16:sta bitillä kvantisoitua PCM-signaalia (Pulse Code Modulation), joka stereona toteutettuna tarvitsee bittinopeudeksi molemmille kan

     

    Perinteisillä koodausmetodeilla päästään noin puoleen tästä, mutta saavutettu hyöty on vasta liian pieni. Audiosignaalissa on kuitenkin runsaasti turhaa informaatiota. Tätä turhaa info rmaatiota pystytään karsimaan poistamalla signaalista komponentit joita ihmiskorva ei kuule, sekä usein toistuvat komponentit. Nämä perustuvat säästö- eli reduktiokoodaukseen, jossa hyödynnetä&aum l;n jolla taasen saadaan koodausbitt i

     

    Lisäksi hyödynnetään kuulokynnystä, joka on äänentaso, jolla ihminen pystyy kuulemaan tietyntaajuisen äänen. Ihmisen kuulokynnys on parhaimmillaan 0 dB:tä 2kHz:n taajuudella, se kä erittäin alhainen 1-5 kHz:n taajuusalueella, jolla alueella kuulokynnyksestä ei ole hyötyä äänenkoodauksessa. Mutta koska korkeammilla äänillä (>16kHz) kuulokynnys nousee jyrkästi, käyte t&a

     

    Edellisten lisäksi voidaan vielä mainita kriittinen kaista. Ihmiskorva analysoi kuulemaansa ääntä siten, että tietyn kriittisen kaistan sisälle osuvat taajuudet analysoidaan yhtenä kokona isuutena. Tämä johtuu pelkästään ihmiskorvan fyysisistä ominaisuuksista. MPEG-koodauksessa signaali jaetaan lineaarisesti taajuuskaistoihin, jolloin saadaan tilanne, jossa yksittäisen kaistan leveys saadaan pidetty&aum l;

     

  5. MPEG-audiostandardit
  6.  

    1. MPEG-1
    2.  

      Ensimmäinen, mutta ei suinkaan vähäpätöisin standardi on MPEG-1, joka sai kansainvälisen standardin aseman lokakuussa 1992. Siinä on viisi osaa, joista neljä on MPEG-1 :lle ja 2:lle yhteisiä ;. (Taulukko 2.) Viides osa on ohjelmistosimulaatio, joka on raportti kolmen ensimmäisen osan teknisestä ohjelmistorakenteesta. Näytteenottotaajuudet MPEG-1 :ssä ovat 32, 44.1 ja 48 kHz. MPEG-1 standardi on tehty pää asi

       

       

       

    3. MPEG-2
    4.  

      Marraskuussa 1994 valmistui MPEG-1:sen seuraaja, MPEG-2. Tämän standardin tarkoitus ei siis ole korvata 1:stä, vaan täydentää sitä. Tästä syystä MPEG-2:n yhdeksästä osasta vi isi ensimmäistä ovat lähes samoja kuin MPEG-1:ssä. Joitakin parannuksia ja muutoksia on toki tehty. MPEG-1:ssä näytteenottotaajuuksista pienin on 32 kHz, jolla ei voida saavuttaa hyvää äänenlaatua alhais ill l;lle. Tätä vaatimusta

      Lisäksi on optionaalinen lisäkanava, joka on tarkoitettu subwoofer-informaatiolle eli alhaisimmille taajuuksille. Tämä kanava on nimetty LFE:ksi (Low Frequency Enhancement). Standardissa on myös lisäys se itsemän itsenäisen kanavan järjestelmälle, jolloin saadaan lisää sovelluksia standardin piiriin, pääkäyttökohteena on kuitenkin monikieliaudiodatan tallennus. MPEG-2 ja MPEG-1 on toteutettu siten, ett&a uml

     


    Kuva 1. MPEG-audiostandardien rakenne



    1. MPEG-audiostandardien rakenne

     

    Audio-osa eli MPEG-1&2 -standardien osa numero 3, määrittelee MPEG-audiokoodauksen perusrakenteen, joka koostuu kolmesta kerroksesta. Näitä kutsutaan myös kolmeksi algoritmiksi, sekä kolmeksi layer iksi, joista viimeinen on yleistynyt kaikissa kielissä, ja on käytetympi nimi kuin kerros. Layerit ovat tehokkuusjärjestyksessä, eli Layer 3 on tehokkain ja Layer 1 taasen yksinkertaisin. MPEG-standardissa on jokaiselle layerille m& ia vievä komponentti. Kerro k

     

    MPEG-koodauksen perustana on MUSICAM-koodaus, joka on algoritmi, joka kehitettiin ennen MPEG-standardeja. Algoritmi oli siinämäärin hyvin tehty, että se otettiin käyttöön MPEG:ssä. MUSICAM:sta t ehtiin yksinkertaistettu versio, joka lanseerattiin käyttöön Layer 1 :ssä. Huonona puolena 1:ssä on että se tarvitsee varsin suuren bittinopeuden, eikä siis pakkaa audio-dataa tehokkaasti. Layer 2 on enemmänkin MU SIC reissä sallitut bittinopeud e

     

    Taulukko 3. MPEG-1 kerrosten ominaisuudet

    Kerros

    Pakkauskerroin

    Bittinopeus/kanava

    Yleisin bittinopeus/kanava

    Layer 1

    1:3 … 1:4

    32 … 224 kbit/s

    192 kbit/s

    Layer 2

    1:4 … 1:6

    32 … 192 kbit/s

    128 kbit/s

    Layer 3

    1:8 … 1:12

    32 … 160 kbit/s

    64 kbit/s

     

     

    Lisäksi on määritelty kanavien toimintamoodit:

     

    1. MPEG-koodauksen rakenne
    2.  

      1. Enkooderi
      2.  

        MPEG-enkoodauksen perusrakenne on esitetty Kuvassa 1. Ensimmäisessä vaiheessa PCM-audiosignaali jaetaan alikaistoihin, kunhan se ensin on muutetaan taajuusjakoiseksi käyttämällä suodinpankkia. Seur aavassa vaiheessa muodostetaan psykoakustinen malli, jossa käytetään apuna nopeaa Fourier-muunnosta (FFT, Fast Fourier Transform). Psykoakustinen malli laskee tehotasot ja määrittelee näitten avulla peittoäänten t eho

         


        Kuva 2. MPEG-1-enkooderi



         

      3. Dekooderi

       

      MPEG-dekooderi on esitetty Kuvassa 3. Dekooderi on huomattavasti yksinkertaisempi kuin enkooderi. Senhän ei tarvitse muodostaa mitään malleja, eikä suorittaa ylimääräisiä laskutoimituksia . Dekooderi ainoastaan purkaa paketit, rakentaa kvantisoidun spektrin ja muuntaa taajuusjakoisen koodin aikatasoon.

       


      Kuva 3. MPEG-dekooderi



       

    3. MPEG-audiokerrosten (layers) rakenne
    4.  

      MPEG-komitea on määritellyt, eli tässä tapauksessa jaotellut, audiokoodauksen kolmeen kerrokseen, eli jo mainittuihin kolmeen layeriin. Enkooderin rakenne monimutkaistuu huomattavasti siirryttäessä Layer 2 :sta kolmanteen. Tämä on suora seuraus siitä, että pakkauskertoimet suurenevat huomattavasti juuri tällä askeleella. Kaikilla kerroksilla on sama perusrakenne, enkooderi analysoi datan, muodostaa mallin ja koodaa datan. D eko

      Koodauksessa syntyy paketteja, jotka sisältävät eri määrän näytteitä audiosignaalista, riippuen layerista. 1-kerroksen paketissa on 384 näytettä. 2- ja 3-kerroksilla on 1152 näyte ttä yhdessä paketissa. Tässä on siis huomattava ero. Jokaisen paketin alussa on otsikko- eli header-kenttä, joka on 32 bittinen. Otsikkokenttä pitää huolta synkronoinnista ja kuljettaa koodausparametrit, joita on: n&

       

      Header

      32-bit

      CRC

      16-bit

      Audio enkoodattu data

      Käyttäjän lisäämä informaatio

      (Kokoa ei määritelty etukäteen)

      Kuva 4. MPEG-audiopaketin rakenne

       

      Layer-1:stä käytetään pääasiassa DCC-kaseteissa (Digital Compact Cassette), jossa järjestelmässä käytetään maksimibittitasoa eli 192 kbit/s/kanava. Layer-2 on erään lainen kompromissimalli. Se sijoittuu kahden enemmän käytetyn layerin väliin, eikä sille tehtyjä sovelluksia ole paljoa. Layer 3:sta enemmän seuraavassa…

       

      1. MPEG - Layer 3
      2.  

        Layer 3 on tämän hetken audiokoodausmaailman ehdoton ykkönen. Sillä saavutetaan erittäin hyvä äänenlaatu, vaikkakin se on tiiviisti pakattua dataa. Pakkauskerroin, jolla vielä saadaan s&aum l;ilytettyä CD-tasoinen ääni, on 1:12. Tällöin yksi minuutti, joka pakkaamattomana vie 12 Mb, vie Layer-3-pakattuna, 128kbit/s bittitasolla, 1 Mb! Layer 3 on määritelty sekä MPEG-1:ssä että MPEG-2:ssa. K un ml;n Huffman-koodausta, jolla ta a

        (2 * 160 kbit/s /48 kHz) * 2 * 576 näytettä = 7680 bittiä.

         

      3. Layer 3 -sovellukset

     

    Layer 3 soveltuu korkean äänenlaatunsa puolesta kaikkeen musiikin tallennukseen, ja kohtalaisen alhaisten bittinopeuksien vuoksi myös audiodatan siirtoon. Esimerkkeinä voitaneen mainita:

    PC-koneisiin on suunniteltu ohjelmistoja, joilla voidaan en- ja dekoodata Layer 3 – dataa, sekä soittaa mp3-musiikkia, joksi Layer 3 –musiikkia maailmanlaajuisesti nimitetään, reaaliajassa. Real-Time-Player eli reaaliai kainen soittoaplikaatio on ollut erittäin vaikea kehittää. Siitä johtuen ei markkinoilla ole kuin kaksi Windows-ympäristöön suunniteltua playeriä, eikä enempää ole muillekaan käyttöjä rje

    Molemmat playerit on saatavilla Shareware-versioina Internetistä, mutta molemmissa on tällöin soittorajoitus: Winplay: 20s ja MuseArc: 1min . Rekisteröimällä ohjelman (maksaa rahaa) saa täyden toimiv uuden.

     

    1. MPEG-4
    2.  

      MPEG-4 on uusin stardointivaiheessa oleva komitean projekti, joka on tarkoitettu erittäin matalia bittitaajuuksia tarvitseville järjestelmille. Suurin muutos on interaktiivisuus. Vastaanottaja voi kesken tiedonsiirron muoka ta esimerkiksi bittinopeutta ja/tai muuttaa stereo-signaalin mono-signaaliksi, jolloin bittinopeus kasvaa.

       

      Audio-osan perustavoitteena on multimedia-sovellukset, kuten video/internet-puhelimet. MPEG-4-audiokoodaus jaetaan kahteen osaan, synteettiseen ja luonnolliseen koodaukseen. Standardi tukee erilaisia audioformaatteja, kuten näyt teenottotaajuus, amplitudiresoluutio, kvantisoinnin luonne sekä kanavien lukumäärä. Synteettinen audio on tulevaisuuden alaa, siinä määriteltynä MPEG-4:ssä on synteettinen puhedata, 3D-kuuleminen ja ä&au ml;

       

    3. Yhteenveto
    4.  

      MPEG-standardointikomitea tuli tarpeeseen, kuvan ja äänen koodaus on tulevaisuutta, ja tulevaisuuteen pitää satsata. Yritykset ja yhteisöt ovatkin osoittaneet kiinnostuksensa asiaa kohtaan. Eikä siinä ; kaikki, ihmiset alkavat ottaa asian omakseen, jolloin markkinat kasvavat nopeasti ja laitteet halpenevat samaa tahtia, ainakin toivottavasti. MPEG Layer 3 on tervetullut lisä Internetissä tapahtuvan audiodatan siirrossa. Nyt pystytä&aum l;n l; esimerkiksi äänitys s

       

    5. Lähdeluettelo

     

    1. http://www.cselt.stet.it/mpeg/faq-audio.html
    2. http://www.powerpoweb.de/mpeg/mpegfaq/mpe632.html
    3. http://www.philips.com/sv/nevtech/mpeg/tecnolgy.html
    4. http://www.iis.fhg.de/departs/amm/layer3/sw/index.html
    5. http://www.cselt.stet.it/mpeg/mpeg_2.html
    6. http://www.cselt.stet.it/mpeg/faq_mpeg-2.html
    7. http://www.powerpoweb.de/mpeg/mpegfaq/mpe322.html
    8. http://www.cselt.stet.it/mpeg/documents/mpeg-2_audio_rev.html
    9. http://www.cselt.stet.it/mpeg/mpeg_2.html
    10. http://www.powerpoweb.de/mpeg/mpegfaq/mpe1014.html
    11. MPEG-audiokoodaus: Sami Lemmetty, TKK
    12. MPEG-audiokoodauksen kehitys: Petri Talala, TKK