Data compression

posted in: Articles | 0

ImageEdit

Főcikk: Image compression

Entropy coding eredetileg az 1940-es években a bevezetése Shannon-Fano kódolás, az alapja Huffman kódolás, amely 1950-ben alakult. A transzformációs kódolás az 1960-as évek végére nyúlik vissza, a fast Fourier transform (FFT) kódolás bevezetésével 1968-ban, a Hadamard transzformációval pedig 1969-ben.

fontos képkompressziós technika a diszkrét koszinusz transzformáció (DCT), az 1970-es évek elején kifejlesztett technika., A DCT a JPEG, egy veszteséges tömörítési formátum alapja, amelyet a Joint Photographic Experts Group (JPEG) vezetett be 1992-ben. A JPEG jelentősen csökkenti a képminőség viszonylag kis csökkenésének költségén a kép megjelenítéséhez szükséges adatok mennyiségét, és a legszélesebb körben használt képfájl formátumává vált. Rendkívül hatékony DCT-alapú tömörítési algoritmusa nagymértékben felelős volt a digitális képek és a digitális fényképek széles körű elterjedéséért.

Lempel-Ziv-Welch (LZW) egy veszteségmentes tömörítési algoritmus, amelyet 1984-ben fejlesztettek ki. Ezt az 1987-ben bevezetett GIF formátumban használják., DEFLATE, egy veszteségmentes tömörítési algoritmus 1996-ban meghatározott, használják a hordozható hálózati grafika (PNG) formátumban.

Wavelet tömörítés, a wavelet használata a kép tömörítésében, a DCT kódolás fejlesztése után kezdődött. A JPEG 2000 szabványt 2000-ben vezették be. Az eredeti JPEG formátum által használt DCT algoritmussal ellentétben a JPEG 2000 ehelyett diszkrét wavelet transform (DWT) algoritmusokat használ. A JPEG 2000 technológiát, amely magában foglalja a Motion JPEG 2000 kiterjesztést, 2004-ben választották a digitális mozi videó kódolási szabványának.,

AudioEdit

Lásd még: Audio kódolási formátum és Audio codec

Audio adattömörítés, nem tévesztendő össze a dinamikus tartomány tömörítéssel, képes csökkenteni az audio adatok átviteli sávszélességét és tárolási követelményeit. Audio tömörítési algoritmusok vannak megvalósítva szoftver audio CODEC. Mind a veszteséges, mind a veszteségmentes tömörítésben az információ redundancia csökken, olyan módszerekkel, mint a kódolás, a kvantálás diszkrét koszinusz transzformáció és a lineáris előrejelzés, hogy csökkentsék a tömörítetlen adatok ábrázolására használt információk mennyiségét.,

veszteséges audio tömörítési algoritmusok nagyobb tömörítést, és használják számos audio alkalmazások, beleértve Vorbis MP3. Ezek az algoritmusok szinte mind a pszichoakusztikára támaszkodnak, hogy kiküszöböljék vagy csökkentsék a kevésbé hallható hangok hűségét, ezáltal csökkentve a tároláshoz vagy továbbításhoz szükséges helyet.

a hangminőség elvesztése és az átviteli vagy tárolási méret közötti elfogadható kompromisszum az alkalmazástól függ., Például egy 640 MB-os kompakt lemez (CD) körülbelül egy óra tömörítetlen nagy hűségű zenét, kevesebb, mint 2 óra zenét veszteségmentesen tömörít, vagy 7 óra zenét tömörít MP3 formátumban közepes bitsebességgel. A digitális hangrögzítő általában körülbelül 200 óra világosan érthető beszédet tárolhat 640 MB-ban.

a veszteségmentes audio tömörítés olyan digitális adatok ábrázolását eredményezi, amelyek dekódolhatók az eredeti pontos digitális másolatához. A tömörítési arányok az eredeti méret 50-60% – a körül vannak, ami hasonló a generikus veszteségmentes adattömörítéshez., A veszteségmentes codec-ek görbe illesztést vagy lineáris előrejelzést használnak a jel becslésének alapjaként. A becslést leíró paraméterek, valamint a becslés és a tényleges jel közötti különbség külön kódolva van.

számos veszteségmentes audio tömörítési formátum létezik. Lásd listája veszteségmentes kodekek egy lista. Egyes formátumok különböző rendszerekhez kapcsolódnak, mint például a Direct Stream Transfer, A Super Audio CD és a Meridian Lossless Packing, a DVD-Audio, A Dolby TrueHD, a Blu-ray és a HD DVD.,

néhány audio fájlformátum veszteséges formátum és veszteségmentes korrekció kombinációját tartalmazza; ez lehetővé teszi a korrekció sztrippelését, hogy könnyen veszteséges fájlt kapjon. Ilyen formátumok közé tartozik az MPEG-4 SLS (méretezhető veszteségmentes), a WavPack, valamint az OptimFROG DualStream.

amikor az audiofájlokat további tömörítéssel vagy szerkesztéssel kell feldolgozni, kívánatos változatlan eredetiből dolgozni (tömörítetlen vagy veszteségmentesen tömörítve)., A veszteségesen tömörített fájl valamilyen célra történő feldolgozása általában olyan végeredményt eredményez, amely alacsonyabb, mint ugyanazon tömörített fájl létrehozása tömörítetlen eredetiből. A hangszerkesztés vagy keverés mellett a veszteségmentes audio tömörítést gyakran használják levéltári tároláshoz vagy mestermásolatokként.

Lossy audio compressionEdit

összehasonlítása spektrogramok audio tömörítetlen formátumban és több veszteséges formátumban., A veszteséges spektrogramok sávot mutatnaka magasabb frekvenciák korlátozása, a veszteséges audio tömörítéshez kapcsolódó közös technika.

a veszteséges audio tömörítést számos alkalmazásban használják. Amellett, hogy önálló audio-csak alkalmazások fájllejátszás MP3 lejátszók vagy számítógépek, digitálisan tömörített audio stream használják a legtöbb videó DVD-k, digitális televízió, streaming média az Interneten, műholdas és kábel rádió, és egyre inkább a földi rádióadások., A veszteséges tömörítés általában sokkal nagyobb tömörítést eredményez, mint a veszteségmentes tömörítés, a pszichoakusztikus optimalizáláson alapuló kevésbé kritikus adatok eldobásával.

A pszichoakusztika felismeri, hogy az audio streamben nem minden adat érzékelhető az emberi hallórendszerben. A legtöbb veszteséges tömörítés csökkenti a redundanciát azáltal, hogy először azonosítja az észlelés szempontjából irreleváns hangokat, vagyis olyan hangokat, amelyeket nagyon nehéz hallani. A tipikus példák közé tartoznak a magas frekvenciák vagy hangok, amelyek a hangosabb hangokkal egyidejűleg fordulnak elő. Ezek az irreleváns hangok csökkentett pontossággal vannak kódolva, vagy egyáltalán nem.,

a veszteséges algoritmusok jellege miatt a hangminőség digitális generációs veszteséget szenved, amikor egy fájlt dekompresszálnak és újra tömörítenek. Ez a veszteséges tömörítést alkalmatlanná teszi a közbenső eredmények tárolására professzionális hangtechnikai alkalmazásokban, mint például a hangszerkesztés vagy a többsávos felvétel. A veszteséges formátumok, például az MP3 azonban nagyon népszerűek a végfelhasználók körében, mivel a fájl mérete az eredeti méret 5-20% – ára csökken, egy megabájt pedig körülbelül egy percnyi zenét képes tárolni megfelelő minőségben.,

Kódolás methodsEdit

ahhoz, Hogy meghatározzák, milyen információkat az audio jel perceptually lényegtelen, a legtöbb veszteséges tömörítési algoritmusok használata átalakítja, mint a módosított diszkrét koszinusz transzformáció (MDCT) átalakítani idő domain mintát hullámformák egy átalakítani domain, jellemzően a frekvencia tartományban. Miután átalakult, komponens frekvenciák lehet rangsorolni szerint mennyire hallható vannak., A spektrális komponensek hallhatóságát a hallás abszolút küszöbértékével és az egyidejű maszkolás elveivel—az a jelenség, amelyben egy jelet egy másik, frekvenciával elválasztott jel elfed—és bizonyos esetekben időbeli maszkolás -, ahol a jelet egy másik, idővel elválasztott jel maszkolja. Egyenlő hangosság kontúrok is fel lehet használni, hogy súlyozza a perceptuális fontosságát alkatrészek. Az ilyen hatásokat tartalmazó emberi fül-agy kombináció modelljeit gyakran pszichoakusztikus modelleknek nevezik.,

más típusú veszteséges Kompresszorok, mint például a beszédhez használt lineáris prediktív kódolás (LPC), forrás alapú kódolók. Az LPC az emberi hangrendszer modelljét használja a beszédhangok elemzésére, valamint a modell által használt paraméterek elemzésére, hogy pillanatról pillanatra elkészítsék őket. Ezek a változó paraméterek továbbításra vagy tárolásra kerülnek, és a dekóder egy másik modelljének meghajtására szolgálnak, amely reprodukálja a hangot.

A veszteséges formátumokat gyakran használják streaming audio vagy interaktív kommunikáció terjesztésére (például mobiltelefon-hálózatokban)., Az ilyen alkalmazásokban az adatokat az adatfolyamok formájában kell kibontani, nem pedig a teljes adatfolyam továbbítása után. Nem minden audio kodek használható streaming alkalmazásokhoz.

a késleltetést az adatok kódolására és dekódolására használt módszerek vezetik be. Egyes kodekekek elemzik az adatok hosszabb szegmensét, az úgynevezett keretet a hatékonyság optimalizálása érdekében, majd kódolják oly módon, hogy a dekódoláshoz egyszerre nagyobb adatszegmensre van szükség., A kódolási algoritmus velejárója kritikus lehet; például ha kétirányú adatátvitel történik, például telefonbeszélgetéssel, a jelentős késések súlyosan ronthatják az észlelt minőséget.

a tömörítés sebességével ellentétben, amely arányos az algoritmus által megkövetelt műveletek számával, itt a késleltetés a minták számát jelenti, amelyeket elemezni kell egy hangblokk feldolgozása előtt. A minimális esetben a késleltetés nulla minta (például ha a kódoló / dekóder egyszerűen csökkenti a jel kvantálásához használt bitek számát)., Az olyan idődomain algoritmusok, mint például az LPC, gyakran alacsony késleltetéssel is rendelkeznek, ezért népszerűségük a telefonálás beszédkódolásában. Az olyan algoritmusokban, mint az MP3, azonban nagyszámú mintát kell elemezni egy pszichoakusztikus modell megvalósításához a frekvenciatartományban, a késleltetés pedig 23 ms (46 ms a kétirányú kommunikációhoz).

beszéd kódolásszerkesztés

A Beszédkódolás az audio adatok tömörítésének fontos kategóriája. Az emberi fül hallásának becslésére használt perceptuális modellek általában kissé eltérnek a zenéhez használt modellektől., Az emberi hang hangjainak közvetítéséhez szükséges frekvenciatartomány általában sokkal keskenyebb, mint a zenéhez szükséges, és a hang általában kevésbé összetett. Ennek eredményeként a beszédet magas minőségben lehet kódolni viszonylag alacsony bitsebességgel.

Ha a tömörítendő adatok analógok (például az idővel változó feszültség), kvantálást alkalmaznak számokká (általában egész számokká) történő digitalizálására. Ezt Analóg-Digitális (a/D) konverziónak nevezik., Ha a kvantálás által generált egész számok egyenként 8 bitesek, akkor az analóg jel teljes tartománya 256 intervallumra oszlik, az intervallumon belüli összes jelérték pedig ugyanarra a számra van kvantálva. Ha 16 bites egész számok keletkeznek, akkor az analóg jel tartománya 65 536 intervallumra oszlik.

Ez a kapcsolat szemlélteti a kompromisszumot a nagy felbontású (nagyszámú analóg intervallum) és a nagy tömörítési (kis egész számok generált) között. A kvantálás ezen alkalmazását számos beszédkompressziós módszer használja., Ez általában két megközelítés kombinációjával valósul meg:

  • csak olyan hangokat kódol, amelyeket egyetlen emberi hang készíthet.
  • több adat eldobása a jelmegőrzésben éppen annyira, hogy az emberi hallás teljes frekvenciatartománya helyett “érthető” hangot rekonstruáljon.

talán a beszédkódolásban használt legkorábbi algoritmusok (és általában az audioadatok tömörítése) az a-law algoritmus és a μ-law algoritmus voltak.,

HistoryEdit

Solidyne 922: a világ első kereskedelmi audio bit tömörítési hangkártya PC-hez, 1990

Perceptual kódolást először beszédkódolásra használták, lineáris prediktív kódolással (LPC). Az LPC kezdeti koncepciói a Fumitada Itakura (Nagoya Egyetem) és a Shuzo Saito (Nippon Telegraph and phone) 1966-os munkájából származnak. Az 1970-es években Bishnu S. Atal és Manfred R., Schroeder a Bell Labs kifejlesztett egy formája LPC nevű adaptív prediktív kódolás( APC), egy perceptuális kódolási algoritmus, amely kihasználta a maszkolás tulajdonságait az emberi fül, majd a korai 1980-as években a kód gerjesztett lineáris jóslás (CELP) algoritmus, amely elért jelentős tömörítési arány az idejét. A perceptuális kódolást olyan modern audio tömörítési formátumok használják, mint az MP3 vagy az AAC.

a világ első kereskedelmi adás automatizálási audio tömörítési rendszerét Oscar Bonello, a Buenos Aires-i Egyetem mérnöki professzora fejlesztette ki., 1983-ban, a kritikus sávok maszkolásának pszichoakusztikus elve alapján, először 1967-ben, a nemrégiben kifejlesztett IBM PC számítógépen alapuló gyakorlati alkalmazás kidolgozását kezdte meg, a műsorszórás automatizálási rendszert 1987-ben indították el Audicom néven. Húsz évvel később a világ szinte minden rádióállomása hasonló technológiát használt, amelyet számos vállalat gyártott.

az IEEE folyóiratában 1988 februárjában jelent meg a legkülönbözőbb hangkódolási rendszerek szakirodalmi összefoglalója a kommunikáció kiválasztott területeiről (JSAC)., Bár volt néhány papírok előtt, hogy az idő, ez a gyűjtemény dokumentált egy egész különböző kész, működő audio kódolók, szinte mindegyikük segítségével perceptuális (azaz maszkolás) technikák, valamint valamilyen frekvencia elemzés és back-end zajmentes kódolás. Számos tanulmány megjegyezte, hogy nehéz megszerezni a jó, tiszta digitális hangot kutatási célokra. A JSAC kiadás szerzői közül a legtöbb, ha nem az összes, szintén aktív volt az MPEG-1 Audio bizottságban, amely létrehozta az MP3 formátumot.,

VideoEdit

Lásd még: videó kódolási formátum és Video codec

a videó tömörítése a forráskódolás gyakorlati megvalósítása az információelméletben. A gyakorlatban a legtöbb videó kodekeket az audio tömörítési technikák mellett használják a különálló, de kiegészítő adatfolyamok egyetlen kombinált csomagként történő tárolására úgynevezett konténerformátumok használatával.

tömörítetlen videó nagyon magas adatsebességet igényel. Bár a veszteségmentes videó tömörítési kodekek 5-12 tömörítési tényezővel működnek, egy tipikus H. 264 veszteséges tömörítési videó tömörítési tényezője 20-200.,

a videókódolási szabványokban alkalmazott két kulcsfontosságú videókompressziós technika a diszkrét koszinusz transzformáció (DCT) és a mozgáskompenzáció (MC). A legtöbb videókódolási szabvány, mint például a H. 26x és az MPEG formátumok, általában mozgáskompenzált DCT videó kódolást (block motion compensation) használnak.

kódolási elméletSzerkesztés

a Videóadatok állóképkeretek sorozataként ábrázolhatók. Ezek az adatok általában bőséges mennyiségű térbeli és időbeli redundanciát tartalmaznak. A videó tömörítési algoritmusok igyekeznek csökkenteni a redundanciát és tömörebben tárolni az információkat.,

a legtöbb videó tömörítési formátum és kodek mind a térbeli, mind az időbeli redundanciát kihasználja (pl. a különbségkódolás mozgáskompenzációval). A hasonlóságokat úgy lehet kódolni, hogy csak az időbeli szomszédos keretek (képkockák közötti kódolás) vagy a térben szomszédos képpontok (kereten belüli kódolás) közötti különbségeket tároljuk.Az Inter-frame tömörítés (temporális delta kódolás) az egyik legerősebb tömörítési technika. Ez (újra)egy vagy több korábbi vagy későbbi keret adatait használja egy sorrendben az aktuális keret leírásához., A kereten belüli kódolás viszont csak az aktuális kereten belüli adatokat használja, hatékonyan állóképes tömörítéssel.

Egy osztály a speciális formátumok használt videokamera, videó szerkesztő használata kevésbé összetett tömörítés rendszerek, amelyek korlátozzák a jóslás technikák belüli keret jóslat.

általában a videó tömörítés emellett veszteséges tömörítési technikákat alkalmaz, mint például a kvantálás, amelyek csökkentik a forrásadatok azon aspektusait, amelyek (többé-kevésbé) irrelevánsak az emberi vizuális érzékelés szempontjából az emberi látás észlelési jellemzőinek kihasználásával., Például a kis színkülönbségeket nehezebb észlelni, mint a fényerő változásait. A tömörítési algoritmusok átlagolhatnak egy színt ezeken a hasonló területeken a hely csökkentése érdekében, hasonlóan a JPEG képtömörítéshez. Mint minden veszteséges tömörítésnél, a videó minősége és a bitsebesség, a tömörítés és a dekompresszió feldolgozásának költsége, valamint a rendszerkövetelmények között is kompromisszum van. A nagyon tömörített videó látható vagy zavaró tárgyakat jeleníthet meg.,

Egyéb módszerek, mint az elterjedt DCT alapú át formátumok, mint például a fraktál tömörítés, megfelelő törekvés, illetve a diszkrét wavelet transzformáció (DWT), amelyekre egy kis kutatást, de jellemzően nem használják a gyakorlati termékek (kivéve a használata wavelet kódolás, mint mindig-kép programozóknak, anélkül, hogy mozgás kompenzáció). Úgy tűnik, hogy a fraktálkompresszió iránti érdeklődés csökken, mivel a legújabb elméleti elemzés az ilyen módszerek hatékonyságának összehasonlító hiányát mutatja.,

inter-frame codingEdit
fő cikk: Inter frame
további információk: Mozgáskompenzáció

a képkockák közötti kódolás úgy működik, hogy összehasonlítja a videó minden egyes keretét az előzővel. A videó sorozat egyes képkockáit összehasonlítjuk az egyik képkockáról a másikra, a videó tömörítési kodek pedig csak a különbségeket küldi el a referenciakeret számára. Ha a keret olyan területeket tartalmaz, ahol semmi sem költözött, a rendszer egyszerűen kiadhat egy rövid parancsot, amely átmásolja az előző keret azon részét a következőbe., Ha a keret részei egyszerű módon mozognak, a kompresszor egy (kissé hosszabb) parancsot bocsáthat ki, amely megmondja a dekompresszornak, hogy váltson, forgasson, világítson vagy sötétítse a másolatot. Ez a hosszabb parancs még mindig sokkal rövidebb, mint az intraframe tömörítés. Általában a kódoló is továbbítja a maradék jelet, amely leírja a fennmaradó finomabb különbségek a referencia képekkel. Entrópia kódolással ezek a maradékjelek kompaktabb reprezentációval rendelkeznek, mint a teljes jel., A nagyobb mozgású videók területén a tömörítésnek több adatot kell kódolnia, hogy lépést tartson a változó képpontok nagyobb számával. Általában robbanások, lángok, állatállományok, valamint néhány pásztázó felvétel során a nagyfrekvenciás részlet a minőség csökkenéséhez vagy a változó bitráta növekedéséhez vezet.,

Hibrid blokk-alapú át formatsEdit

További információ: Diszkrét koszinusz transzformáció

Feldolgozás szakaszában egy tipikus videó kódoló

Ma majdnem az összes általánosan használt videó tömörítési módszerek (pl. azok a szabványok által jóváhagyott, az ITU-T vagy ISO) ugyanazt az alapvető építészeti nyúlik vissza H. 261, amely szabványosított 1988-ban az ITU-T., Leginkább a DCT-re támaszkodnak, a szomszédos pixelek téglalap alakú blokkjaira, valamint a mozgásvektorok időbeli előrejelzésére, valamint manapság egy in-loop szűrési lépésre is.

az előrejelzési szakaszban különböző deduplikációs és difference-kódolási technikákat alkalmaznak, amelyek segítik az adatok összekapcsolását és a már továbbított adatokon alapuló új adatok leírását.

ezután a (maradék) pixeladatok négyszögletes blokkjai a frekvenciatartományba kerülnek, hogy megkönnyítsék a kvantálás irreleváns információinak célzását, valamint néhány térbeli redundancia-csökkentést., Az e tekintetben széles körben használt diszkrét koszinusz-transzformációt (DCT) N. Ahmed, T. Natarajan és K. R. Rao vezette be 1974-ben.

a fő veszteséges feldolgozási szakaszban az adatok kvantálódnak az emberi vizuális érzékelés szempontjából lényegtelen információk csökkentése érdekében.

az utolsó szakaszban a statisztikai redundanciát nagyrészt egy entrópia kódoló szünteti meg, amely gyakran alkalmaz valamilyen aritmetikai kódolást.

egy további in-loop szűrési szakaszban különböző szűrők alkalmazhatók a rekonstruált képjelre., Ezeket a szűrőket a kódolási hurkon belül is kiszámítva segíthetik a tömörítést, mivel azok a referenciaanyagra alkalmazhatók, mielőtt felhasználnák az előrejelzési folyamatban, és az eredeti jel segítségével vezérelhetők. A legnépszerűbb példa a deflocking szűrők, amelyek elmosódnak blokkoló műtárgyak kvantálási megszakítások transzformációs blokk határait.

HistoryEdit

Főcikk: Video coding format § History

In 1967, A. H. Robinson and C., Cherry javasolta egy futási hosszúságú kódolási sávszélesség-tömörítési sémát az analóg televíziós jelek továbbítására. 1974-ben Nasir Ahmed, T. Natarajan és K. R. Rao vezette be a Discrete cosine transformot (DCT), amely a modern videó tömörítés alapvető eleme.

H. 261, amely 1988-ban debütált, kereskedelmi forgalomban bemutatta a videó tömörítési technológia elterjedt alapvető architektúráját. Ez volt az első DCT tömörítésen alapuló videókódolási formátum, amely később a következő főbb videó kódolási formátumok szabványává vált. H.,A 261-et számos cég fejlesztette, köztük a Hitachi, a PictureTel, az NTT, a BT és a Toshiba.

a kodekekhez használt legnépszerűbb videókódolási szabványok az MPEG szabványok voltak. Az MPEG-1-et a Motion Picture Experts Group (MPEG) fejlesztette ki 1991-ben, a VHS minőségű videó tömörítésére tervezték. 1994-ben az MPEG-2/H. 262 sikerrel járt, amelyet számos vállalat fejlesztett ki, elsősorban a Sony, a Thomson és a Mitsubishi Electric. Az MPEG-2 lett a DVD és az SD digitális televízió szabványos videoformátuma. 1999-ben az MPEG-4/H követte.,263, ami jelentős előrelépés volt a videó tömörítési technológia számára. Számos cég fejlesztette, elsősorban a Mitsubishi Electric, a Hitachi és a Panasonic.

a legszélesebb körben használt videó kódolási formátum a H. 264 / MPEG – 4 AVC. 2003-ban számos szervezet fejlesztette, elsősorban a Panasonic, a Godo Kaisha IP Bridge és az LG Electronics. AVC kereskedelmi bevezetésre került a modern kontextus-adaptív bináris számtani kódolás (CABAC) és kontextus-adaptív változó hosszúságú kódolás (CAVLC) algoritmusok., Az AVC A Blu-ray lemezek fő videó kódolási szabványa, és széles körben használják olyan internetes szolgáltatások streamingjében, mint a YouTube, a Netflix, a Vimeo és az iTunes Store, webes szoftverek, mint az Adobe Flash Player és a Microsoft Silverlight, valamint különböző HDTV-adások földi és műholdas televízión keresztül.,

GeneticsEdit

Lásd még: genomi re-szekvenálási adatok tömörítése

a genetikai tömörítési algoritmusok a veszteségmentes algoritmusok legújabb generációja, amelyek az adatokat (jellemzően nukleotidok szekvenciáit) tömörítik, mind a hagyományos tömörítési algoritmusok, mind az adott adattípushoz igazított genetikai algoritmusok felhasználásával. 2012-ben a Johns Hopkins Egyetem tudósai egy genetikai tömörítési algoritmust tettek közzé, amely nem használ referencia genomot a tömörítéshez., A HAPZIPPER-t a HapMap adatokra szabták, és több mint 20-szoros tömörítést (a fájlméret 95% – os csökkentése) ért el, 2-4-szer jobb tömörítést és sokkal gyorsabb időt biztosítva, mint a vezető általános célú tömörítési segédprogramok. Ehhez Chanda, Elhaik és Bader bevezette a MAF alapú kódolást (MAFE), ami csökkenti az adatkészlet heterogenitását azáltal, hogy az SNP-ket kisebb allélfrekvenciájukkal rendezi, ezáltal homogenizálja az adatkészletet. Más algoritmusok 2009-ben és 2013—ban (DNAZip és GenomeZip) legfeljebb 1200-szoros tömörítési arányúak-így 6 milliárd basepair diploid humán genom tárolható 2-ben.,5 megabájt(egy referencia genomhoz viszonyítva vagy sok Genom átlagában). A genetika/genomika adatkompresszorainak referenciaértékét lásd

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük