DNA sequence compression within traditional text compression algorithms Geleneksel Metin Sikiştirma Algoritmalari ile DNA Dizilerinin Sikiştirilmasi


ŞEKER A., DELİBAŞ E., DİRİ B.

25th Signal Processing and Communications Applications Conference, SIU 2017, Antalya, Türkiye, 15 - 18 Mayıs 2017

Özet

Özetçe—Bu çalışmada geleneksel metin sıkıştırma algoritmalarının DNA dizilerinin sıkıştırılmasında kullanılması amaçlanmıştır. DNA dizilerindeki kısa tekrarların önemli olduğu görülmüş, bunların sıkıştırmaya olan katkısı incelenmiştir. Sıkıştırma için ardışık olarak çalıştırılan birden fazla algoritma ile bir sistem (pipeline) tasarlanmıştır. Hangi algoritmanın sisteme nasıl bir katkısı olduğu araştırılmış ve özellikle BWT’nin, sıkıştırmaya olan etkisi gösterilmiştir. Sonuçlar, pipeline sistemin, tek başına Huffman kodlamanın sıkıştırma başarısını yakalayamadığı göstermiştir.

Anahtar Kelimeler — DNA dizi sıkıştırma; BWT; RLE; MTF; Huffman kodlama. 

Abstract—It aimed that traditional text compression methods are using on compression of DNA sequence in this study. It has seen that the random short repeats are vital and it has examined their posivite impact for compression. A pipelined system with multiple algorithms running sequentially for compression. How the contribution of the algorithm to the system was investigated and especially the effect of the BWT on compression was shown. Results show that the pipeline system was found unable to catch the compression success of the Huffman coding alone.

Keywords — DNA sequence compression; BWT; RLE; MTF; Huffman coding.