"/>"/>
Yazılım Dilleri
Asp.Net 4.5 Kitabı
Skip Navigation Links

Ses Kodlayıcılar (G.711 G.723 G.729)

Ses analogdur ve işlenebilmesi için öncelikle analog formdan sayısal forma dönüştürülmesi gerekir. Bunu yerine getirmek için geliştirilmiş olan farklı kodlama metotları vardır. Kodlama metotlarının ço

Sesin sayısal kodlanması

Ses analogdur ve işlenebilmesi için öncelikle analog formdan sayısal forma dönüştürülmesi gerekir. Bunu yerine getirmek için geliştirilmiş olan farklı kodlama metotları vardır. Kodlama metotlarının çoğu kodlayıcıya girilen ve kod çözücüde görülen ses arasındaki fark edilir gecikmeden kaçınmak için yüklenmesi gereken, sayısal hatlar üzerindeki gerçek zamanlı ses iletimi için geliştirilmiştir. Bu gerekliliğin sayısal kodlamada mesajı saklamak için kullanımı uygulanamaz, bu nedenle bu uygulama için değişken fazlalığını kullanmak gibi daha büyük bir özgürlük vardır.
Rasgele seçilmiş bir ses sinyali üretmek için bant genişliği terimlerinden gerekli bilgi oranının (bit/s) ve sinyalin bant genişliğinde belirlenmesi gereken doğruluk derecesinin hesaplanması gerekir. Tipik telefon kalitesi için bant genişliği 3 KHZ ve ses-sinyal oranı 40 dB olabilir. Bu durumda bilgi oranı 40.000 bit/s’dir. Yüksek bir aslına uygunluk için tek sesli ses üreten sistemde bant genişliği beş defa daha iyi olabilir ve ses sinyalinin en tepe noktasının altında 60–70 dB ses sinyal oranında olabilir. Bu durumda 30.000 bit/s civarındaki bir oran herhangi bir sistem tarafından üretilmiş olabilecek olası ayrık sinyallerden birini açıkça belirlemeyi gerektirir.
Bu ifadelere karşın, bilinen şudur ki insandaki kavramsal süreçler dakikadaki onlarca bit fazlalığında bir bilgi oranını hesaba katmaz. Böylece iletilen bir bilgi oranının uygulanmasında 1,000 ve 10,000 arasında bilgiyi kullanılır. Bu büyük oran gösteriyor ki bir ses kanalındaki tüm bilgi kapasitesi ses iletimi için gerekli olmayabilir. Maalesef, bir haberleşme mühendisi için, insan dinleyici, kavramsal süreçler için uygun olan onlarca bit dikkate alınarak seçilen sinyal durumlarına karar vermede çok seçici olmalıdır. Genelde dinleyici mesaja odaklanır, yüksek derecede gereğinden fazlalığı olması normaldir. Bununla birlikte dinleyici konuşmacının ses kalitesine özellikle dikkat etmelidir.
Burada ses kodlamada ağırlıkla durulabilecek ses iletiminin iki özelliği vardır. İlk olanı insan işitsel sisteminin sınırlı kapasitesidir. İşitsel sınırlar konuşmacının sesin yeniden üretimindeki çeşitli eksikliklerden etkilenmemesini sağlar. Ses kodlama sistemi tasarlanırken bu aynı zamanda avantajlı da olabilir. Şöyle ki, konuşma mekanizması fizyolojisi meydana gelebilecek sinyal tipleri üzerinde güçlü kısıtlamalar koyar ve bu gerçek bir ses hattından alınan insan ses üretimindeki bazı durumları modellemede kullanılabilir (Holmes, 2001).
Kodlama metotları üç genel sınıfa bölünebilir:
1. Basit dalga formu kodlayıcıları, veri oranı 16 kbit/s üzerinde işlem yapar:
a. Darbe Kodu Modülasyonu (Pulse Code Modulation-PCM)
b. Uyarlanabilir Diferansiyel Darbe Kodu Modülasyonu (Adaptive Differential Pulse Code Modulation-ADPCM)
c. Delta Modülasyonu (Delta Modulation-DM)
2. Analiz/Sentez sistemleri şunlardır:
a. Kanal Ses Kodlayıcılar (Channel Vocoders)
b. Sinüsoid Kodlayıcılar (Sinusoidal Coders)
c. LPC Ses Kodlayıcılar (LPC Vocoders)
d. Biçimlendirici Ses Kodlayıcılar (Formant Vocoders)
e. Etkin Parametre Kodlama (Efficient Parameter Coding)
f. Parçasal/Fonetik Yapıdaki Ses Kodlayıcılar (Vocoders based on segmental/phonetic structure)
3. Orta düzey sitemler, yukarıdaki iki kategorinin bazı özelliklerine sahiptir ve 4-32 kbit/ s bölgesindeki geniş bir alanı kapsar:
a. Alt-Bant Kodlama (Sub-band Coding)
b. Kalanı basit kodlama ile doğrusal tahmin (Linear prediction with simple coding of the residual)
c. Uyarlanabilir Kestirimci Kodlama (Adaptive predictive coding)
d. Çoklu-sinyal LPC (Multipulse LPC)
e. Kod-uyarımlı Lineer Tahmin (Code-excited linear prediction-CELP)
Tezimiz doğrultusunda kodlama metotlarından olan basit dalga formu kodlayıcılarından kısaca bahsedelim.
Basit Dalga Formu Kodlayıcıları
Dalga formu kodlayıcıları, mikrofon ve ilgili olduğu analog devrelerin ürettiği gerçek dalga şeklini kopyalamaya çalışır.
a. Darbe Kodu Modülasyonu (Pulse Code Modulation-PCM)
Analog sesi sayısal forma dönüştürmenin yolu örneklemedir. Sinyal bir saniye içerisinde birçok kere örneklenir, dalganın yüksekliği kaydedilir. Aslında burada ölçülen yüksekliğin logaritmasıdır. Sinyalin yüksekliğini devamlı olarak ölçmek imkansız olduğu için sadece belli örnekleme zamanlarında ve sınırlı sayıda örneklerle sinyalin yüksekliği ölçülür.
Sayısal ses, analog ses sinyallerinin bit olarak adlandırılan ikilik sistemdeki "1" ve "0" olarak işaretlenmiş halidir. PCM, 64Kbps data olarak sayısallaştırılmış ses sinyalidir. Analog ses sinyali saniyede 8000 defa örneklenir. Her bir örnek 8 bit'tir. Bu da toplamda 8bit x 8000/s=64.000 bit/s eder. Bu oran Harry Nyquist tarafından geliştirilen Nyquist teoreminden türetilmiştir (Nyquist, 1928).
Nyquist Teoremi:
Bir saniye içerisinde ihtiyacımız olan örnek sayısını hesaplayabilmek için Nyquist teorisine bakmamız gerekir. Nyqusit teoreminde 4000 KHZ’lik bir örnekleme ile iletişim kanallarının yüksek frekanslı sesleri de yakalayarak taşıyabileceğine karar verilmiştir. Bu teoriye göre bir sinyali tamamı ile kopyalamak için N tane örnek almak gerekir. N ise şu formülden bulunabilir:
N = 2 x sinyal bant genişliği = 2 x 4000 = 8000
Saniyede 8000 örnek yeterli bir değer olacaktır. Bu 125 mikro saniyede bir örnek alınmasına müsaade eder.
Sesin analog seviyeleri 255 adet sayısal seviyeye dönüştürülür. 255 ayrık sayısal seviye 8 bitlik veri blokları ile sağlanabilir. Dolayısıyla bir saniyelik ses iletimi için,
8000 x 8 = 64.000 bps bir bant-genişliğine ihtiyaç duyar.
Şekil 1.1. Ses sinyalinin örneklenmesi
Şekil 1.2. Analog ses sinyalinin PCM ile sayısallaşması
Sayısal dönüştürme sırasında giriş ses sinyali Şekil 1.3’deki gibidir
Şekil 1.3. Sayısal dönüştürme sırasında ses sinyali
Daha sonra bu sinyal Şekil 1.4’te görüldüğü üzere belirli örnekleme aralıklarına ayrılır. Burada voltaj değeri genliğe göre belirlenir. Düşük voltaj değerleri daha sık aralıklarla, yüksek gürültülere karşılık gelen voltaj değerleri ise daha uzun aralıklarla numaralandırılır. Bunun nedeni insan kulağının logaritmik olarak duymasıdır.
Şekil 1.4. Oluşturulan sinyalin belirli örnekleme aralıklarına ayrılması
Örnekleme sonrasında dönüştürücü, Şekil 1.5’daki gibi ortalama değere sahip sinyalleri ortamdan ayırarak kalanları örnekleme değerine uygun biçimde yuvarlar.
Şekil 1.5. Sinyalin örnekleme sonrasındaki durumu
Şekil 1.6. Sinyallere sayısal değer atama durumu
Sonrasında Şekil 1.6’da görüldüğü gibi her sinyale sayısal bir değer atanır. 16 bit ses örneklemede bu değer 0–16,536 arasında değişirken, 24 bit ses örneklemede 0-16,700,000 arasında olabilir. Sinyalin karşılığı olan değer bir tam sayıya denk gelmiyorsa, dönüştürücü bu değeri en yakın üst veya alt değere yuvarlar. Bu işleme kuantizasyon (quantization) işlemi adı verilir. Şekil 1.7’de bu işlem görülebilir. Bu işlem sonucunda bazı hata payları yani kuantizasyon kayıpları oluşur. Sayısallaştırma işleminin tersi, analog sesin tekrar elde edilmesi sırasında oluşan bu kuantizasyon kayıpları yüzünden asıl analog ses hiçbir zaman üretilemez. Ancak insan kulağı bunu çoğu kez algılayamaz.
Şekil 1.7. Quantization işleminden sonra sinyalin durumu
Son olarak dönüştürücü, yeniden biçimlendirme filtresini kullanarak orijinal eğriye yukarıdakinden daha yakın bir form oluşturmaya çalışır. Yukarıdaki örnekte olayı daha iyi görebilmek için aralıkları bilerek biraz büyük tuttuğumuzu belirtelim. Filtreden geçen ses eğrisi sonuç olarak Şekil 1.8’dakine benzer:
Şekil 1.8. Filtreden geçen ses eğrisi
b. Uyarlanabilir Diferansiyel Darbe Kodu Modülasyonu (Adaptive Differential Pulse Code Modulation-ADPCM)
Ses sıkıştırma tekniklerinden birisidir. 16-40 Kbps arasında sıkıştırma yapar. 32 Kbps ADPCM sıkıştırması ile 64 Kbps PCM arasında pratikte konuşma kalitesinde fark yoktur.
Saniyede 8000 analog sinyal örneği alınır. Bant-genişliğini azaltmak için öngörülü metotlar kullanır. Bant-genişliğini azaltmak ses kalitesini yüksek oranda etkiler ve konuşma karakteristiklerinin avantajları kullanılamaz.
ADPCM algoritma olarak PCM’den farklıdır; çünkü örneklenmiş ses sinyalinin kuantize edilmesinin yerine, önkestirilen ve kuantize edilen sinyal arasındaki farkı kuantize eder. İyi bir önkestirimde gerçek sinyal ile tahmini sinyal arasındaki fark çok küçük olacaktır ve bu da daha düşük bit akış hızı anlamına gelecektir. Arkasında çalışan nicemleyici tek tip değildir ve farklı sinyal modellerinde kullanılmak üzere optimize edilebilir.
Sinyalin yeniden üretilmesi kuantize edilmiş farkın tahmini sinyale eklenmesiyle bulunur. Bu sayede orijinal sese çok yakın bir sinyal elde edilmiş olur. ADPCM metodu sadece 2:1 oranı gibi çok düşük bir sıkıştırma sunsa da veri sıkıştırma metotlarıyla beraber kullanılarak 4:1 oranına ulaşılabilir.
c. Delta Modülasyonu (Delta Modulation-DM)
Delta Modülasyonu dalga formu kodlamada alternatif olan en basit tiptir. Bir delta modülatör giriş dalga formunun yerel bir kopyasını üretmek için iletilen sayısal kodları kullanır ve kodlayıcı kısıtları ile mümkün olabilecek en uygun giriş dalga formunun kopyasını üretmek için ardışık sayısal kodları seçer.
Basit bir şekli Şekil 1.9’da gösterilmiştir. Nicemleyicinin orijinal ve en basit formu her örnek için sadece bir bit kullanır ve bir kuantum ile sadece kopyasının arttırılıp azaltılamayacağı gösterilir. Böyle bir kodlayıcı çok basit donanım uygulaması olanağı sunar.
Şekil 1.9. Basit bir delta modülatör blok diyagramı
Sinyal işleme teknikleri (Sinyal analizi)
Ses sinyaline, tanımada gerekli olan faydalı özelliklerini ortaya çıkarmak için sinyal işleme teknikleri uygulanır. Amaç sinyaldeki fonetik bilgisini kötü telefon hatlarının içerdiği gürültü, konuşmacı farklılıkları veya konuşmacının duygusal durumu gibi faktörlerin tesiri olmayacak şekilde saklamaktır. Ses tanıma sistemleri genelde ses sinyallerinin analizinden faydalanmaktadırlar. Ses dalgasının içerdiği frekans ve genlik değerleri her bir fonem için farklılık göstermektedir. Ses sinyalinin analizi sonucunda bu frekans ve genlik bilgilerini içeren özellik vektörleri oluşur. Bir özellik vektörü genelde her bir kısa zaman aralığındaki (10 milisaniye) bir ses sinyali penceresinden (20~30 milisaniye)’den hesaplanır. Söylenen kelime bu özellik vektörlerinin bir dizisi olarak gösterilir. Sonraki aşamada bu özellik vektörleri tanıyıcıya giriş olarak verilir.
Şekil 1.10. Ses sinyallerinin özellik vektörlerine dönüştürülmesi
Bazı sinyal işleme teknikleri herhangi bir önemli veri kaybı olmadan ayırıcı özellikleri bulduğu ve sıkışmış veriyi açabildiği için daha kullanışlıdır (Tebelskis, 1995; Albers, 1998; Kosko, 1992; Sydral, 1995; Jackson, 1986). En popülerleri arasında:
· Hızlı Fourier Dönüşümü (Fast Fourier Transform-FFT) gözle görülebilecek biçimde yorumlanabilen zamandaki ayrık frekansları verir. Frekanslar düşük düzeyde lineer olan ama yüksek düzeyde logaritmik olan Mel scale kullanılarak ve insan kulağının fiziksel karakteristiklerine uygun olarak sınıflandırılırlar. Fourier dönüşümü ile genlikzaman boyutu, frekans-genlik boyutuna dönüştürülür. Ses tanıma sistemimizde bu tekniklerden Hızlı Fourier Dönüşümü’nü kullandık. Sistem tasarımı bölümünde bu işlemin uygulanması ile ilgili daha açıklayıcı bilgiler verilecektir.
· Algısal Lineer Kestirimci Kodlama (Perceptual Linear Predictive-PLP) aynı zamanda fizyolojik olarak harekete geçirilir, ama katsayılar açıkça yorumlanamaz. Algısal Lineer Kestirimci Kodlama, Kesikli Fourier Dönüşümü (Discrete Fourier Transform- DFT) ve Lineer Kestirimci Kodlama (Lineer Predictive Coding-LPC) tekniklerinin birleştirilmesi ile sesin parametrelerinin hesaplanmasıdır. Bu yöntem insan kulağının duyma sistemini Lineer Kestirimci Kodlama yönteminden daha iyi modellemeye yöneliktir.
· Lineer Kestirimci Kodlama (Linear Predictive Coding-LPC) Bu kodlamada temel fikir, bir ses örneğinin kendisinden önceki ses örneklerinin doğrusal kombinasyonu kullanılarak tahmin edilmesidir. Gerçek ses örnekleri ile tahmin edilen örnekler arasındaki hata minimumlaştırılarak öngörü katsayılarından oluşan parametre değerleri elde edilir (Ertaş ve Eskidere, 2001). Kodlama yöntemleri içinde belki de en yaygın olanı ve en çok kullanılanı bu kodlama olmuştur. Gırtlak yapısını örnek alan diğer modellerin aksine bir filtre grubu değil de tek girişli ve tek çıkışlı bir filtre modeli benimsemiştir.
· Kepstrum (Cepstral Analysis) güçlü sinyal spektrumu logaritmasında Fourier dönüşümün tersi bir işlem yapar.
G711
G.711 saniyede 8000 örnekleme oranı kullanır. Bu oranın töleransı, milyona 50 parçadır (50 parts per million = ppm). Her örneklemde sekiz ikili basamak kullanılır. İki şifreleme yasası kullanılır. Bunlar genellikle A-yasası ve Mu-yasanıdır. Bütün 0 karakterler sinyallerinin önlendiği ağ bağlantılarında mu-yasası kullanılır. Karakter sinyali negatif giriş değerleriyle ilgili olarak karar değer numaraları olan 127 ve 128, 00000010 olmalı ve kod çözücüdeki çıkış değeri -7519 olmalıdır. Dekodere ilişkin çıkış değer numarası 125'tir.
Paket Kaybı Gizleme (Packet Loss Concealment = PLC) algoritmaları, aynı zamanda çerçeve silme gizleme algoritmaları olarak da bilinirler. Bir göndericideki paketlenen ve kodlanan giriş sinyallerinin iletim zararlarını gizlerler, bir ağa gönderirler ve paketleri çıkışa çözen alıcıya alır. G.723.1, G.728 ve G.729 gibi birçok standart temel CELP ses kodlayıcıları, PLC algoritmalarına sahiptir.
G.711 Ek I: "Paket kaybı gizlemesi için G.711'ler ile kullanılan yüksek kaliteli düşükkarmaşalı algoritmalardır."
G.711 Ek II: "ITU-T için rahat ses yük tanımı, multimedya iletişim sistemlerinde pakettabanı kullanılır.
TG.711 paket tabanlı multimedya iletişim sistemlerinde kullanılır. Kullanılan yük, paketin, tüm sistem bit-hızına etki eden anlamlı bir iletim hızının olduğu yerde büyük bir ek yüklü paket tabanlı sistemlere tasarlanmıştır. Bu durumda, VAD/DTX/CNG'nin kullanımı önemli bir şekilde küçülecektir ve bu nedenden dolayı bant genişliği genişleyecektir.
G.723 - Ses Sıkıştırma
G.723.1, sesi sıkıştırma ya da çok düşük bit hızındaki multimedya servisinin diğer ses sinyalinin kullanılabilmesi için şifreli gösterimi belirler. Bu kod dizaynında, tüm H.324 standart ailesinin parçalarının kullanıldığı, ana uygulama düşük bit hızına sahip görsel telefonları dikkate alır.
G.723.1 kendiyle ilişkilendirilmiş 2 bit hızına sahiptir. Bunlar 5.3 ve 6.3 kbit/s hızındadırlar. Daha yüksek bit hızları daha yüksek kaliteye sahiptir. Daha düşük bit hızı, iyi kalite ve ilave esneklikle sistem tasarımlarını sağlar. Her iki hız da kodlayıcı ve kod çözücünün zorunlu birer parçasıdır. Değişken hız işlemi için bir seçenek de süreksiz iletimini kullanma ve ses olmadığı aralıkları gürültü ile doldurmadır.
G723.1 kodlayıcı ses veya diğer ses sinyalleri 30 milisaniye çerçevesinde kodlar. Ek olarak, 7.5 milisaniye gelecek planı da vardır. Sonuçta toplam 37.5 milisaniyelik gecikmeli algoritmik toplam içerir. Gerçekleştirmedeki tüm ilave gecikmeler ve kod işlemleri şunlara bağlıdır:
1. Kodlayıcı ve kod çözücüde güncel zaman harcama işlemi 
2. İletişim bağındaki iletim zamanı
3. Çoklama protokolü için ilaveten ara belleğe almayı geciktirme
G.723.1 kodlayıcılar, analog girişli ilk yapılan telefonların bant genişliğini süzme, sonra da 8000 Hz'de örnekleme ve daha sonra kodlayıcının girişi için 16-bit doğrusal PCM'e çevirme tarafından işlenen dijital sinyalleri elde etmek için oluşturulmuştur. Kod çözücünün çıkışı tekrar benzer anlamdaki analog sinyallere çevrilmelidir. 64 kbit/s PCM veri için belirlenmiş G.711 tavsiyeleri gibi diğer giriş/çıkış nitelikleri, 16-bit doğrusal PCM'den uygun kod çözümünden önce 16-bit doğrusal PCM'e dönüştürülmelidir.
Kodlayıcı doğrusal tahmin sentez tarafından analiz kodlama yöntemine dayanır ve sürekli ağırlıklı hata sinyalini küçültmeyi dener. Kodlayıcı, her 240 örnekte çerçeveyi işletir. Bu da 8 kHz örnekleme hızında 30 milisaniyeye denk gelir. Her çerçeve, DC bileşenini kaldırmak için yüksek geçiren filtre kullanır ve sonra 60 örneğin her birinin dört altçerçevesine böler. Her bir altçerçeve için, 10. komut Doğrudan Öngörü Kodlayıcı (Linear Prediction Coder=LPC) filtre, işlenmemiş giriş sinyalini kullanarak hesap yapar. Son altçerçevenin LPC filtresi bir Kestirimci Bölünmüş Vektör Nicemleyici (Predictive Split Vector Quantizer=PSVQ) kullanarak nicemlenir. Nicemlenmeyen LPC katsayıları, büyün çerçevelerde ve sürekli olarak ağırlıklanmış ses sinyalini elde etmede kullanılan kısa vadeli ağırlıklandırma filtelerinin yapısında kullanılır.
Her iki alt filtre için (120 örnek), açık döngü perde dönemi (LOL), ağırlıklanmış ses sinyali kullanılarak hesap edilir. Bu perde kestirimi 120 örnekli çerçeveleri gerçekleştirir. Perde dönemi (pitch period) 18 ile 142. örnekler arasında aranır. Bu noktadan sonra ses, temelde her altçerçevede 60 örneğe işlenir.
Tahmini perde dönemi kullanılarak önceden hesap edilen bir uyumlu gürültü spektrumlu biçimlendirme oluşturulmuştur. Bir dürtü yanıtı oluşturmak için LPC sentezleyici filtrenin kombinasyonu, biçimlendirici algısal ağırlıklandırma filtresi ve uyumlu gürültü spektrumlu biçimlendirme filtresi kullanılır. Dürtü yanıtı, öteki hesaplamalar için kullanılır.
Perde zamanı kestirimini (LOL) ve dürtü yanıtını kullanarak kapalı döngü perde komutu hesaplanır. Beşinci komut, perde komutu için kullanılır. Perde dönemi açık döngü perde tahmini etrafında küçük bir diferansiyel değer ile hesaplanır. Perde komutunun katkısı, ilk hedef vektörden çıkarılmasıdır. Her iki perde döneminde ve diferansiyel değer, kod çözücüye iletilir.
Sonuçta, uyarımın aperiyodik bileşeni yaklaşıktır. Yüksek bit hızı için, çoklu-darbe Maksimum Olasılık Nicemlemesi (Maximum Likelihood Quantization=MP-MLQ) uyarımı kullanılır ve düşük bit hızı için cebirsel kod uyarımı (Algebraic-code-excitation=ACELP) kullanılır.
G.723.1 kod çözücü işlemi, aynı zamanda çerçeve bazında işlem gerçekleştirir. İlk olarak nicemlenen LPC indekslerinin kodları çözülür, sonra kod çözücü LPC sentezleyici filtreyi oluşturur. Her altçerçeve, her iki uyarılmalı kod çizelgesi uyarımı ve değişmez kod çizelgesi uyarımı kod çözücüden geçirilir ve sentez filtresine giriş yapar. Uyarlanır postfilter bir biçimlendirici ve bir ileri-geri perde postfilterdan meydana gelir. Uyarım sinyali, sırasıyla biçimlendirici postfilterda çıkışı girişine eşit olan sentez filtreye giden perde postfiltera girer.
G.729
G729, ITU-T tarafından onaylanan 8 kbps Eşlenik-Yapı Cebirsel-Kod-Uyarılmış Doğrusal Öngörüdür (Conjugate-Structure Algebraic-Code-Exvited Linear Prediction = CS-ACELP). G.729 Ek A, G.729 kodlayıcının indirgenmiş karmaşık bir versiyonudur. Not olarak G.729 Ek D, 6.4 kbit/s CS-ACELP sıkıştırma için ve G.729 Ek E ise 11.8 kbit/s CS-ACELP sıkıştırma için kullanılır.
G.729 Ek A ses kodlayıcı multimedya eş zamanlı sesler ve DSVD gibi veri uygulamaları için dizayn edilmiştir. Kodlama süreçleri, 10 milisaniye çerçeveli sinyaller ve sonuçta toplamda 15 milisaniye algoritmik gecikmeli geleceğe dönüşlü 5 milisaniyeye sahiptir. Bu algoritmanın giriş/çıkışı, 8 kbps veri katarında çevrilen 16 bit doğrusal PCM örneklemedir.
G.729 Ek B ses kodlayıcı yüksek seviye Ses Etkinlik Tespiti (Voice Activity Detection = VAD), Süreksiz iletim(Discontinuous Transmission = DTX) ve Rahat Gürültü Üreteci (Comfort Noise Generator = CNG) tanımlamaya dayanır. Bu algoritmalar konuşmanın sessiz periyotlarının iletimini küçültmek için kullanılır. Bunlar V.70 tavsiyesi ile birlikte çalışmak için dizayn optimize edilir. Recommendation V.70, Ek A/G.729'un kullanımına emreder. Ancak arzu edilirse , Recommendation G.729'nin tam versiyonu sesin kalitesini geliştirmek için kullanılabilir.
KAYNAKLAR
1. JACKSON, L.B., 1986, “Digital Filters and Signal Processing”, Kluwer Academic Publishers.
2. www.wikipedia.com
3. www.vocal.com
 

Yorumlar (3)

  1. Avatar
    Görkem Çetinci

    09.09.2012

    Harika bir yazı olmuş. Ellerine sağlık

  2. Avatar
    Onur Karaduman

    12.04.2013

    Elinize sağlık tam istediğim bir yazı olmuş

  3. Avatar
    emre yakan

    28.11.2014

    allah razı olsun

Yorum Yap

Mail listesine katılmak için tıklayınız

Hakkımdaki son bilgilere anlık erişmek için mail listesine katılabilirsiniz.