Podcast ve Yayın Sesi: LUFS, Dinamikler ve Ses Zinciri
Stüdyo Rehberi 02 · Cloud Atelier · Nisan 2026 güncellendi · ~12 dk okuma
Konuşma sesi kendi disiplinidir. Mikrofon tercihleri farklıdır, loudness hedefleri düzenlenmiştir ve işleme zinciri müzikal güzellik yerine anlaşılırlık etrafında kurulur. Bu rehber, podcasting ve yayın ses çalışmasını aslında olduğu mühendislik problemi olarak ele alır.
NASIL ARAŞTIRIYORUZ · NE İDDİA ETMİYORUZ
Cloud Atelier bir test laboratuvarı işletmemektedir. Bu rehberde atıfta bulunulan her mikrofonu, ses arayüzünü veya monitörü kişisel olarak A/B testine tabi tutmadık. Bu makaledeki fizik (RT60, öz gürültü, polar desenler, gecikme, LUFS) yayımlanmış akustik literatüründen ve standartlardan alınmıştır. Ürüne özgü teknik özellikler, güncel üretici veri sayfalarından alınmıştır. Modeller, yayımlanan özellikleri belirtilen bir kriteri karşıladığı için — "en iyi" ilan ettiğimiz için değil — belirtilmiştir. Aşağıda bir ürün gördüğünüzde, alıntı yaptığımız özelliğin kaynağını ve bağımsız bir değerlendirmeciye (Sound on Sound) bağlantıyı da göreceksiniz.
1. Loudness: LUFS, true peak ve −16 LUFS'un var olma nedeni
Yayın hizmetleri ve yayıncılar loudness'ı dBFS peak ile ölçmez. ITU-R BS.1770'de standardize edilmiş bir metrik olan LUFS (Tam Ölçeğe Göre Loudness Birimleri) ile ölçer. Algoritma, sesi insan işitmesini yaklaştıran frekans ağırlıklı bir eğriden geçirir, ardından ortaya çıkan gücü zaman içinde ortalar. Sonuç, bir programın gerçekte ne kadar yüksek sesli çıktığıyla örtüşür — tepe örneğinin ne kadar yüksek olduğuyla değil.
| Platform | Loudness hedefi | True-peak tavanı | Notlar |
|---|---|---|---|
| Apple Podcasts | −16 LUFS | −1 dBTP | Mono −19, stereo −16 |
| Spotify (podcasts) | −14 to −16 LUFS | −1 dBTP | Normalised on playback |
| YouTube | −14 LUFS | −1 dBTP | Normalisation, not strict |
| EBU R128 (broadcast) | −23 LUFS | −1 dBTP | EU radio & TV |
| ATSC A/85 (US TV) | −24 LKFS | −2 dBTP | CALM Act compliance |
Apple Podcasts (−16) ve Spotify (−14) arasındaki iki desibel fark önemlidir. −14 LUFS'ta mikslenmiş bir podcast Spotify'da doğru çalınır ve Apple'da 2 dB aşağı normalize edilir, kalite kaybı olmaz. −19 LUFS'ta mikslenmiş bir podcast yayın radyosunda doğru çalınır, ancak dinleyicilerin ses düğmesine uzandığı ve algılanan üretim değerinin düştüğü Spotify'da zayıf hissettirr. −16 LUFS integrated, −1 dBTP true peak, 2026'da her iki dünya için güvenli hedeftir.
True peak, örnek peak ile aynı şey değildir. Dijital bir sinyal bir D/A dönüştürücüden geçip analog olarak yeniden oluşturulduğunda, örneklerarası tepe değerleri en yüksek dijital örneği +3 dB veya daha fazla aşabilir. −1 dBTP tavanı, WAV dosyası temiz görünse bile tüketici çalmada bozulmaya yol açabilecek kayıplı kodlayıcılardaki (AAC, MP3) örneklerarası kliplemeden korur.
2. Dinamik mikrofonların konuşma sesinde neden hâkim olduğu
Herhangi bir radyo istasyonuna, podcast ağına veya ticari dublaj kabinine girin; gördüğünüz mikrofon neredeyse kesinlikle dinamiktir: Shure SM7B, Electro-Voice RE20, Heil PR40, Rode PodMic. Kondenser mikrofonlar daha yüksek kaliteli ses kabinlerinde (Neumann U87, Sennheiser MKH 416) mevcuttur, ancak yalnızca kabi anechoic standartlara göre işlenmiş olduğu için. Başka her odada dinamik kazanır ve neden akustiktir.
Konuşma sesi yakından kaydedilir — tipik olarak kapsülden 5–15 cm. Bu mesafede, kardioid dinamiğin yakınlık etkisi 100–200 Hz'de 4–8 dB ekler ve dinleyicilerin yayınla ilişkilendirdiği sıcak göğüs tonunu üretir. Aynı anda, dinamiğin düşük hassasiyeti ve daha sıkı polar deseni, konsonantları bulanıklaştıracak oda yansımalarını reddeder. Shure SM7B, tutarlı eksen dışı renklendirme ile özellikle sıkı bir kardioid desen yayımlar; bu nedenle bir sunucu cümle ortasında başını çevirdiğinde bile doğal ses çıkarır.
USB-XLR hibridleri ve iş akışı gerekçesi
Tek bir sunucu için, USB dinamik mikrofonlar (Shure MV7+, Rode PodMic USB) bir ses arayüzü olmadan doğrudan dizüstü bilgisayara kaydeder. Dahili önampli, harici Cloudlifter olmadan dinamik kapsülü sürmek için yeterli temiz kazanç sağlar. Çok sunuculu gösteriler için XLR gerekçesi geri döner, çünkü her sunucunun phantom güç destekli önampli ve eşleştirilmiş kazanç ile ayrı bir parçaya ihtiyacı vardır — bu da en az sunucu sayısı + 1 girişli bir ses arayüzü anlamına gelir.
3. Standart ses işleme zinciri seri olarak
Profesyonelce üretilmiş bir ses parçası sabit bir işlemci dizisinden geçer. Sıralama önemlidir çünkü her aşama, bir sonraki aşamanın gördüğünü değiştirir. Zinciri yeniden sıralamak sonucu temelden değiştirir.
Kanonik ses zinciri: önce temizle, sonra şekillendir, son olarak kontrol et.
EQ'nun iki kez göründüğüne dikkat edin. İlk örnek yalnızca bir yüksek geçirme filtresidir — her plosif'te oda gürültüsünün kompresörü pompalamaması için kompresör görmeden önce 80–100 Hz'in altındaki her şeyi kaldırır. İkinci örnek, dinamikler kontrolünden sonra tonu şekillendirir, çünkü ton şekillendirilmiş bir sinyali sıkıştırmak, kazanç azaltımını ne yükselttiyseniz ona yeniden bağlar.
4. Gate ve expander: yazılımda oda reddi
Bir noise gate, threshold'un altındaki sinyali zayıflatır. Dinamik mikrofonun sessizlikler sırasında −55 dBFS oda ambiyansı ve −6 dBFS'de tepe yapan konuşma sesi yakaladığı bir sunucu için, 2–5 ms attack ve 100–200 ms release ile −45 dBFS'ye ayarlanmış bir gate, konsonantları kesmeden cümleler arasındaki nefesleri ve HVAC'ı susturur. Threshold'u dinleyerek ayarlayın: gürültü tabanının hemen üzerinde, en sessiz kasıtlı fısıltının hemen altında.
Expander'lar daha yumuşaktır. Bir gate threshold'da tam seviyeden sessizliğe geçerken, bir expander seviyeyi orantılı olarak azaltır: −40 dBFS'de 2:1 aşağı expander, −50 dBFS malzemenin −60 dBFS'de geçmesine izin vererek geçişi pürüzsüzleştirir. Nefeslerin sunumun bir parçası olduğu diyalogda, expansion canlılığı korur. Çapraz konuşmalı panel tartışmalarında gating kazanır.
5. Kompresör: ratio, threshold, attack, release
Kompresör, threshold'un üzerindeki sinyali seçilen bir ratio ile zayıflatarak dinamik aralığı azaltır. Ses için kanonik ayarlar:
- Threshold: kompresörün yalnızca bağırmalarda değil, ortalama konuşmada devreye girecek şekilde ayarlayın. En yüksek hecelerde 4–8 dB kazanç azaltımını hedefleyin.
- Ratio: 2:1 ila 4:1. Daha yüksek ratio'lar ezilmiş sesler üretmeye başlar.
- Attack: 5–20 ms. Daha hızlı attack konsonantları yakalar ama geçici netliği öldürür. Daha yavaş attack netliği korur ama tepe değerlerini geçirir.
- Release: Doğal sesli konuşma için 50–150 ms. Daha hızlı release pompalama yapar; daha yavaş release bastırır.
- Knee: Şeffaf ses çalışması için soft knee (3–10 dB); diyalogda yeri olmayan davul tarzı agresiflik için hard knee.
Seri olarak daha yumuşak ayarlarda iki kompresör (sırasıyla 2 dB ve 3 dB azaltma, toplam 5 dB), 5 dB yapan tek bir kompresörden daha şeffaf ses çıkarır. Buna seri kompresyon denir ve fısıltı ile bağırma arasındaki dinamik aralığı 30 dB'i aşan sunucular için yayın standardıdır.
6. EQ: yayın ses eğrisi
Ses EQ eğrisi, yazılmaya değer kadar türde sabittir. 80–100 Hz'deki yüksek geçirme filtresinin ardından tipik olarak şunları uygularsınız:
- Düşük-orta kesim 200–400 Hz'de, geniş Q ile −2 ila −4 dB (1,0–1,4): küçük odaların kutumsallık kalitesini kaldırır.
- Varlık boost'u 3–5 kHz'de, +1 ila +3 dB: tüketici kulaklıklar ve dizüstü bilgisayar hoparlörleri üzerinde anlaşılırlık ekler.
- Air shelf'i 10 kHz'in üzerinde, +1 ila +2 dB: kondenser parçalarda üst ucu açar; genellikle dinamik mikrofonda atlanır.
Her ses farklıdır — göğüslü rezonansa sahip erkek bir sunucu 250 Hz'de 3 dB kesim gerektirebilir; tizliği olan kadın bir sunucu hiç gerektirmeyebilir. Yukarıdaki eğri bir başlangıç noktasıdır, reçete değil.
7. De-esser: 5–9 kHz, tisleme fiziği
Tisleme (sibilance), "s," "sh" ve "t" konsonantları tarafından üretilen enerji yoğunlaşmasıdır, tipik olarak 5 ile 9 kHz arasında tepe yapar. Bu banttaki kompresyon, geniş bantlı bir kompresörle her tisleme anında tüm sesi köreltmeden gerçekleştirilemez. De-esser, frekans seçici bir kompresördür: yalnızca seçilen banttaki enerji bir threshold'u geçtiğinde tetiklenir ve yalnızca o bandı zayıflatır.
Sorunlu frekansı, dar bir EQ boost'u 5 ile 9 kHz arasında süpürerek tislemenin acı verici hale geldiği noktaya kadar bulun, ardından de-esser'ı o merkeze ayarlayın. Threshold, yalnızca en sert "s"lerde 3–6 dB zayıflama uygulamalıdır. Daha ağır de-essing, peltekliğe yol açar.
8. Limiter: son savunma hattı
Limiter, yaklaşık sonsuz-bir oranında ve çok hızlı attack'li bir kompresördür. Görevi, ne gelirse gelsin hiçbir örneğin tavanı aşmamasını sağlamaktır. Podcast dağıtımı için, 1–2 dB yakalama kazanç azaltmasıyla −1 dBTP true peak'de bir brick-wall limiter, kayıplı kodlayıcılarda örneklerarası kliplemesini önler.
Loudness uyumu iki adımlı bir süreçtir. Birincisi, integrated LUFS okumasının hedefe (örn. −16) oturması için limiter girişini gain-stage edin. İkincisi, limiter son 1–2 dB true-peak aşımını yakalar. Limiter'ı bundan fazlasını yapması için zorlamayın; hedef loudness'a ulaşmak için 6 dB limiting gerekiyorsa, zincirde daha önceki kompresyonunuz yetersiz boyutlanmıştır.
9. Çok sunuculu kayıt: double-enders, sample kilit, drift
Uzak görüşmeler tipik olarak double-enders olarak kaydedilir: her sunucu, diğerleriyle gerçek zamanlı bir çağrı (Zoom, Riverside, SquadCast) üzerinden konuşurken kendi mikrofonunu yerel olarak diske kaydeder. Her yerel dosya, bunları çok parçalı bir zaman çizelgesinde hizalayan editöre yüklenir.
İki teknik tuzak. Örnekleme hızı uyumsuzluğu: bir sunucu 44,1 kHz'de, diğeri 48 kHz'de kaydederse, hizalama yüzde 8,8 oranında kayar ve on saniye içinde işitilebilir biçimde senkronun dışına çıkar. Tüm sunucuları aynı hıza kilitleyin. Saat drift'i: aynı örnekleme hızında bile, iki dizüstü bilgisayar kristal osilatörü hafifçe kayar — belki bir saatte 50 ms. Dalga formu hizalama aracı (Riverside'ın magic edit, Descript veya her oturumun başında el çırpma referansıyla manuel hizalama) bunu düzeltir.
ÖZET
Konuşma sesi çözümlenmiş bir mühendisliktir. Bir akustisyen tutmak için para ödemediğiniz her oda için dinamik mikrofon kullanın. Gate, yüksek geçirme, kompresör, de-esser, ton EQ, limiter sırasıyla geçirin. Podcast için −16 LUFS integrated ve −1 dBTP hedefleyin. Sunucular arasında örnekleme hızlarını kilitleyin. Amatörlerin yaşadığı sorunlar, mikrofon seçiminden değil, neredeyse her zaman bu kurallardan birinin ihlalinden kaynaklanır.
KRİTERLERİ KARŞILAYAN EKİPMANLAR · PODCAST VE YAYIN
Aşağıdaki modeller, karşıladıkları fiziksel kritere göre gruplandırılmıştır. Özellik kaynağını (üretici veri sayfası) ve bağımsız bir değerlendirmeciye (Sound on Sound) bağlantıyı listeliyoruz; böylece okumamızı çalışan mühendislere göre doğrulayabilirsiniz. Bu modelleri kişisel olarak A/B testine tabi tutmadık.
Kriter: Dahili pop/rüzgar korumalı, düşük tutma gürültülü uç adresleme dinamik
Akustik olarak işleyemediğiniz bir odada (dolap, köşe, otel odası) uzun süreli konuşma sesi için. Dinamik kapsül, aynı kazançta kondensere kıyasla HVAC ve bilgisayar fan gürültüsünü yaklaşık 10 dB reddeder.
Kriter: USB+XLR hibrid, daha sonra ses arayüzü ekleyebilecek tek sunucular için tak-çalıştır
Dizüstü bilgisayara USB kablosuyla başlamanızı, ardından mikrofonu değiştirmeden çok mikrofon XLR düzeneğine geçmenizi sağlar. Mikrofondaki örnekleme hızı, konuşma sesi için sınırlayıcı faktör değildir.
Kriter: Dinamik + ses arayüzü kombinasyonu yayın seviyesine ulaşamadığında hat içi kazanç güçlendirici
Ses arayüzü önampli önünde +25 dB temiz kazanç. Özellikle 60 dB'in altında yayımlanan bir ses arayüzünde SM7B çalıştırırken geçerlidir.
Kriter: İki veya üç sunuculu XLR düzenekleri için çok girişli USB ses arayüzü
İki ön panel mikrofon girişi üç sunuculu gösteriler için yetmez; aşağıdaki ses arayüzü dört mikrofon önampli ve ayrı monitör çıkışlarıyla gelir.