Evde Vokal Kaydı: Akustik, Elektriksel ve Mekansal Gerçeklik
Stüdyo Rehberi 01 · Cloud Atelier · Nisan 2026 güncellendi · ~14 dk okuma
Bir mikrofon seçmeden önce, odanız çoktan sizin yerinize seçim yapmıştır. Önampli karşılaştırmadan önce, öz gürültü ve kazanç fiziği kaydınızın ne kadar temiz olabileceğinin tabanını çoktan belirlemiştir. Bu rehber, vokal kaydını bir akustik ders kitabının ele aldığı gibi — bir alışveriş listesi olarak değil, birbiriyle etkileşen fiziksel ve elektriksel değişkenlerden oluşan bir sistem olarak — ele alır.
NASIL ARAŞTIRIYORUZ · NE İDDİA ETMİYORUZ
Cloud Atelier bir test laboratuvarı işletmemektedir. Bu rehberde atıfta bulunulan her mikrofonu, ses arayüzünü veya monitörü kişisel olarak A/B testine tabi tutmadık. Bu makaledeki fizik (RT60, öz gürültü, polar desenler, gecikme, LUFS) yayımlanmış akustik literatüründen ve standartlardan alınmıştır. Ürüne özgü teknik özellikler, güncel üretici veri sayfalarından alınmıştır. Modeller, yayımlanan özellikleri belirtilen bir kriteri karşıladığı için — "en iyi" ilan ettiğimiz için değil — belirtilmiştir. Aşağıda bir ürün gördüğünüzde, alıntı yaptığımız özelliğin kaynağını ve bağımsız bir değerlendirmeci (Sound on Sound) bağlantısını da göreceksiniz.
1. Odanız ilk enstrümandır
Bir mikrofon sesinizi kaydetmez. Sesinizin artı doğrudan sesin diyaframa ulaşmasından sonraki milisaniyelerde gelen her yansımanın toplamını kaydeder. Küçük bir yatak odasında bu yansımalar 5–15 milisaniye içinde gelir — insan işitme sisteminin geçici entegrasyon penceresinin içinde — ve dinleyici bunları ayrı yankılar olarak değil, bulanıklık, kutumsallık ve endüstrinin roominess (oda etkisi) adını verdiği kendine özgü kalite olarak algılar.
RT60: en kullanışlı tek sayı
Yankılanma süresi RT60, kaynağın durmasından sonra bir sesin 60 dB azalması için gereken süreyi ifade eder. Profesyonel vokal kabinleri, konuşma bandında (200 Hz – 4 kHz) 0,15–0,25 saniye RT60 hedefler. İşlenmemiş yatak odaları genellikle 0,4–0,7 saniye ölçer. Ahşap zeminli oturma odaları çoğunlukla 1,0 saniyenin üzerinde çıkar. Sabine denklemi nedenini açıklar:
burada V m³ cinsinden oda hacmi, A ise sabin cinsinden toplam emilimdir (m² eşdeğer mükemmel emici).
2,5 m tavanlı 12 m²'lik bir yatak odasının hacmi 30 m³'tür. 1 kHz bandındaki RT60'ı 0,6 s'den 0,25 s'ye düşürmek için yaklaşık 12 sabin emilim eklemeniz gerekir — bu, ilk yansıma noktalarını kaplayan dört adet 5 cm'lik fiberglas panele (her biri 1 kHz'de yaklaşık 3 sabin) eşdeğerdir. Bu fiziktir. Hırdavatçıdan alınan köpük dalgalı paneller, 1 kHz'de metrekare başına yaklaşık 0,4 sabin sağlar ve 250 Hz'in altında neredeyse hiçbir şey yapmaz; bu yüzden yalnızca köpük bazlı akustik düzenleme, alçak-orta frekans çamurunu tamamen bırakır.
Oda modları ve dürüst bir kaydın alt sınırı
Duran dalgalar, yarı dalga boyunun tam olarak iki paralel yüzey arasına sığdığı frekanslarda enerjiyi hapseder. L × W × H (metre cinsinden) boyutlarındaki bir oda için eksenel mod frekansları f = c / (2L)'dir; burada c ses hızıdır (~343 m/s). 4 m'lik bir duvar 43 Hz'de bir mod üretir; 3 m'lik bir duvar 57 Hz'de bir tane üretir. Bir yatak odasında genellikle 30 ile 200 Hz arasında eksenel, teğetsel ve oblik modlardan oluşan bir orman bulunur. Bunlar, şarkıcının ve mikrofonun nerede durduğuna bağlı olarak bazı bas notalarının yüksek çınlamasına, bazılarının ise neredeyse kaybolmasına yol açar.
Vokal kaydı özelinde bu durum, bas davulundan daha az önem taşır — erkek sesinin temeli yaklaşık 100–130 Hz, kadın sesinin temeli ise yaklaşık 180–240 Hz civarındadır — ancak 200 ile 400 Hz arasındaki rezonanslar doğrudan insan sesinin sıcaklık bandının üstüne yığılır ve amatör kayıtları anında tanınabilir kılan kutumsallığa yol açar.
İlk yansıma noktaları ve tarak filtrelemesi
Bir ses bir duvardan yansıyıp doğrudan sesten yaklaşık 1 milisaniye içinde mikrofona döndüğünde, iki sinyal tutarlı biçimde girişim yapar. Periyodu gecikmenin iki katı olan frekanslar güçlendirilir; periyodu gecikmeye eşit olanlar iptal edilir. Bu, tarak filtrelemesidir ve küçük işlenmemiş odaların baskın işitsel imzasıdır. 1 ms geç gelen bir yansıma 500 Hz, 1,5 kHz, 2,5 kHz vb. frekanslarda çentikler oluşturur. Kulak, hiçbir miks işleminin gideremediği içi boş, fazlı bir renklendirme olarak duyar.
Doğrudan ses + ilk yansımalar: işlenmemiş her paralel yüzey başka bir tarak ekler.
2. Sinyal zinciri: akustik basınçtan dijital örneğe
Her vokal kaydı, bir enerji dönüşümleri zinciridir. Zinciri anlamak önemlidir, çünkü her aşamanın bir gürültü tabanı vardır ve zincirin genel sinyal-gürültü oranı en zayıf aşama tarafından belirlenir. Ev prodüktörlerinin çoğu üç haneli rakamlar harcayarak bir mikrofon alır ve ardından unity kazanç üzerinde çalışan 50 dolarlık bir ses arayüzüne bağlar; önampli aşamasının dinamik aralığı yarıya indirdiğinin farkına hiç varmaz.
Her birinin kendi gürültü tabanı ve headroom bütçesi olan beş aşama.
3. Mikrofon fiziği: kondenser - dinamik karşılaştırması
Bir mikrofon, ses dalgasının basınç değişimlerini voltaja dönüştürür. Stüdyo kullanımında iki baskın elektroakustik prensip vardır ve aralarında seçim yapmak zincirdeki en belirleyici karardır.
Kondenser prensibi
Kondenser (kapasitör) mikrofon, birkaç mikron mesafede yüklü bir arka plakaya ince altın kaplı bir diyafram yerleştirir. Ses basıncı diyaframı yer değiştirir, kapasitansı ve dolayısıyla kapsül üzerindeki voltajı değiştirir. Hareket eden kütle esasen ihmal edilebilir olduğundan, kondenser mikrofonlar birkaç mikrosaniye içinde geçici sinyallere yanıt verir ve frekans yanıtları 16 kHz'in çok üzerine uzanır. Ayrıca son derece hassastırlar: tipik hassasiyet 15–30 mV/Pa'dır ve bu dinamik mikrofonun on ila yirmi katıdır.
Bu hassasiyet, kondenser mikrofonların nefesi, dudak tıklamasını, göğüs rezonansını — ve ayrıca üç metre ötedeki dizüstü bilgisayar fanını — yakaladığı nedendir. Hassasiyetin kaynak tercihi yoktur.
Dinamik prensip
Dinamik mikrofon, diyaframa küçük bir ses bobini ekler ve onu bir manyetik alanda asar. Diyafram hareketi bobinde voltaj indükler. Hareket eden kütle çok daha yüksektir (bobin bakırdır), bu nedenle geçici yanıt daha yavaştır, 12–16 kHz'in üzerindeki frekans yanıtı düşer ve hassasiyet genellikle 1 ile 3 mV/Pa arasında kalır — kondenser mikrofondan on ila yirmi desibel daha düşük.
Bu düşük hassasiyet, dinamik mikrofonların işlenmemiş odalarda işe yaramasının tam da nedenidir. Mikrofon, fizik gereği, odayı daha az duyabilir. Bu aynı zamanda, bir dinamiğin kullanılabilir kayıt seviyesine ulaşmak için neden daha fazla önampli kazancına ihtiyaç duyduğunun ve bizi doğrudan SM7B sorununa götüren nedenidir.
Öz gürültü: neredeyse kimsenin okumadığı özellik
Kondenser mikrofonun eşdeğer öz gürültüsü, diyaframda, sessizlikte mikrofonun kendi elektronik vızıltısıyla aynı çıkış voltajını üretecek SPL değeridir (dBA cinsinden). Düşük olan daha iyidir. 14 dBA'nın altı mükemmeldir; 8 dBA'nın altı istisnaîdir. 18 dBA öz gürültülü bir mikrofon, ortam SPL'niz yaklaşık 30 dB'in altına düşene kadar — gece saatlerinde işlenmiş bir kabin dışında nadiren gerçekleşen bir durum — oda ambiyansından daha gürültülü duyulacaktır. Öz gürültü, hiçbir önampli aşamayı geri alamayacağı kayıt temizliğine sert bir taban koyar.
| Mikrofon | Tür | Hassasiyet | Öz Gürültü (A) | Maks SPL |
|---|---|---|---|---|
| Audio-Technica AT2020 | Condenser | 14.1 mV/Pa | 20 dBA | 144 dB SPL |
| Rode NT1 (5th Gen) | Condenser | 32 mV/Pa | 4 dBA | 142 dB SPL |
| Shure SM7B | Dynamic | 1.12 mV/Pa | n/a (passive) | 180+ dB SPL |
| Neumann TLM 102 | Condenser | 11 mV/Pa | 12 dBA | 144 dB SPL |
4. Önampli kazancı, headroom ve SM7B sorunu
Mikrofon seviyesindeki sinyaller çok küçüktür. Normal konuşma mesafesindeki bir kondenser, yaklaşık 1–10 mV tepe üretir. Aynı konumdaki bir dinamik 0,1–1 mV üretir. Bu sinyalleri hat seviyesine (yaklaşık 1 V) çıkarmak, temiz bir amplifikasyon aşamasında 40–65 dB kazanç gerektirir. Önamplinin görevi, bu kazancı tiz veya bozulma eklemeden gerçekleştirmektir.
İki özellik önemlidir. Eşdeğer giriş gürültüsü (EIN), önamplinin kendisinin ne kadar gürültü eklediğini, girişine atıfla söyler. −128 dBu EIN mükemmeldir; −120 dBu yeterlidir; −115 dBu, yüksek kazanç düzeyinde sessiz bir dinamik mikrofonun arkasında duyulabilir hale gelir. Kliplemeden önceki maksimum kazanç, önamplinin düşük çıkışlı bir dinamiği hiç sürekli sürebileceğini söyler.
Shure SM7B'nin konuşma mesafesindeki 1,12 mV/Pa hassasiyeti yaklaşık 0,5 mV tepe üretir. Bunu hat seviyesine çıkarmak yaklaşık 65 dB kazanç gerektirir. Birinci nesil Focusrite Scarlett 2i2 en fazla 56 dB çıkarır; dördüncü nesil 2i2, 69 dB'e ulaşır; UA Volt 2 ise 55 dB'de kalır. Önamplınız rahatça 60+ dB'e çıkamıyorsa, Cloudlifter CL-1 veya Triton FetHead gibi hat içi amplifikatörler, önampli sinyali görmeden önce 25 dB temiz kazanç ekleyerek sorunu çevre yolundan aşar.
5. Dönüştürücüler, örnekleme hızı, bit derinliği ve 32-bit float
Önampliden sonra sinyal bir analog-dijital dönüştürücüye ulaşır. İki özellik belirleyicidir. Bit derinliği dinamik aralığı belirler: 16 bit 96 dB sağlar; 24 bit 144 dB sağlar. Modern ses arayüzleri varsayılan olarak 24 bit kaydeder. Ekstra headroom sesi iyileştirmez — ani yüksek sesli alımlarda kliplemeden koruyan 18 dB güvenli kazanç ayarı marjı sağlar.
Örnekleme hızı, Nyquist teoremi aracılığıyla bant genişliğini belirler (maksimum frekans = örnekleme hızı / 2). 44,1 kHz, 22,05 kHz'e kadar yakalayarak insan işitme aralığını aşar. 48 kHz yayın standardıdır. 96 ve 192 kHz, öncelikle örtüşme olmadan dahili işleme için alan bırakmak amacıyla bulunur — evde vokal kaydetmek için 48 kHz doğru varsayılandır. Daha yüksek hızlar, duyulamaz bir fayda karşılığında dosya boyutunuzu ikiye katlar.
Bazı yeni ses arayüzleri (Rode NT1 5G USB, Zoom F3, Tascam Portacapture X8) 32-bit float kaydeder. Bu format, normal voltaj aralıklarında dijital alanda kliplemesi matematiksel olarak mümkün değildir. Kazancı rahatça ayarlarsınız, alımı kaydedersiniz ve kaliteyi kaybetmeden gerçeği sonradan ayarlarsınız. Alım ortasında kanalları ayarlayamadığınız yalnız ev kaydı için bu, anlamlı bir iş akışı ilerlemesidir.
6. Teknik: mesafe, eksen, pratikte polar yanıt
Mesafe: ters kare yasası ve yakınlık etkisi
Ses basıncı, kaynaktan her mesafe ikilemesinde yaklaşık 6 dB düşer. 6 inç (15 cm)'ten 12 inç (30 cm)'e çıktığınızda, doğrudan sinyaliniz 6 dB düşerken, diffüz olan ve alanı daha düzgün dolduran oda yansımaları çok az düşer. Doğrudan-yankılanmaya oran çöker. Ev prodüktörlerinin yakından kayıt yapmaları öğretilmesinin nedeni budur: 15 cm'de, doğrudan sinyal odadan çok daha yüksek ses çıkarır, bu nedenle oda neredeyse kaybolur.
Kardioid mikrofonlar ayrıca yakınlık etkisi sergiler: basınç gradyanı dönüştürücüler, öne ve arkaya geliş arasındaki farka yanıt verdikleri ve bu fark yakın mesafede doğrusal olmayan biçimde büyüdüğü için kapsüle yaklaştıkça alçak frekanslar vurgulanır. 5 cm'de bir kardioid, 100 Hz'de +6 dB ekleyebilir. Bu, yayın seslerini dolgun ve göğüslü yapan şeydir ve amatör podcastlerin pat sesli çıkmasının nedenidir. Mesafe bir ton kontröldür.
Eksen ve eksen dışı sorun
Polar desen diyagramları genellikle 1 kHz için çizilir. Gerçeklikten çok daha düzgün görünürler. 8 kHz'de, bir kardioid tipik olarak eksen dışında, eksen üzerindeyken 6–10 dB daha karanlıktır; bu nedenle kapsülün önünden ayrılan bir şarkıcı, seviye kaybetmeden önce yüksek frekans ayrıntısını kaybeder. Kapsüle her zaman doğrudan bakın; önünde 5 cm mesafede bir pop filtresi ve şarkıcı filtrenin 10 cm arkasında olsun. Gerekirse zemini bantla işaretleyin.
7. Odaya ve bütçeye göre karar matrisi
Mikrofon seçimi son adımdır, ilk adım değil. Aşağıdaki matris, gerçekten elinizde olanları göre sıralar: odanın akustik olarak ne kadar ölü olduğu ve sinyal zincirinin ne kadar bütçe kaldırabileceği.
| Durumunuz | Mikrofon tipi | Önerilen modeller | Neden |
|---|---|---|---|
| Untreated bedroom, hard floors, parallel walls | Dynamic, cardioid | Shure SM7B, Shure MV7, Rode PodMic | Lower sensitivity rejects room reflections; comb filtering becomes manageable. |
| Treated corner with 4 panels and a heavy rug | Large-diaphragm condenser | Audio-Technica AT2020, Rode NT1 5G | Detail and air without exposing untreated reflections. |
| Properly treated booth or whisper-quiet room | Premium LDC | Neumann TLM 102, AKG C414 XLII | You have earned the noise floor and frequency extension that justifies the price. |
| Fully untreated room, podcast/voiceover only | Dynamic + acoustic blanket | SM7B + Cloudlifter, MV7+ USB-C | Spoken word tolerates dynamic colouration; rejection > detail. |
8. Ev prodüktörlerinin gerçekten yaptığı beş hata
1. Önce mikrofon almak
İşlenmemiş bir yatak odasındaki Neumann TLM 102, SM7B'nin aynı odada kaydettiğinden daha kötü bir vokal kaydeder. Kapsülü yükseltmeden önce ilk 80–200 doları emilim (paneller, battaniyeler, halılar) için harcayın.
2. Mikrofondan çok uzakta kayıt yapmak
Ağız ile pop filtresi arasına yumruğunuzu sokabiliyorsanız, çok uzaktasınız. El genişliği (8–10 cm) konuşma için yaklaşık doğrudur. Şarkılı vokaller için pop filtreli 15–20 cm standarttır.
3. Kazancı ortalama yerine tepe değerine göre ayarlamak
Tepe değerlerini −3 dBFS değil, −12 ile −6 dBFS'yi hedefleyin. Modern 24-bit kayıt o kadar fazla headroom'a sahiptir ki, sessiz tarafta hata yapmak hiçbir şeye mal olmaz ve sizi ani yüksek sesli alımlardan korur.
4. Yüksek geçirme filtresini unutmak
Vokal kaydındaki 80 Hz'in altındaki her şey, HVAC, trafik sesi veya sehpa gürültüsüdür — en alçak bas şarkıcılar dışında hiçbir zaman ses temelidir. Ses arayüzünüzü veya DAW yüksek geçirme filtrenizi 80 Hz'de girişte devreye alın ya da en azından miksaj sırasında.
5. Reverb'ü bozulma yerine renk olarak görmek
DAW'da eklediğiniz reverb sizin seçiminizdir. İşlenmemiş bir oda tarafından kayda işlenen reverb değildir. Kuru kayıt yapın, ardından reverb'ü bir efekt olarak ekleyin — asla tam tersi şekilde.
ÖZET
Evde vokal kaydı fizik tarafından yönetilir, ekipmana değil. Oda tavanı belirler, mikrofon seçimi odaya saygı gösterir, önampli mikrofona göre boyutlandırılır, dönüştürücü modern bit derinliklerinde varsayılan olarak affedicidir ve teknik, tüm bunların kullanılabilir bir alıma dönüşüp dönüşmediğini belirler. Zinciri anladığınızda, bir yatak odasında 400 doların altında yayın kalitesinde vokal kaydı yapabilir ya da 4.000 dolar harcayabilir ve oda yanlışsa hâlâ amatörce ses çıkarabilirsiniz.
KRİTERLERİ KARŞILAYAN EKİPMANLAR · VOKAL KAYDI
Aşağıdaki modeller, karşıladıkları fiziksel kritere göre gruplandırılmıştır. Özellik kaynağını (üretici veri sayfası) ve bağımsız bir değerlendirmeciye (Sound on Sound) bağlantıyı listeliyoruz; böylece okumamızı çalışan mühendislere göre doğrulayabilirsiniz. Bu modelleri kişisel olarak A/B testine tabi tutmadık.
Kriter: 300 doların altı büyük diyaframlı kondenser, oda akustik düzenlemesi mevcut
Kardioid LDC, üretici tarafından yayımlanan öz gürültüsü, işlenmiş bir odada mikrofonun gürültü tabanı haline gelmemesi için yeterince düşük. Aşağıdaki iki model bu fiyat bandının alt ve üst sınırında yer alır.
Kriter: İşlenmemiş odalar veya yüksek sesli kaynaklar için kardioid dinamik
Dinamik kapsül, tipik bir kondensere kıyasla 90° eksen dışında oda yansımalarını yaklaşık 10 dB reddeder; oda kendisi sorun olduğunda bu, öz gürültüden daha önemlidir. Takas: stüdyo seviyesi için yüksek önampli kazancı (~+60 dB) gerektirir.
Kriter: Standart ses arayüzlerinde düşük çıkışlı dinamikler için hat içi kazanç güçlendirici
Phantom güç aracılığıyla +25 dB temiz kazanç ekleyerek ses arayüzü önampli üzerindeki yükü azaltır. Özellikle yaklaşık 60 dB'de sınırlayan ses arayüzlerindeki SM7B sınıfı mikrofonlarla eşleşir.
Kriter: Stüdyo referans kondenser, düşük gürültü, tarafsız karakter, işlenmiş oda
Oda zaten işlenmiş olduğunda ve mikrofonun sinyale mümkün olduğunca az şey eklemesini istediğinizde. Yüksek maliyet, daha sıkı kapsül toleransı ve daha düz bir yanıt eğrisi için ödenmektedir.
Kriter: Güçlendirici olmadan dinamikler için yeterli ≥ 60 dB önampli kazançlı USB ses arayüzü
Cloudlifter olmadan SM7B sınıfı dinamik çalıştırmak istiyorsanız, ses arayüzü önamplinin kendisinin headroom'a ihtiyacı vardır. Aşağıdaki ünite 69 dB olarak yayımlanmıştır, bu da marj sağlar.