فناوری صوتی آنالوگ در مقابل فناوری صوتی دیجیتال: کدام بهتر است؟
نویسنده کایل ماتیاس
۷ نوامبر ۲۰۱۹
مترجم فرناز واشقانی فراهانی
بحث دربارهی فناوری صوتی آنالوگ در مقابل فناوری صوتی دیجیتال بسیار دو قطبی است. من متوجه شدهام که بیشتر مردم مدافع یکی از این دو هستند و تغییر یا تعدیل نظرشان چندان امکانپذیر نیست.
کدام یک بهتر است – صدای آنالوگ یا صدای دیجیتال؟ خب، بستگی دارد از چه کسی بپرسید…
اگر از من بپرسید، میگویم آنالوگ و دیجیتال هر دو مزایا و معایبی دارند. در انتهای این مطلب شما مهمترین تفاوتهای آنها را خواهید آموخت و خودتان میتوانید تصمیم بگیرید.
تفاوت اصلی میان صدای آنالوگ و صدای دیجیتال چیست؟
تفاوت میان فناوری صوتی آنالوگ و فناوری صوتی دیجیتال در شیوهی ذخیرهی اطلاعات صوتی است. امواج صوتی مجموعهای از ارتعاشات است که از طریق یک واسط ایجاد میشود. فناوری ضبط صدای آنالوگ این اطلاعات را با ایجاد مجموعهای از بارهای مغناطیسی روی یک حلقه نوار مغناطیسی ذخیره میکند. فناوری ضبط صدای دیجیتال این اطلاعات صوتی را به صورت مجموعهای از مقادیر عددی روی یک هارد درایو ذخیره میکند.
در این نوشته شما معایب و مزایای هر یک از این دو روش ضبط را همراه با تفاوتهای بین فناوریهای صوتی آنالوگ و دیجیتال برای پخش صدای زنده خواهید آموخت.
تفاوت میان فناوری صوتی آنالوگ و فناوری صوتی دیجیتال در شیوهی ذخیرهی اطلاعات صوتی است. فناوری ضبط صدای آنالوگ این اطلاعات را با ایجاد مجموعهای از بارهای مغناطیسی بر روی یک حلقه نوار مغناطیسی ذخیره میکند. فناوری ضبط صدای دیجیتال این اطلاعات صوتی را به صورت مجموعهای از مقادیر عددی روی یک هارد درایو ذخیره میکند.
اطلاعات ارائه شده در مطلب پیش رو طوری بیان شده است که فهم آن تا حد امکان آسان باشد. اگر شما درک بنیادی از نحوهی عملکرد صدا داشته باشید، فهم بهتری از برخی مفاهیم این نوشته خواهید داشت. اگر هر یک از قسمتهای پیش رو گیجکننده بود، به مطلبی که دربارهی مبانی صوت نوشتهام رجوع کنید.
قبل از اینکه بحث در رابطه با تفاوتهای بین سیستمهای صوتی دیجیتال و آنالوگ را آغاز کنم، فکر میکنم لازم است متذکر شوم که همهی سیستمهای صوتی دیجیتال، برخی از فناوریهای صوتی آنالوگ را شامل میشوند.میکروفونها ابزار صوتی آنالوگ هستند که انرژی صوتی را به سیگنال الکتریکی آنالوگ تبدیل میکنند. پیشتقویتکنندهها، تقویتکنندههای توان و بلندگوها نیز همگی ابزار آنالوگ هستند.
تمرکز اصلی این بخش روی برجسته کردن تفاوتهای میان فناوریهای ضبط صدای آنالوگ و دیجیتال خواهد بود.
تعریف فناوری صوتی آنالوگ
بیایید با نگاهی به رایجترین قالبهای صدای آنالوگ شروع کنیم – نوار و صفحه وینیل[۱]. درک
بنیادی از چگونگی عملکرد این قالبها، میتواند در فهم آنها کمککننده باشد.
نوار
نوار مغناطیسی باکیفیتترین روش برای ضبط و بازپخش صدای آنالوگ است. دستگاههای ضبط صوت نواری مطابق با این اصل عمل میکنند: وقتی که یک جریان الکتریکی از طریق سیم فرستاده میشود، یک میدان مغناطیسی در اطراف سیم ایجاد میشود و بالعکس.
دستگاه ضبط صوت نواری به ما این امکان را میدهد که امواج جریان متناوب را از میکروفون بگیریم و به صورت بار روی نوارهای مغناطیسی ذخیره کنیم. وقتی که نوار مغناطیسی را از طریق ضبط صوت بازپخش میکنید، دوباره به جریانهای الکتریکی قابل پخش از بلندگوها تبدیل میشود.
یک دستگاه ضبط صوت نواری برای ضبط صدا سیگنالهای صوتی الکتریکی را از طریق سیم پیچیده شده دور یک آهنربا که در مجاورت نوار مغناطیسی قرار دارد، میفرستد؛ این سیم پیچ دور آهنربا را هِد ضبط[۲] مینامند.
وقتی نوار از میدان مغناطیسی ایجاد شده توسط هد ضبط عبور میکند، ذرات در امتدادِ نوار دارای بار مغناطیسی میشوند. الگوی بارهای مغناطیسیِ در امتداد نوار شبیه سیگنالهای صوتی فرستاده شده از طریق سیم پیچ هستند.
دامنهی[۳] سیگنال صوتی با مقدار[۴] بارهای مغناطیسی ایجاد شده روی نوار همبستگی دارد[۵].
در بازپخش صدا، این فرایند معکوس میشود. نوار مغناطیسی یک جریان الکتریکی روی هِد پخش[۶] ایجاد میکند که به یک تقویتکننده وصل میشود تا صدا از طریق بلندگوها پخش شود.
انواع مختلفی از نوار و دستگاههای ضبط نواری وجود دارند که بر کیفیت صدای ضبط شده تأثیرگذار هستند. دو متغیر اصلی عبارتند از سرعت نوار و پهنای نوار.
سرعت نوار
سرعت عبور نوار از جلوی هد ضبط بر کیفیت صدای ضبط شده تأثیر میگذارد. سرعت نوار بالاتر، صدایی با پاسخ فرکانسی بیشتر، خش خش کمتر و وقفهی[۷] کوتاهتر را ضبط میکند.
سرعت دستگاه ضبط صوت نواری با واحد اینچ بر ثانیه اندازهگیری میشود (ips). سرعتهای متداول دستگاههای ضبط صوت نواری ips ۲/۱-7، ips 15، ips 30 هستند. استاندارد ضبط صدای حرفهای ips 15 میباشد.
پهنای نوار
پهنای نوار نیز بر کیفیت صدای ضبط شده تأثیرگذار است. نوار پهنتر امکان ضبط صدا با کیفیت بالاتر را فراهم میکند.
با این حال، میتوان از پهنای نوار به جای استفاده جهت بهبود کیفیت صدای یک آهنگ تک، برای ضبط آهنگهای بیشتر استفاده کرد. در این صورت این امکان فراهم میشود تا چند منبع به طور مستقل ضبط و بازپخش شوند.
صفحه وینیل
صفحههای وینیل رسانهی مصرفی استاندارد برای ضبط صدا به صورت آنالوگ هستند. در تلاش برای توزیع صدا در مقیاس بالا، میتوان صداهای ضبط شده را از نوارهای آنالوگ روی صفحههای وینیل کپی کرد.
هرچند که کیفیت صدای صفحه وینیل به خوبی نوار اصلی نیست، اما تولید انبوه صفحه وینیل آسانتر است زیرا فضای کمتری اشغال میکند و بادوامتر است.
صفحههای وینیل در مقایسه با نوار، در برابر عناصر مختلف آسیبپذیری کمتری دارند. بر خلاف نوار که با در معرض مغناطیس قرار گرفتن از بین میرود، صفحههای وینیل در برابر میدانهای مغناطیسی مصون هستند زیرا از روش متفاوتی برای ذخیرهسازی صدا استفاده میکنند.
به جای بار مغناطیسی، این شیارهای بافتدار روی سطح صفحههای وینیل هستند که اطلاعات صوتی را ذخیره میکنند.
همینطور که صفحه وینیل با سرعتی معین میچرخد، یک قلم سوزنی میان شیارهای روی سطح آن حرکت میکند. همینطور که قلم سوزنی روی شیارها عقب و جلو میرود، در سیمی که به یک تقویتکننده وصل است تا صدا را از بلندگوها پخش کند، یک جریان الکتریکی ایجاد میکند. دامنهی سیگنال صوتی با شدت حرکت قلم سوزنی همبستگی دارد.
میتوانید انیمیشن چگونگی عملکرد صفحه وینیل که Animagraffs ساخته است را مشاهده کنید. Animagraffs وبسایتی است که انیمیشنهای عالی از فناوریهای مختلف درست میکند.از صفحههای وینیل در دنیای مدرن فقط برای بازپخش صدا استفاده میشود. ضبط صدا به صورت آنالوگ با استفاده از نوارهای مغناطیسی انجام میشود. سپس از نوارها برای ساخت قالب جهت پِرِس کردن اطلاعات روی صفحههای وینیل استفاده میکنند.
تعریف فناوری صوتی دیجیتال
طبیعتاً بیشتر موسیقی مدرن با استفاده از فناوری دیجیتال ضبط میشوند. بیایید مبانی بنیادین فناوری صوتی دیجیتال را بررسی کنیم تا بتوانم درک بهتری از مقایسهی آن با فناوری صوتی آنالوگ داشته باشیم.
پی سی ام (مدولاسیون کد پالس)
پی سی ام یا مدولاسیون کد پالس[۸] روشی استاندارد برای کدگذاری سیگنالهای صوتی به اطلاعات باینری[۹] است.
در ضبط صدای آنالوگ، مدلی از امواج صوتی با استفاده از بار مغناطیسی ایجاد میشود. اما پی سی ام با ذخیرهی یک توالی از مقادیر عددی که نشان دهندهی دامنه در نقاط مختلف یک موج است، یک مدل از امواج صوتی را ایجاد میکند.
این مقادیر با استفاده از گروههایی از بیتهای[۱۰] باینری که به آنها نمونه میگویند، نشان داده میشوند. هر نمونه یک مقدار عددی را در یک محدودهی از پیش تعیین شده از مقادیر ممکن نشان میدهد. این روند را کوانتیزاسیون[۱۱] مینامند که توسط یک مبدل آنالوگ به دیجیتال انجام میشود (مبدل A به D).
موقع بازپخش صدای ضبط شده با فناوری دیجیتال، این نمونهها دوباره به سیگنالهای الکتریکی تبدیل و به بلندگوها فرستاده میشوند. این روند با استفاده از مبدل دیجیتال به آنالوگ انجام میشود (مبدل D به A یا DAC).
در زیر تصویری ساده از نحوهی ذخیرهی امواج صوتی با استفاده از نمونههای دیجیتال را میبینید.
عمق بیت
هر نمونه، یک مقدار را در محدودهی مقادیر ممکن نشان میدهد. این عمق بیت است که محدودهی مقادیر ممکن را تعیین میکند. عمق بیت اصطلاحی است برای تعداد بیتهای موجود در هر نمونه.
هر بیت میتواند دو مقدار ممکن را نشان دهد. صداهای ضبط شدهای که از بیتهای بیشتری در هر نمونه استفاده میکنند، میتوانند محدودهی بزرگتری از مقادیر را نشان دهند و نسبت به صداهای ضبط شده با عمق بیت پایین، کف نویز[۱۲] بسیار کمتری دارند.هر بار که یک بیت اضافه میشود، تعداد مقادیر ممکن دو برابر میشود. در حالی که یک بیت دو مقدار را نشان دهد، دو بیت میتواند چهار مقدار و سه بیت میتواند ۸ مقدار را نشان دهد و به همین ترتیب ادامه پیدا کند.
عمق بیت
- ۱ بیت
- ۲ بیت
- ۴ بیت
- ۸ بیت
- ۱۶ بیت (استاندارد سیدی[۱۳])
- ۲۴ بیت (استاندارد حرفهای)
مقادیر ممکن
- ۲
- ۴
- ۱۶
- ۲۵۶
- ۵۳۶,۶۵
- ۲۱۶,۷۷۷,۱۶
عمق بیت استاندارد برای سیدی ۱۶ بیت است که ۵۳۶,۶۴ مقدار دامنهی ممکن را فراهم میکند. استاندارد حرفهای عمق بیت ۲۴ بیت است که ۲۱۶,۷۷۷,۱۶ مقدار دامنهی ممکن را فراهم میکند! بیشتر استودیوهای حرفهای با استفاده از نقطه شناور[۱۴] ۳۲ بیتی ضبط و میکس میکنند.
نرخ نمونهبرداری
نرخ نمونهبرداری[۱۵] مشخص میکند که چه تعداد نمونه از یک موج صوتی در ثانیه گرفته میشود. نرخ نمونهبرداری با واحد هرتز (Hz) اندازهگیری میشود. ضبط با نرخ نمونهبرداری بالاتر، امکان ضبط فرکانسهای بالاتر را هم فراهم میکند.
قضیهی نایکوئیست[۱۶] بیان میکند که نمونهبرداری دیجیتال تنها میتواند فرکانسهای کمتر از نصف نرخ نمونهبرداری را به درستی نشان دهد. این بدان معناست که اگر بخواهید ۲۰ کیلوهرتز، یعنی بالاترین فرکانس قابل شنیدن برای انسان را ضبط کنید، باید از نرخ نمونهبرداری بیشتر از ۴۰ کیلوهرتز استفاده کنید.به همین دلیل ۱.۴۴ کیلوهرتز نرخ نمونهبرداری استاندارد برای سیدیها است. صدای حرفهای برای ویدیو از استاندارد ۴۸ کیلوهرتز بهره میبرد. بسیاری از ضبط صداها با نرخ نمونهبرداری ۹۶ کیلوهرتز و بیشتر، تا حد خیلی زیادی از این استانداردها فراتر میروند! با وجودی که اغلب اوقات، گسترش محدودهی فرکانس ضبط شده را از مزایای نرخ نمونهبرداری بالاتر تلقی میکنند، اما این مزیت اصلی آن نیست. در این نوشته زیاد به عمق این مطلب نمیروم، اما مزیت آن بیشتر به نوع فیلتر تصحیح فرکانس[۱۷] آن مربوط است که میتواند برای فیلتر کردن فرکانسهای بالاتر با آرتیفکت[۱۸] کمتر استفاده شود. پهنای باند قابل شنیدن حاصل از صدای ضبطشدهی ۱.۴۴ کیلوهرتز و ۹۶ کیلوهرتز در نهایت یکسان است.
قالبهای فشردهسازی دادههای صوتی دیجیتال
فایلهای صوتی تولید شده در استودیوهای ضبط به دلیل حجم اطلاعاتی که شامل میشوند، بسیار بزرگ هستند. اگر یک آهنگ ۳ دقیقهای با عمق بیت ۲۴ و نرخ نمونهبرداری ۹۶ کیلوهرتز ضبط شود، سایز آن حدوداً ۵۲ مگابایت خواهد شد.
در روزهای ابتدایی اینترنت و پخشکنندههای موسیقی قابل حمل مانند آیپاد، دادههای کامل و فشردهنشدهی پی سی ام برای استریم[۱۹] روی اینترنت یا ذخیرهسازی روی هارد درایوهای کوچک، بسیار بزرگ بودند.
برای ایجاد فایلهایی با سایز کوچکتر، از فشردهسازی دادهها استفاده شد. این فشردهسازی را نباید با فشردهسازی دامنهی دینامیکی[۲۰] اشتباه گرفت – در حقیقت، میتوانید همه چیز دربارهی فشردهسازی دادهها را در یک مطلب دیگر از سایتAudio University با عنوان فایل صوتی بااتلاف در مقابل فایل صوتی بیاتلاف[۲۱]، بیاموزید.
فشردهسازی دادهها روشی برای کاهش حجم فایل است. دو دستهی اصلی در فرمتهای فشردهسازی دادهها وجود دارد که عبارتند از بااتلاف و بیاتلاف.
فرمتهای فشردهسازی بااتلاف دادهها (MP3 و AAC)
متأسفانه پرکاربردترین فرمت فشردهسازی دادهها در فایلهای صوتی مصرفی از نوع بااتلاف است. این بدان معناست که اگرچه الگوریتمهای خاصی برای کاهش اثرات منفی استفاده میشود، اما دادهها در روند فشردهسازی فایل از بین میروند.
اگر اطلاعات در روند فشردهسازی دادهها از بین بروند، فرمت فشردهسازی مورد استفاده بااتلاف است. وقتی که دادهها از بین بروند دیگر نمیتوان آنها را بازیابی کرد.
رایجترین فرمتهای فشردهسازی بااتلاف دادههای صوتی MP3، AAC، و Ogg Vorbis هستند. این فرمتها برای ذخیرهسازی بسیاری از فایلها روی فضای محدود هارد درایو یا استریمینگ محتوا روی کانکشنهای اینترنتی با پهنای باند محدود استفاده میشوند.
هدف الگوریتم اختصاصی این فرمتها این است که محتوا را بر اساس مدلهای ادراک انسان از صدا الویتبندی کند و محتوای با الویت پایین را از بین ببرد.
فرمتهای فشردهسازی بیاتلاف دادهها (FLAC و AIFF)
اگر در روند فشردهسازی دادهها، اطلاعات از بین نرود، فرمت فشردهسازی استفاده شده بیاتلاف است.
برخی خدمات استریمینگ مانند تیدال[۲۲] از فشردهسازی بیاتلاف بهره میبرند. با استفاده از این فرمتها، میتوان اطلاعات را به فایلهای کوچکتر کدگذاری کرد و بعداً کدبرداری کرد و در نهایت اطلاعات پی سی ام اصلی را به صورت یک فایل با فرمت WAV بازیابی کرد.
اگرچه این فرمتها در مقایسه با فایلهای فشرده نشده مقداری فضا ذخیره میکنند، اما به هیچ وجه کارایی فرمتهای بااتلاف را ندارند.
در حال حاضر، شاهد به وجود آمدن پلتفرمهای استریمینگ ارائهدهندهی فایلهای صوتی بیاتلاف هستیم که در مقایسه با نسخهی فشرده نشدهی اصلی افت کیفیت ندارند. با این حال، در چند دههی گذشته بیشتر پلتفرمها فقط فایلهای صوتی بااتلاف را ارائه دادهاند که میتواند باعث افت شدید کیفیت صدا شود.
متأسفانه، این موضوع باعث بدنامی فناوری صوتی دیجیتال شده است. اما با من بمانید تا ببینید صدای دیجیتال به آن بدی که فکر میکنید نیست.
فناوری صوتی آنالوگ در مقابل فناوری صوتی دیجیتال: معایب و مزایا همانطور که میدانید، فناوریهای ضبط صدای آنالوگ و دیجیتال هدف مشترکی دارند – ایجاد مدلی از شکلموج[۲۳] صوتی که بتواند تا حد امکان در بازپخش صدای ضبط شده دقیق باشد. هر دوی این فناوریها در رسیدن به این هدف موفق عمل کردهاند. صدای ضبط شده با استفاده از هر کدام از این روشها لزوماً بهتر از دیگری نیست، بلکه فقط متفاوت است. در این بخش، ویژگیهای منحصر به فرد هر روش بررسی خواهد شد.
برای تصمیمگیری در مورد اینکه کدام قالب برای کار در دست انجام بهتر است، لازم است برخی جزئیات را در نظر بگیریم.
نویز
یکی از مهمترین تفاوتهای میان صدای آنالوگ و دیجیتال میزان نویز است. اگر از علاقهمندان به صدا باشید، احتمالاً با مفهوم کف نویز و نسبت سیگنال به نویز[۲۴] آشنا هستید.در پس هر سیگنال صوتی، اعم از موسیقی، جلوهی صوتی یا صدای گفتار، نویز وجود دارد. این نویز ممکن است از محیط ضبط، مشکلات سیستم، وسایل الکترونیکی مجاور یا منابع دیگری ایجاد شود.
حتی اگر همهی نویزهای اتاق را حذف کنید، باز هم نویز ذاتی[۲۵] دستگاه ضبط صدا را خواهید داشت.
در حالت ایدهآل میخواهیم که نسبت سیگنال به نویز تا حد ممکن بزرگ باشد. اینجاست که فناوری صوتی آنالوگ به طور جدی در مقابل فناوری صوتی دیجیتال کم میآورد.
نویز ذاتی نوار و صفحه وینیل به طور قابل توجهی بیشتر از نویز ذاتی یک سیستم صوتی دیجیتال معمولی است. اطمینان دارم که صدای خش خش نوار را روی یک صدای ضبط شدهی قدیمی یا تق تق کردن و پرش یک صفحه وینیل قدیمی را شنیدهاید. اشتباه نکنید، این نویز میتواند یک حس نوستالژیک به این تجربهی شنیداری بیفزاید. اما بیایید صادق باشیم، اگر نویز نداشت بهتر نبود؟
صدای ضبط شده با فناوری دیجیتال کف نویز دارد، اما بسیار پایین است. از لحاظ نظری، کف نویز صدای ضبط شدهی دیجیتال 24 بیتی برابر است با dB Fs 144- که یعنی عملاً وجود ندارد.
وقتی نوبت به نویز میرسد، بدون شک دیجیتال برنده است.
وفاداری
بیایید در مرحلهی بعد، وفاداری به سیگنال اصلی را بین فناوری صوتی آنالوگ و دیجیتال مقایسه کنیم. ابتدا لازم است «وفاداری» را تعریف کنیم. بر اساس واژهنامهی آکسفورد، وفاداری را میتوان اینطور تعریف کرد: «درجهی یکسان بودن با اصل آن چیزی که کپی یا بازتولید میشود.» بنابراین در اینجا پرسش این است که «کدام فناوری میتواند دقیقترین بازنمایی را از سیگنال ورودی اصلی ضبط، ذخیره و بازتولید کند؟»
توجیهات زیادی دربارهی اینکه چرا صدای آنالوگ از صدای دیجیتال بهتر است، شنیدهام. به مرور زمان، متوجه شدم که بیشتر این توجیهات ناشی از درک نادرست از چگونگی عملکرد فناوری صوتی دیجیتال است. در اینجا ممکن است باعث ناراحتی برخی افراد شوم، اما به یاد داشته باشید که من فقط در حد توانم حقایق را مطرح میکنم…
یکی از رایجترین تصورات غلط مربوط به میزان وضوح[۲۶] شکلموج صوت دیجیتال است. در حقیقیت، خود من نیز این یکی را باور داشتم. این تصور غلط بر این باور است که مبدل آنالوگ به دیجیتال قادر به ثبت کاملاً دقیق شکلموج نیست. منطق پشت این باور غلط در نگاه اول معتبر به نظر میرسد…
«اگر یک سیستم صوتی دیجیتال در هر ثانیه فقط تعداد محدودی اسنپشات[۲۷] (یا نمونه) را ثبت میکند و هر نمونه فقط میتواند تعداد محدودی از مقادیر را نشان دهد، چگونه ممکن است یک شکلموجِ بینهایت هموار، مانند موج صوتی اصلی ایجاد کند؟»
برای درک پاسخ میتوانیم از قضیهی نایکوئیست کمک بگیریم. پیش از این دربارهی قضیهی نایکوئیست گفتم، اما بیایید بار دیگر نگاهی به آن بیاندازیم.
قضیهی نایکوئیست بیان میکند که تا زمانی که یک شکلموج با نرخ بیش از دو برابر در هر چرخه نمونهبرداری شود، آن شکلموج میتواند بدون هیچ اتلافی ثبت و بازتولید شود. بنابراین نرخ نمونهبرداری یک فایل صوتی، تعیینکنندهی بالاترین فرکانسی است که میتوان بدون اتلاف نمونهبرداری کرد. از لحاظ نظری، یک فایل صوتی با نرخ نمونهبرداری ۴۸ کیلوهرتز قادر است تا فرکانسهای حداکثر (دقیقاً زیر) ۲۴ کیلوهرتز – نصف نرخ نمونهبرداری – را به طور کامل ضبط و بازتولید کند. با توجه به اینکه به طور کلی دامنهی شنوایی انسان و فیلترهای پایینگذر[۲۸] در میکروفونها و سایر تجهیزات صوتی در بالاترین میزان به حدود ۲۰ کیلوهرتز میرسد، میتوانیم با اطمینان بگوییم که نرخ نمونهبرداری ۴۸ کیلوهرتز دامنهی فرکانسی مناسبی را فراهم میکند.
با نگاهی دقیقتر به نمونههای داخل محیط کار صوتی دیجیتال[۲۹]، میبینیم که آنها به صورت مجموعهای از نقاطی که با خطوط مستقیم به هم وصل میشوند، نشان داده شدهاند. این تصویر میتواند گمراهکننده باشد…
درست است که نمونهها فقط مجموعهای از نقاط هستند که وضعیت شکلموج را در هر لحظه از زمان نشان میدهند، اما در آخر، موج صوتی حاصل اینطور ناهموار نخواهد بود.
واقعیت این است که شکلموجهای بازپخش شده از طریق مبدل دیجیتال به آنالوگ، مشابه شکلموجهای اصلی ضبط شده با مبدل آنالوگ به دیجیتال خواهند بود.
تا زمانی که بالاترین فرکانس از فرکانس نایکوئیست فراتر نرود، فقط یک مسیر وجود دارد که شکلموج آن را طی کند. و حالا، صادقانه بگویم… من هنوز هم در فهم کامل این بخش دچار مشکل هستم.
برای همین توصیه میکنم این ویدیو را ببینید.
تماشای آن رایگان است و به عنوان یکی از بهترین ویدیوها در رد این تصور که صدای آنالوگ نسبت به صدای دیجیتال به نوعی «صافتر» است یا «وضوح بالاتری» دارد، مطرح شده است.
من هر سال خود را در حال تماشای این ویدیو مییابم و هر بار متوجه مطالبی میشوم که قبل از آن برایم بیمعنی بود. بنابراین، اگر بعد از نگاه کردن برای اولین بار همه چیز را کاملاً متوجه نشدید، حس بدی نداشته باشید.
اختلاط فرکانس
یک اشکال دیگر که در فناوری صوتی دیجیتال وجود دارد و ذکر آن مهم است اختلاط فرکانس است. این موضوع نیز به قضیهی نایکوئیست مربوط میشود. اگر مبدل آنالوگ به دیجیتال تلاش کند تا فرکانسهایی که از فرکانس قضیهی نایکوئیست بیشتر است را نمونهبرداری کند، باعث اختلاط فرکانس میشود.
در سطح پایه، اختلاط فرکانس وضعیتی را توصیف میکند که مبدل آنالوگ به دیجیتال به علت محدودیتهای ناشی از نرخ نمونهبرداری، فرکانس بالا را به جای فرکانس بسیار پایینتر اشتباه میگیرد.
مهندسین در تلاش برای رفع این مشکل، فیلترهای پایینگذر را روی زنجیرهی سیگنال اعمال میکنند که مانع کوانتیزاسیون فرکانسهای فراتر از فرکانس نایکوئیست توسط سیستم میشوند. به همین دلیل، برای ثبت سیگنال ۲۰ کیلوهرتز از نرخ نمونهبرداری ۴۰ کیلوهرتز استفاده نمیکنیم، بلکه به جای آن از نرخهای نمونهبرداری مانند ۴۸ کیلوهرتز، ۹۶ کیلوهرتز و یا بیشتر استفاده میکنیم. این کار این امکان را برای فیلتر پایینگذر فراهم میکند تا فرکانسهای اضافی را حذف کند بدون اینکه بر دامنهی فرکانسی قابل شنیدن تأثیر منفی بگذارد. این هم موضوع دیگری است که هر چه بیشتر در آن عمیق شوید، پیچیدهتر میشود – بنابراین به ویدیوی دیگری که مفهوم آن را به خوبی توضیح میدهد، اشاره میکنم. اگر برای شما سؤال است که نرخ نمونهبرداری را تا چه حد باید بالا ببرید، این ویدیو به شما خیلی کمک خواهد کرد.
اعوجاج هارمونیک و غیرخطی بودن
بسیار خب، جدای از موضوع نویز، وفاداری به سیگنال اصلی در صدای آنالوگ و صدای دیجیتال بسیار به هم نزدیک است. اما چه چیزی در مورد صدای آنالوگ وجود دارد که آن را برای بسیاری از مردم «گرمتر» یا «بهتر» میکند؟
احتمالاً دلیل آن را میتوان در اعوجاج و نویزی که در استفاده از تجهیزات آنالوگ به وجود میآید، خلاصه کرد. همانطور که قبلاً گفته شد، با هر بار عبور سیگنال از یک وسیله به وسیلهی دیگر، نویز ذاتی هر دستگاه بخشی از سیگنال خواهد شد. نه تنها این، بلکه مداربندی آنالوگ نیز، اعوجاج هارمونیک[۳۰] را به سیگنال اضافه میکند که همیشه هم چیز بدی نیست. در زمینهی وفاداری، این یک پیروزی دیگر برای فناوری صوتی دیجیتال است زیرا میتوان سیگنال را با پردازشکنندهی سیگنال دیجیتال پردازش کرد که واقعاً در آن از نویز و اعوجاج هارمونیک ناشی از پردازش آنالوگ خبری نیست.
بنابراین، اگر به دنبال شفافیت هستید، فناوری صوتی دیجیتال نسبت به آنالوگ برتر است. اما همانطور که گفتم، اعوجاج هارمونیکِ مرتبط با صدای آنالوگ لزوماً چیز بدی نیست. برخی اوقات، شما به دنبال صدای شفاف نیستید و ممکن است رنگی که تجهیزات آنالوگ به سیگنال میدهند، مطلوب شما باشد.
اوردرایو[۳۱] کردن سیستم آنالوگ و اشباع نوار آنالوگ صدای فوق العادهای تولید میکند. تجهیزات آنالوگ وقتی اوردرایو شوند، تمایل به تولید صدای طبیعیتر و موسیقاییتر دارند. با نزدیک شدن به محدودیتهای مداربندی یا نوار آنالوگ، کیفیت سیگنال شروع به تغییر میکند. این پاسخ غیرخطی به سیگنالها میتواند توسط سیستمهای دیجیتال مدلسازی شود، اما در سیستمهای آنالوگ بخشی از ساختار آن است. در سیستمهای دیجیتال، مهم نیست که سطح سیگنال مرتبط با محدودیتهای سیستم چه اندازه باشد، تا زمانی که سیگنال از این محدودیتها فراتر نرود، سیستم رفتاری یکسان خواهد داشت. وقتی که سطح سیگنال در سیستم دیجیتال از 0 dbFs بالاتر رود، بلافاصله قطع میشود که در %99 مواقع صدای وحشتناکی دارد.
میخواهم این جزئیات را به عنوان یک پیروزی برای هر دو سیستم آنالوگ و دیجیتال در نظر بگیرم. از یک سو، کار کردن در محیط دیجیتال خطی و شفاف برای به دست آوردن بیشترین وفاداری ممکن به سیگنال اصلی، بسیار خوب است. از سوی دیگر، تونهایی[۳۲] که میتوان با ساختار ماهرانهی بهره[۳۳] در قلمروی آنالوگ به دست آورد نیز عالی است.
تولید و ویرایش
با اینکه تمرکز ما روی تفاوتهای بین فناوری صوتی آنالوگ و دیجیتال در روند تولید است، موارد جالب توجهی دیگری هم وجود دارد. اگر برای بیشتر از ۲۵ سال در زمینهی تولید صدا کار کرده باشید، خواهید دانست که من میخواهم سراغ چه چیزی بروم. اما اگر نسبتاً در این حوزه تازهکار باشید، ممکن است برایتان چندان مشخص نباشد. پیش از این دربارهی روند کلی ضبط صدای دیجیتال و آنالوگ بحث کردیم. در آنالوگ – سیگنالها روی نوار مغناطیسی ذخیره میشوند و از طریق یک دستگاه ضبط صوت نواری بازپخش میشوند. در دیجیتال – سیگنالها روی یک هارد درایو ذخیره میشوند و از طریق رایانه بازپخش میشوند.
جدای از روند اصلی ضبط و بازپخش، تفاوتهای زیادی میان تولید موسیقی با فناوریهای آنالوگ و دیجیتال وجود دارد. یکی از بزرگترین تفاوتها، روند ویرایش است. خوب دقت کنید، زیرا اینجا وقتی صحبت از ویرایش میشود، در مزایای فناوری صوتی دیجیتال اصلاً اغراق نمیکنم! ما در یک محیط کار صوتی دیجیتال (یا DAW)، میتوانیم برشها و تنظیماتی را بر روی تمام بخشهای یک برش پیاده کنیم بدون اینکه نگران اشتباهی برگشتناپذیر باشیم. در محیط ویرایش دیجیتال غیرمخرب[۳۴]، همیشه میتوانیم دکمهی «برگشت به قبل[۳۵]» را فشار دهیم و به جای قبلی برگردیم.
اما ویرایش آنالوگ باید با تیغ و نوار چسب انجام شود و نوار به صورت فیزیکی بریده و دوباره به هم وصل شود. بر خلاف محیط کار صوتی دیجیتال، ویرایشگر نوار آنالوگ مجبور است برای تشخیص اینکه کجا را باید برش بزند، فقط به گوشهایش تکیه کند و باید برشهای مورب بزند تا محو و افزایش تدریجی همزمان صدا[۳۶] بین دو برش میسر شود. هر کسی که با نوار آنالوگ کار کرده باشد، احتمالاً در این وضعیت ناخوشایند قرار گرفته است که نوار از حلقه باز شود و ساعت بعد، تماماً صرف دوباره با دقت جمع کردن آن شود.
اگر در ویرایش آنالوگ اشتباه کنید، احتمالاً راهی برای نجات کار خود از نابودی نخواهید داشت. نه تنها این، بلکه عملاً هیچ محدودیتی برای تعداد آهنگهایی که میتوان در یک تولید دیجیتال انباشته کرد، وجود ندارد، در حالی که ظرفیت بیشتر نوارهای آنالوگ چندآهنگی، حداکثر به ۲۴ آهنگ میرسد. این پیشرفتهای فناوری، نه تنها تولید موسیقی، بلکه خود موسیقی را نیز به کلی متحول کرده است! فکرش را بکنید – توانایی انجام ویرایشهای دقیق روی فایلهای صوتی چندآهنگ و ضبط هر تعداد آهنگی که میخواهید بدون عواقب منفی. این مزایا درها را به روی ضبط صداهای بسیار پرجزئیات و صیقل داده شده با استفاده از فناوری صوتی دیجیتال گشوده است.
قابلیت حمل و دوام
پس از پایان روند تولید، همچنان نیاز به راهی برای توزیع این محصول به میلیونها شنونده داریم. به راحتی میتوان گفت این بزرگترین تفاوت بین صدای آنالوگ و دیجیتال است. بهترین روش برای توزیع صدای آنالوگ صفحه وینیل است. نوار، حجیم و جاگیر است و علاوه بر آن بازتولید و نگهداری از آن دشوارتر است. با این حال صفحه وینیل نیز دارای معایبی است. اولاً، صفحه وینیل یک رسانهی فیزیکی است و این بدان معناست که کپی هر نسخه از آن هزینهبر است و باید به صورت فیزیکی برای شنوندگان ارسال شود.
ثانیاً، صفحه وینیل به مرور زمان دچار تغییر میشود. نه تنها نوار اصلی که روی صفحه وینیل چاپ میشود افت کیفیت پیدا میکند، بلکه هر بار که به یک صفحه وینیل گوش میکنید، کیفیت صدا بیشتر دچار افت میشود. امروزه، صدای دیجیتال را میتوان روی اینترنت بدون افت کیفیت استریم کرد. سریعاً میتوانید تعداد نامحدودی نسخه از یک فایل را بدون افت کیفیت به سراسر دنیا بفرستید.
نه تنها این، بلکه یک فایل صوتی را میتوان بارها و بارها شنید بدون اینکه آسیب ببیند یا کیفیت آن افت کند. علاوه بر آن، فایلهای دیجیتال در مقایسه با صفحه وینیل فضای خیلی کمتری اشغال میکنند. وقتی که فضایی که ۱۰۰۰ آهنگ بر روی صفحه وینیل اشغال میکند را با فضایی که ۱۰۰۰ آهنگ روی هارد درایو اشغال میکند مقایسه میکنید، جایی برای رقابت باقی نمیماند.
بحث همچنان ادامه دارد
واقعیت این است که سیستمهای صوتی آنالوگ و دیجیتال هر دو در دنیای مدرن ارزشمند هستند. بحث دربارهی اینکه کدام بهتر است و کدام بدتر هرگز پایان خواهد یافت زیرا پاسخ روشنی برای این پرسش وجود ندارد.
یک میلیون کاربرد برای فناوری صوتی وجود دارد و هر یک از آنها مستلزم مجموعهای منحصر به فرد از تجهیزات است. این ما هستیم که باید به عنوان یک مهندس صدا، موسیقیدان یا شنونده، دربارهی مجموعهای از تجهیزات صوتی که نیازهای هر موقعیت منحصر به فرد را برآورده می کند، تصمیمگیری کنیم. آنچه که واقعاً حائز اهمیت است…
با وجودی که عاشق صحبت کردن دربارهی نکات ظریف مانند تفاوت میان آنالوگ و دیجیتال هستم، اما وقتی نوبت به کیفیت صدا میرسد، این جزئیات نسبتاً کماهمیت هستند. اگر واقعاً خواهان بهترین کیفیت صدای ممکن هستید، توصیهی من به شما این است که روی مسائل مهمتری مانند تنظیم و نصب مناسب بلندگوها تمرکز کنید.
این کار تفاوت زیادی در کیفیت صدا ایجاد میکند و کاملاً رایگان است! در حقیقت، میخواهم به شما که تا اینجا مطلب را دنبال کردید، هدیهای بدهم .
این لینک راهنمای نصب بلندگوها را دنبال کنید تا به شما کمک کند که مطمئن شوید سیستم شما برای عملکرد بهینه تنظیم شده است.
[۱] Vinyl صفحهی گرامافون
[۲] Record head
[۳] Amplitude
[۴] Magnitude
[۵] Correlate تمایل دو یا چند سیستم که به طور مستقل رفتار سادهای از خود نشان می دهند، اما پس از تعامل با یکدیگر در همبستگی با هم رفتاری پیچیده و بدیع را شکل میدهند.
[۶] Play head
[۷] Dropouts وقفهی نامنظم در ضبط به دلیل کاهش یا عدم وجود سیگنال صوتی
[۸] PCM (Pulse Code Modulation)
[۹] Binary دودودیی – دوتایی
[۱۰] Bit
[۱۱] Quantization
[۱۲] Noise floor اندازهگیری سیگنال ایجاد شده از مجموع تمام منابع نویز و سیگنالهای ناخواسته در یک سیستم اندازهگیری است؛ سطحی که این نویز در آن قرار میگیرد را کف نویز میگویند. کف نویز حداقل توان ورودی است که سیستم میتواند اندازه گیری کند، زیرا هرگونه سیگنال دیگری در آن نویز از بین می رود. در این سیستم اندازهگیری هر سیگنالی غیر از سیگنال تحت نظارت نویز تلقی میشود.
[۱۳] CD
[۱۴] Floating point عددی بدون تعداد ثابت رقم قبل و بعد از اعشار.
[۱۵] Sample rate
[۱۶] Nyquist–Shannon sampling theorem قضیهی نمونهبرداری نایکوئیست-شنون بنیادیترین قضیه در پردازش سیگنال است که شرط لازم در امکان بازیابی سیگنال اولیه از نمونههای آن را بیان میکند. بر اساس این قضیه، فرکانس نمونه برداری باید حداقل دو برابر بالاترین جزء فرکانس سیگنال و یا به عبارتی نصف نرخ نمونهبرداری باشد.
[۱۷] Anti-aliasing filter نوعی فیلتر که روی ورودی مبدل آنالوگ به دیجیتال قرار میگیرد و اجزای سیگنال بالاتر از فرکانس نایکوئیست (Nyquist frequency) را حذف میکند. بر اساس این قضیه، فرکانس نایکوئیست بالاترین فرکانسی است که با توجه به نرخ نمونهبرداری میتوان آن را به درستی نمونهبرداری کرد. مقدار این فرکانس نصف نرخ نمونهبرداری است. بدین ترتیب فیلتر تصحیح فرکانس با حذف سیگنالهای بالاتر از فرکانس نایکوئیست مانع ایجاد اختلاط فرکانس یا Aliasing در سیگنال اصلی پس از بازیابی آن میشود. اختلاط فرکانس زمانی رخ میدهد که به دلیل عدم تناسب نرخ نمونه برداری با فرکانس نایکوئیست، فرکانس سیگنال به درستی اندازهگیری نمیشود. این اتفاق با ایجاد تغییرات ناخواسته در سیگنال اصلی بازیابیشده از سیگنال نمونهبرداریشده، باعث افت کیفیت آن میشود.
[۱۸] Artifact هر گونه خطای صوتی ناخواسته یا نوسانات تصادفی ناشی از محدودیت های فنی در نحوه ضبط، ویرایش یا دستکاری که بر شدت سیگنال اثر میگذارد.
[۱۹] Stream روشی برای پخش محتوای صوتی یا تصویری به صورت جاری؛ به این معنا که جریانی از دادهها به صورت تدریجی از فرستنده به گیرنده منتقل میشود. در این روش گیرنده برای دسترسی به محتوا نیاز ندارد که ابتدا تمام محتوا را بارگیری کند، بلکه فرستنده، محتوا را به صورت جاری ارسال میکند و هم زمان با ارسال دادهها از طرف فرستنده، محتوا برای گیرنده قابل مشاهده است.
[۲۰] Dynamic range compression
[۲۱] Lossy vs Lossless Audio
[۲۲] Tidal
[۲۳] Waveform
[۲۴] Signal-to-noise ratio نسبتی برای مقایسهی سطح سیگنال مطلوب با سطح نویز پس زمینه.
[۲۵] Inherent noise نویز اجتناب ناپذیر درون خود دستگاه که از تداخلات تصادفی سطح مولکولی در سیستمهای الکترونیکی نشأت میگیرد.
[۲۶] Resolution
[۲۷] Snapshot نشانگرهای مرجع برای دادههایی که وضعیت یک سیستم را در یک زمان خاص نشان میدهند.
[۲۸] Low pass filter نوعی فیلتر که سیگنالهایی با بسامدی کمتر از یک بسامد معین را عبور میدهد.
[۲۹] DAW (Digital Audio Workstation)
[۳۰] Harmonic distortion اعوجاج هارمونیک عبارت است از وجود فرکانس هایی در خروجی دستگاه که در سیگنال ورودی وجود ندارد.
[۳۱] Overdrive
[۳۲] Tone
[۳۳] Gain
[۳۴] Non-destructive digital editing ویرایش دیجیتال غیرمخرب این امکان را فراهم میکند که در فایل تغییراتی ایجاد کنیم بدون اینکه نیاز باشد دادههای جدید را روی دادههای اصلی قرار دهیم. چون تغییرات در لایههای جداگانه انجام میشود، دادههای اصلی در دسترس باقی میماند و برگشت به آن امکانپذیر است. از آنجا که ویرایش غیرمخرب، دادهها را از فایل اصلی حذف نمی کند، کیفیت فایل بعد از ویرایش افت نمیکند.
[۳۵] Undo
[۳۶] Crossfade