فناوری صوتی آنالوگ در مقابل فناوری صوتی دیجیتال:

فناوری صوتی آنالوگ در مقابل فناوری صوتی دیجیتال: کدام بهتر است؟

نویسنده کایل ماتیاس

۷ نوامبر ۲۰۱۹

مترجم فرناز واشقانی فراهانی

بحث درباره‌‌ی فناوری صوتی آنالوگ در مقابل فناوری صوتی دیجیتال بسیار دو قطبی است. من متوجه شده‌ام که بیشتر مردم مدافع یکی از این دو هستند و تغییر یا تعدیل نظرشان چندان امکان‌پذیر نیست.

کدام یک بهتر است – صدای آنالوگ یا صدای دیجیتال؟ خب، بستگی دارد از چه کسی بپرسید…

اگر از من بپرسید، می‌گویم آنالوگ و دیجیتال هر دو مزایا و معایبی دارند. در انتهای این مطلب شما مهم‌ترین تفاوت‌های آنها را خواهید آموخت و خودتان می‌توانید تصمیم بگیرید.

تفاوت اصلی میان صدای آنالوگ و صدای دیجیتال چیست؟

تفاوت میان فناوری صوتی آنالوگ و فناوری صوتی دیجیتال در شیوه‌ی ذخیره‌ی اطلاعات صوتی است. امواج صوتی مجموعه‌ای از ارتعاشات است که از طریق یک واسط ایجاد می‌شود. فناوری ضبط صدای آنالوگ این اطلاعات را با ایجاد مجموعه‌ای از بارهای مغناطیسی روی یک حلقه نوار مغناطیسی ذخیره می‌کند. فناوری ضبط صدای دیجیتال این اطلاعات صوتی را به صورت مجموعه‌ای از مقادیر عددی روی یک هارد درایو ذخیره می‌کند.

در این نوشته شما معایب و مزایای هر یک از این دو روش‌ ضبط را همراه با تفاوت‌های بین فناوری‌های صوتی آنالوگ و دیجیتال برای پخش صدای زنده خواهید آموخت.

تفاوت میان فناوری صوتی آنالوگ و فناوری صوتی دیجیتال در شیوه‌ی ذخیره‌ی اطلاعات صوتی است. فناوری ضبط صدای آنالوگ این اطلاعات را با ایجاد مجموعه‌ای از بارهای مغناطیسی بر روی یک حلقه نوار مغناطیسی ذخیره می‌کند. فناوری ضبط صدای دیجیتال این اطلاعات صوتی را به صورت مجموعه‌ای از مقادیر عددی روی یک هارد درایو ذخیره می‌کند.

اطلاعات ارائه شده در مطلب پیش رو طوری بیان شده است که فهم آن تا حد امکان آسان باشد. اگر شما درک بنیادی از نحوه‌ی عملکرد صدا داشته باشید، فهم بهتری از برخی مفاهیم این نوشته خواهید داشت. اگر هر یک از قسمت‌های پیش رو گیج‌کننده بود، به مطلبی که درباره‌ی مبانی صوت نوشته‌ام رجوع کنید.

قبل از اینکه بحث در رابطه با تفاوت‌های بین سیستم‌های صوتی دیجیتال و آنالوگ را آغاز کنم، فکر می‌کنم لازم است متذکر شوم که همه‌ی سیستم‌های صوتی دیجیتال، برخی از فناوری‌های صوتی آنالوگ را شامل می‌شوند.میکروفون‌ها ابزار صوتی آنالوگ هستند که انرژی صوتی را به سیگنال الکتریکی آنالوگ تبدیل می‌کنند. پیش‌تقویت‌کننده‌ها، تقویت‌کننده‌های توان و بلندگوها نیز همگی ابزار آنالوگ هستند.

تمرکز اصلی این بخش روی برجسته کردن تفاوت‌های میان فناوری‌های ضبط صدای آنالوگ و دیجیتال خواهد بود.

تعریف فناوری صوتی آنالوگ

بیایید با نگاهی به رایج‌ترین قالب‌های صدای آنالوگ شروع کنیم – نوار و صفحه وینیل [۱]. درک

بنیادی از چگونگی عملکرد این قالب‌ها، می‌تواند در فهم آنها کمک‌کننده باشد.

نوار

نوار مغناطیسی باکیفیت‌ترین روش برای ضبط و بازپخش صدای آنالوگ است. دستگاه‌‌های ضبط صوت نواری مطابق با این اصل عمل می‌کنند: وقتی که یک جریان الکتریکی از طریق سیم فرستاده می‌شود، یک میدان مغناطیسی در اطراف سیم ایجاد میشود و بالعکس.

دستگاه‌‌ ضبط صوت نواری به ما این امکان را می‌دهد که امواج جریان‌ متناوب را از میکروفون بگیریم و به صورت بار روی نوارهای مغناطیسی ذخیره کنیم. وقتی که نوار مغناطیسی را از طریق ضبط صوت بازپخش می‌کنید، دوباره به جریان‌های الکتریکی قابل پخش از بلندگوها تبدیل می‌شود.

یک دستگاه‌‌ ضبط صوت نواری برای ضبط صدا سیگنال‌های صوتی الکتریکی را از طریق سیم پیچیده شده دور یک آهن‌ربا که در مجاورت نوار مغناطیسی قرار دارد، می‌فرستد؛ این سیم پیچ دور آهن‌ربا را هِد ضبط [۲] می‌نامند.

وقتی نوار از میدان مغناطیسی ایجاد شده توسط هد ضبط عبور می‌کند، ذرات در امتدادِ نوار دارای بار مغناطیسی می‌شوند. الگوی بارهای مغناطیسیِ در امتداد نوار شبیه سیگنال‌های صوتی فرستاده شده از طریق سیم پیچ هستند.

دامنه‌ی‌[۳] سیگنال‌ صوتی با مقدار [۴] بارهای مغناطیسی ایجاد شده روی نوار همبستگی دارد [۵].

در بازپخش صدا، این فرایند معکوس می‌شود. نوار مغناطیسی یک جریان الکتریکی روی هِد پخش[۶] ایجاد می‌کند که به یک تقویت‌کننده وصل می‌شود تا صدا از طریق بلندگوها پخش شود.

انواع مختلفی از نوار و دستگاه‌های ضبط نواری وجود دارند که بر کیفیت صدای ضبط شده تأثیرگذار هستند. دو متغیر اصلی عبارتند از سرعت نوار و پهنای نوار.

سرعت نوار

سرعت عبور نوار از جلوی هد ضبط بر کیفیت صدای ضبط شده تأثیر می‌گذارد. سرعت نوار بالاتر، صدایی با پاسخ فرکانسی بیشتر، خش خش کمتر و وقفه‌‌ی [۷] کوتاه‌تر را ضبط می‌‌کند.

سرعت دستگاه ضبط صوت نواری با واحد اینچ بر ثانیه اندازه‌گیری می‌شود (ips). سرعت‌های متداول دستگاه‌های ضبط صوت نواری ips _۲/^۱-7، ips 15، ips 30 هستند. استاندارد ضبط صدای حرفه‌ای ips 15 می‌باشد.

پهنای نوار

پهنای نوار نیز بر کیفیت صدای ضبط شده تأثیرگذار است. نوار پهن‌تر امکان ضبط صدا با کیفیت بالاتر را فراهم می‌کند.

با این حال، می‌توان از پهنای نوار به جای استفاده جهت بهبود کیفیت صدای یک آهنگ تک، برای ضبط آهنگ‌های بیشتر استفاده کرد. در این صورت این امکان فراهم می‌شود تا چند منبع به طور مستقل ضبط و بازپخش شوند.

صفحه‌ وینیل

صفحه‌های وینیل رسانه‌ی مصرفی استاندارد برای ضبط صدا به صورت آنالوگ هستند. در تلاش برای توزیع صدا در مقیاس بالا، می‌توان صداهای ضبط شده را از نوارهای آنالوگ روی صفحه‌های وینیل کپی کرد.

هرچند که کیفیت صدای صفحه‌ وینیل به خوبی نوار اصلی نیست، اما تولید انبوه صفحه وینیل آسان‌تر است زیرا فضای کمتری اشغال می‌کند و بادوام‌تر است.

صفحه‌های وینیل در مقایسه با نوار، در برابر عناصر مختلف آسیب‌پذیری کمتری دارند. بر خلاف نوار که با در معرض مغناطیس قرار گرفتن از بین می‌رود، صفحه‌های وینیل در برابر میدان‌های مغناطیسی مصون هستند زیرا از روش متفاوتی برای ذخیره‌سازی صدا استفاده می‌کنند.

به جای بار مغناطیسی، این شیارهای بافت‌دار روی سطح صفحه‌های وینیل هستند که اطلاعات صوتی را ذخیره می‌کنند.

همینطور که صفحه‌ وینیل با سرعتی معین می‌چرخد، یک قلم سوزنی میان شیارهای روی سطح آن حرکت می‌کند. همینطور که قلم سوزنی روی شیارها عقب و جلو می‌رود، در سیمی که به یک تقویت‌کننده وصل است تا صدا را از بلندگوها پخش کند، یک جریان الکتریکی ایجاد می‌کند. دامنه‌ی سیگنال صوتی با شدت حرکت قلم سوزنی همبستگی دارد.

می‌توانید انیمیشن چگونگی عملکرد صفحه‌ وینیل که Animagraffs ساخته است را مشاهده کنید. Animagraffs وبسایتی است که انیمیشن‌های عالی از فناوری‌های مختلف درست می‌کند.از صفحه‌های وینیل در دنیای مدرن فقط برای بازپخش صدا استفاده می‌شود. ضبط صدا به صورت آنالوگ با استفاده از نوارهای مغناطیسی انجام می‌شود. سپس از نوارها برای ساخت قالب جهت پِرِس کردن اطلاعات روی صفحه‌های وینیل استفاده می‌کنند.

تعریف فناوری صوتی دیجیتال

طبیعتاً بیشتر موسیقی‌ مدرن با استفاده از فناوری دیجیتال ضبط می‌شوند. بیایید مبانی بنیادین فناوری صوتی دیجیتال را بررسی کنیم تا بتوانم درک بهتری از مقایسه‌ی آن با فناوری صوتی آنالوگ داشته باشیم.

پی سی ام (مدولاسیون کد پالس)

پی سی ام یا مدولاسیون کد پالس [۸] روشی استاندارد برای کدگذاری سیگنال‌های صوتی به اطلاعات باینری [۹] است.

در ضبط صدای آنالوگ، مدلی از امواج صوتی با استفاده از بار مغناطیسی ایجاد می‌شود. اما پی سی ام با ذخیره‌‌ی یک توالی از مقادیر عددی که نشان دهنده‌ی دامنه در نقاط مختلف یک موج است، یک مدل از امواج صوتی را ایجاد می‌کند.

این مقادیر با استفاده از گروه‌‌هایی از بیت‌های [۱۰] باینری که به آنها نمونه می‌گویند، نشان داده می‌شوند. هر نمونه یک مقدار عددی را در یک محدوده‌ی از پیش تعیین شده‌ از مقادیر ممکن نشان می‌دهد. این روند را کوانتیزاسیون [۱۱] می‌‌نامند که توسط یک مبدل آنالوگ به دیجیتال انجام می‌شود (مبدل A به D).

موقع بازپخش صدای ضبط شده با فناوری دیجیتال، این نمونه‌ها دوباره به سیگنال‌های الکتریکی تبدیل و به بلندگوها فرستاده می‌شوند. این روند با استفاده از مبدل دیجیتال به آنالوگ انجام می‌شود (مبدل D به A یا DAC).

در زیر تصویری ساده از نحوه‌ی ذخیره‌ی امواج صوتی با استفاده از نمونه‌های دیجیتال را می‌بینید.

عمق بیت

هر نمونه، یک مقدار را در محدوده‌ی مقادیر ممکن نشان می‌دهد. این عمق بیت است که محدوده‌ی مقادیر ممکن را تعیین می‌کند. عمق بیت اصطلاحی است برای تعداد بیت‌های موجود در هر نمونه.

هر بیت می‌تواند دو مقدار ممکن را نشان دهد. صداهای ضبط شده‌‌ای که از بیت‌های بیشتری در هر نمونه استفاده می‌کنند، می‌توانند محدوده‌ی بزرگ‌تری از مقادیر را نشان دهند و نسبت به صداهای ضبط شده با عمق بیت پایین، کف نویز [۱۲] بسیار کمتری دارند.هر بار که یک بیت اضافه می‌شود، تعداد مقادیر ممکن دو برابر می‌شود. در حالی که یک بیت دو مقدار را نشان دهد، دو بیت می‌تواند چهار مقدار و سه بیت می‌تواند ۸ مقدار را نشان دهد و به همین ترتیب ادامه پیدا کند.

عمق بیت

۱ بیت
۲ بیت
۴ بیت
۸ بیت
۱۶ بیت (استاندارد سی‌دی [۱۳])
۲۴ بیت (استاندارد حرفه‌ای)

مقادیر ممکن

۲
۴
۱۶
۲۵۶
۵۳۶,۶۵
۲۱۶,۷۷۷,۱۶

عمق بیت استاندارد برای سی‌دی ۱۶ بیت است که ۵۳۶,۶۴ مقدار دامنه‌ی ممکن را فراهم می‌کند. استاندارد حرفه‌ای عمق بیت ۲۴ بیت است که ۲۱۶,۷۷۷,۱۶ مقدار دامنه‌ی ممکن را فراهم می‌کند! بیشتر استودیوهای حرفه‌ای با استفاده از نقطه شناور [۱۴] ۳۲ بیتی ضبط و میکس می‌کنند.

نرخ نمونه‌برداری

نرخ نمونه‌برداری[۱۵] مشخص می‌کند که چه تعداد نمونه از یک موج صوتی در ثانیه گرفته می‌شود. نرخ نمونه‌برداری با واحد هرتز (Hz) اندازه‌گیری می‌شود. ضبط با نرخ نمونه‌‌برداری بالاتر، امکان ضبط فرکانس‌های بالاتر را هم فراهم می‌کند.

قضیه‌ی نایکوئیست [۱۶] بیان می‌کند که نمونه‌برداری دیجیتال تنها می‌تواند فرکانس‌های کمتر از نصف نرخ نمونه‌برداری را به درستی نشان دهد. این بدان معناست که اگر بخواهید ۲۰ کیلوهرتز، یعنی بالاترین فرکانس قابل شنیدن برای انسان را ضبط کنید، باید از نرخ نمونه‌برداری بیشتر از ۴۰ کیلوهرتز استفاده کنید.به همین دلیل ۱.۴۴ کیلوهرتز نرخ نمونه‌برداری استاندارد برای سی‌دی‌ها است. صدای حرفه‌ای برای ویدیو از استاندارد ۴۸ کیلوهرتز بهره می‌برد. بسیاری از ضبط صداها با نرخ نمونه‌برداری ۹۶ کیلوهرتز و بیشتر، تا حد خیلی زیادی از این استانداردها فراتر می‌روند! با وجودی که اغلب اوقات، گسترش محدوده‌ی فرکانس ضبط شده را از مزایای نرخ نمونه‌برداری بالاتر تلقی می‌کنند، اما این مزیت اصلی آن نیست. در این نوشته زیاد به عمق این مطلب نمی‌روم، اما مزیت آن بیشتر به نوع فیلتر تصحیح فرکانس [۱۷] آن مربوط است که می‌تواند برای فیلتر کردن فرکانس‌های بالاتر با آرتیفکت [۱۸] کمتر استفاده شود. پهنای باند قابل شنیدن حاصل از صدای ضبط‌شده‌ی ۱.۴۴ کیلوهرتز و ۹۶ کیلوهرتز در نهایت یکسان است.

قالب‌های فشرده‌سازی داده‌های صوتی دیجیتال

فایل‌های صوتی تولید شده در استودیوهای ضبط به دلیل حجم اطلاعاتی که شامل می‌شوند، بسیار بزرگ هستند. اگر یک آهنگ ۳ دقیقه‌ای با عمق بیت ۲۴ و نرخ نمونه‌برداری ۹۶ کیلوهرتز ضبط شود، سایز آن حدوداً ۵۲ مگابایت خواهد شد.

در روزهای ابتدایی اینترنت و پخش‌کننده‌های موسیقی قابل حمل مانند آی‌پاد، داده‌‌های کامل و فشرده‌نشده‌ی پی سی ام برای استریم [۱۹] روی اینترنت یا ذخیره‌سازی روی هارد درایوهای کوچک، بسیار بزرگ بودند.

برای ایجاد فایل‌هایی با سایز کوچک‌تر، از فشرده‌سازی داده‌ها استفاده شد. این فشرده‌سازی را نباید با فشرده‌سازی دامنه‌ی دینامیکی [۲۰] اشتباه گرفت – در حقیقت، می‌توانید همه چیز درباره‌ی فشرده‌سازی داده‌ها را در یک مطلب دیگر از سایتAudio University با عنوان فایل صوتی بااتلاف در مقابل فایل صوتی بی‌اتلاف [۲۱]، بیاموزید.

فشرده‌سازی داده‌ها روشی برای کاهش حجم فایل است. دو دسته‌ی اصلی در فرمت‌های فشرده‌سازی داده‌ها وجود دارد که عبارتند از بااتلاف و بی‌اتلاف.

فرمت‌‌های فشرده‌سازی بااتلاف داده‌ها (MP3 و AAC)

متأسفانه پرکاربردترین فرمت فشرده‌سازی داده‌ها در فایل‌های صوتی مصرفی از نوع بااتلاف است. این بدان معناست که اگرچه الگوریتم‌های خاصی برای کاهش اثرات منفی استفاده می‌شود، اما داده‌ها در روند فشرده‌سازی فایل از بین می‌روند.

اگر اطلاعات در روند فشرده‌سازی داده‌ها از بین بروند، فرمت فشرده‌سازی مورد استفاده بااتلاف است. وقتی که داده‌ها از بین بروند دیگر نمی‌توان آنها را بازیابی کرد.

رایج‌ترین فرمت‌های فشرده‌سازی بااتلاف داده‌های صوتی MP3، AAC، و Ogg Vorbis هستند. این فرمت‌ها برای ذخیره‌سازی بسیاری از فایل‌ها روی فضای محدود هارد درایو یا استریمینگ محتوا روی کانکشن‌های اینترنتی با پهنای باند محدود استفاده می‌شوند.

هدف الگوریتم اختصاصی این فرمت‌ها این است که محتوا را بر اساس مدل‌های ادراک انسان از صدا الویت‌بندی کند و محتوای با الویت پایین را از بین ببرد.

فرمت‌‌های فشرده‌سازی بی‌اتلاف داده‌ها (FLAC و AIFF)

اگر در روند فشرده‌سازی داده‌ها، اطلاعات از بین نرود، فرمت فشرده‌سازی استفاده شده بی‌اتلاف است.

برخی خدمات استریمینگ مانند تیدال [۲۲] از فشرده‌سازی بی‌اتلاف بهره می‌برند. با استفاده از این فرمت‌ها، می‌توان اطلاعات را به فایل‌های کوچک‌تر کدگذاری کرد و بعداً کدبرداری کرد و در نهایت اطلاعات پی سی ام اصلی را به صورت یک فایل با فرمت WAV بازیابی کرد.

اگرچه این فرمت‌ها در مقایسه با فایل‌های فشرده‌ نشده مقداری فضا ذخیره می‌کنند، اما به هیچ وجه کارایی فرمت‌های بااتلاف را ندارند.

در حال حاضر، شاهد به وجود آمدن پلت‌فرم‌های استریمینگ ارائه‌دهنده‌ی فایل‌های صوتی بی‌اتلاف هستیم که در مقایسه با نسخه‌ی فشرده نشده‌ی اصلی افت کیفیت ندارند. با این حال، در چند دهه‌ی گذشته بیشتر پلت‌فرم‌ها فقط فایل‌های صوتی بااتلاف را ارائه داده‌اند که می‌تواند باعث افت شدید کیفیت صدا شود.

متأسفانه، این موضوع باعث بدنامی فناوری صوتی دیجیتال شده است. اما با من بمانید تا ببینید صدای دیجیتال به آن بدی که فکر می‌کنید نیست.

فناوری صوتی آنالوگ در مقابل فناوری صوتی دیجیتال: معایب و مزایا همانطور که می‌دانید، فناوری‌های ضبط صدای آنالوگ و دیجیتال هدف مشترکی دارند – ایجاد مدلی از شکل‌موج [۲۳] صوتی که بتواند تا حد امکان در بازپخش صدای ضبط شده دقیق باشد. هر دوی این فناوری‌ها در رسیدن به این هدف موفق عمل کرده‌اند. صدای ضبط شده با استفاده از هر کدام از این روش‌ها لزوماً بهتر از دیگری نیست، بلکه فقط متفاوت است. در این بخش، ویژگی‌های منحصر به فرد هر روش‌ بررسی خواهد شد.

برای تصمیم‌گیری در مورد اینکه کدام قالب برای کار در دست انجام بهتر است، لازم است برخی جزئیات را در نظر بگیریم.

نویز

یکی از مهم‌ترین تفاوت‌های میان صدای آنالوگ و دیجیتال میزان نویز است. اگر از علاقه‌مندان به صدا باشید، احتمالاً با مفهوم کف نویز و نسبت سیگنال به نویز [۲۴] آشنا هستید.در پس هر سیگنال صوتی، اعم از موسیقی، جلوه‌ی صوتی یا صدای گفتار، نویز وجود دارد. این نویز ممکن است از محیط ضبط، مشکلات سیستم، وسایل الکترونیکی مجاور یا منابع دیگری ایجاد شود.

حتی اگر همه‌ی نویزهای اتاق را حذف کنید، باز هم نویز ذاتی[۲۵] دستگاه ضبط صدا را خواهید داشت.

در حالت ایده‌آل می‌‌خواهیم که نسبت سیگنال به نویز تا حد ممکن بزرگ باشد. اینجاست که فناوری صوتی آنالوگ به طور جدی در مقابل فناوری صوتی دیجیتال کم می‌آورد.

نویز ذاتی نوار و صفحه‌ وینیل به طور قابل توجهی بیشتر از نویز ذاتی یک سیستم صوتی دیجیتال معمولی است. اطمینان دارم که صدای خش خش نوار را روی یک صدای ضبط شده‌ی قدیمی یا تق تق کردن و پرش یک صفحه وینیل قدیمی را شنیده‌اید. اشتباه نکنید، این نویز می‌تواند یک حس نوستالژیک به این تجربه‌ی شنیداری بیفزاید. اما بیایید صادق باشیم، اگر نویز نداشت بهتر نبود؟

صدای ضبط شده‌ با فناوری دیجیتال کف نویز دارد، اما بسیار پایین است. از لحاظ نظری، کف نویز صدای ضبط شده‌ی دیجیتال 24 بیتی برابر است با dB Fs 144- که یعنی عملاً وجود ندارد.

وقتی نوبت به نویز می‌رسد، بدون شک دیجیتال برنده است.

وفاداری

بیایید در مرحله‌ی بعد، وفاداری به سیگنال اصلی را بین فناوری صوتی آنالوگ و دیجیتال مقایسه کنیم. ابتدا لازم است «وفاداری» را تعریف کنیم. بر اساس واژه‌نامه‌ی آکسفورد، وفاداری را می‌توان اینطور تعریف کرد: «درجه‌ی یکسان بودن با اصل آن چیزی که کپی یا بازتولید می‌شود.» بنابراین در اینجا پرسش این است که «کدام فناوری می‌تواند دقیق‌ترین بازنمایی را از سیگنال ورودی اصلی ضبط، ذخیره و بازتولید کند؟»

توجیهات زیادی درباره‌ی اینکه چرا صدای آنالوگ از صدای دیجیتال بهتر است، شنیده‌ام. به مرور زمان، متوجه شدم که بیشتر این توجیهات ناشی از درک نادرست از چگونگی عملکرد فناوری‌ صوتی دیجیتال است. در اینجا ممکن است باعث ناراحتی برخی افراد شوم، اما به یاد داشته باشید که من فقط در حد توانم حقایق را مطرح می‌کنم…

یکی از رایج‌ترین تصورات غلط مربوط به میزان وضوح [۲۶] شکل‌موج صوت دیجیتال است. در حقیقیت، خود من نیز این یکی را باور داشتم. این تصور غلط بر این باور است که مبدل آنالوگ به دیجیتال قادر به ثبت کاملاً دقیق شکل‌موج نیست. منطق پشت این باور غلط در نگاه اول معتبر به نظر می‌رسد…

«اگر یک سیستم صوتی دیجیتال در هر ثانیه فقط تعداد محدودی اسنپ‌شات [۲۷] (یا نمونه) را ثبت می‌کند و هر نمونه فقط می‌تواند تعداد محدودی از مقادیر را نشان دهد، چگونه ممکن است یک شکل‌موجِ بی‌نهایت هموار، مانند موج صوتی اصلی ایجاد کند؟»

برای درک پاسخ می‌توانیم از قضیه‌ی نایکوئیست کمک بگیریم. پیش از این درباره‌ی قضیه‌ی نایکوئیست گفتم، اما بیایید بار دیگر نگاهی به آن بیاندازیم.

قضیه‌ی نایکوئیست بیان می‌کند که تا زمانی که یک شکل‌موج با نرخ بیش از دو برابر در هر چرخه نمونه‌برداری شود، آن شکل‌موج می‌تواند بدون هیچ اتلافی ثبت و بازتولید شود. بنابراین نرخ نمونه‌برداری یک فایل صوتی، تعیین‌کننده‌ی بالاترین فرکانسی است که می‌توان بدون اتلاف نمونه‌برداری کرد. از لحاظ نظری، یک فایل صوتی با نرخ نمونه‌برداری ۴۸ کیلوهرتز قادر است تا فرکانس‌های حداکثر (دقیقاً زیر) ۲۴ کیلوهرتز – نصف نرخ نمونه‌برداری – را به طور کامل ضبط و بازتولید کند. با توجه به اینکه به طور کلی دامنه‌ی شنوایی انسان و فیلترهای پایین‌گذر [۲۸] در میکروفون‌ها و سایر تجهیزات صوتی در بالاترین میزان به حدود ۲۰ کیلوهرتز می‌رسد، می‌توانیم با اطمینان بگوییم که نرخ نمونه‌برداری ۴۸ کیلوهرتز دامنه‌ی فرکانسی مناسبی را فراهم می‌کند.

با نگاهی دقیق‌تر به نمونه‌های داخل محیط کار صوتی دیجیتال [۲۹]، می‌بینیم که آنها به صورت مجموعه‌ای از نقاطی که با خطوط مستقیم به هم وصل می‌شوند، نشان داده شده‌اند‌. این تصویر می‌تواند گمراه‌کننده باشد…

درست است که نمونه‌ها فقط مجموعه‌ای از نقاط هستند که وضعیت شکل‌موج را در هر لحظه از زمان نشان می‌دهند، اما در آخر، موج صوتی حاصل اینطور ناهموار نخواهد بود.

واقعیت این است که شکل‌‌موج‌های بازپخش شده از طریق مبدل دیجیتال به آنالوگ، مشابه شکل‌موج‌های اصلی ضبط شده با مبدل آنالوگ به دیجیتال خواهند بود.

تا زمانی که بالاترین فرکانس از فرکانس نایکوئیست فراتر نرود، فقط یک مسیر وجود دارد که شکل‌موج آن را طی کند. و حالا، صادقانه بگویم… من هنوز هم در فهم کامل این بخش دچار مشکل هستم.

برای همین توصیه می‌کنم این ویدیو را ببینید.

تماشای آن رایگان است و به عنوان یکی از بهترین ویدیوها در رد این تصور که صدای آنالوگ نسبت به صدای دیجیتال به نوعی «صاف‌‌تر» است یا «وضوح بالاتری» دارد، مطرح شده است.

من هر سال خود را در حال تماشای این ویدیو می‌‌یابم و هر بار متوجه مطالبی می‌شوم که قبل از آن برایم بی‌معنی بود. بنابراین، اگر بعد از نگاه کردن برای اولین بار همه چیز را کاملاً متوجه نشدید، حس بدی نداشته باشید.

اختلاط فرکانس

یک اشکال دیگر که در فناوری صوتی دیجیتال وجود دارد و ذکر آن مهم است اختلاط فرکانس است. این موضوع نیز به قضیه‌ی نایکوئیست مربوط می‌شود. اگر مبدل آنالوگ به دیجیتال تلاش کند تا فرکانس‌هایی که از فرکانس قضیه‌ی نایکوئیست بیشتر است را نمونه‌برداری کند، باعث اختلاط فرکانس می‌شود.

در سطح پایه، اختلاط فرکانس وضعیتی را توصیف می‌کند که مبدل آنالوگ به دیجیتال به علت محدودیت‌های ناشی از نرخ نمونه‌برداری، فرکانس بالا را به جای فرکانس بسیار پایین‌تر اشتباه می‌گیرد.

مهندسین در تلاش برای رفع این مشکل، فیلترهای ‌پایین‌گذر را روی زنجیره‌ی سیگنال اعمال می‌کنند که مانع کوانتیزاسیون فرکانس‌های فراتر از فرکانس نایکوئیست توسط سیستم می‌شوند. به همین دلیل، برای ثبت سیگنال ۲۰ کیلوهرتز از نرخ نمونه‌برداری ۴۰ کیلوهرتز استفاده نمی‌کنیم، بلکه به جای آن از نرخ‌های نمونه‌برداری مانند ۴۸ کیلوهرتز، ۹۶ کیلوهرتز و یا بیشتر استفاده می‌کنیم. این کار این امکان را برای فیلتر پایین‌گذر فراهم می‌کند تا فرکانس‌های اضافی را حذف کند بدون اینکه بر دامنه‌ی فرکانسی قابل شنیدن تأثیر منفی بگذارد. این هم موضوع دیگری است که هر چه بیشتر در آن عمیق شوید، پیچیده‌تر می‌شود – بنابراین به ویدیوی دیگری که مفهوم آن را به خوبی توضیح می‌دهد، اشاره می‌کنم. اگر برای شما سؤال است که نرخ نمونه‌برداری را تا چه حد باید بالا ببرید، این ویدیو به شما خیلی کمک خواهد کرد.

اعوجاج هارمونیک و غیرخطی بودن

بسیار خب، جدای از موضوع نویز، وفاداری به سیگنال اصلی در صدای آنالوگ و صدای دیجیتال بسیار به هم نزدیک است. اما چه چیزی در مورد صدای آنالوگ وجود دارد که آن را برای بسیاری از مردم «گرم‌تر» یا «بهتر» می‌کند؟

احتمالاً دلیل آن را می‌توان در اعوجاج و نویزی که در استفاده از تجهیزات آنالوگ به وجود می‌آید، خلاصه کرد. همانطور که قبلاً گفته شد، با هر بار عبور سیگنال از یک وسیله به وسیله‌ی دیگر، نویز ذاتی هر دستگاه بخشی از سیگنال خواهد شد. نه تنها این، بلکه مداربندی آنالوگ نیز، اعوجاج هارمونیک [۳۰] را به سیگنال اضافه می‌کند که همیشه هم چیز بدی نیست. در زمینه‌ی وفاداری، این یک پیروزی دیگر برای فناوری صوتی دیجیتال است زیرا می‌توان سیگنال را با پردازش‌کننده‌ی سیگنال دیجیتال پردازش کرد که واقعاً در آن از نویز و اعوجاج هارمونیک ناشی از پردازش آنالوگ خبری نیست.

بنابراین، اگر به دنبال شفافیت هستید، فناوری صوتی دیجیتال نسبت به آنالوگ برتر است. اما همانطور که گفتم، اعوجاج هارمونیکِ مرتبط با صدای آنالوگ لزوماً چیز بدی نیست. برخی اوقات، شما به دنبال صدای شفاف نیستید و ممکن است رنگی که تجهیزات آنالوگ به سیگنال می‌دهند، مطلوب شما باشد.

اوردرایو [۳۱] کردن سیستم آنالوگ و اشباع نوار آنالوگ صدای فوق العاده‌ای تولید می‌کند. تجهیزات آنالوگ وقتی اوردرایو شوند، تمایل به تولید صدای طبیعی‌تر و موسیقایی‌تر دارند. با نزدیک شدن به محدودیت‌‌های مداربندی یا نوار آنالوگ، کیفیت سیگنال شروع به تغییر می‌کند. این پاسخ غیرخطی به سیگنال‌ها می‌تواند توسط سیستم‌های دیجیتال مدل‌سازی شود، اما در سیستم‌‌های آنالوگ بخشی از ساختار آن است. در سیستم‌های دیجیتال، مهم نیست که سطح سیگنال مرتبط با محدودیت‌های سیستم چه اندازه باشد، تا زمانی که سیگنال از این محدودیت‌ها فراتر نرود، سیستم رفتاری یکسان خواهد داشت. وقتی که سطح سیگنال در سیستم دیجیتال از 0 dbFs بالاتر رود، بلافاصله قطع می‌شود که در %99 مواقع صدای وحشتناکی دارد.

می‌خواهم این جزئیات را به عنوان یک پیروزی برای هر دو سیستم آنالوگ و دیجیتال در نظر بگیرم. از یک سو، کار کردن در محیط دیجیتال خطی و شفاف برای به دست آوردن بیشترین وفاداری ممکن به سیگنال اصلی، بسیار خوب است. از سوی دیگر، تون‌هایی [۳۲] که می‌توان با ساختار ماهرانه‌ی بهره‌[۳۳] در قلمروی آنالوگ به دست آورد نیز عالی است.

تولید و ویرایش

با اینکه تمرکز ما روی تفاوت‌های بین فناوری صوتی آنالوگ و دیجیتال در روند تولید است، موارد جالب توجهی دیگری هم وجود دارد. اگر برای بیشتر از ۲۵ سال در زمینه‌ی تولید صدا کار کرده باشید، خواهید دانست که من می‌‌خواهم سراغ چه چیزی بروم. اما اگر نسبتاً در این حوزه تازه‌کار باشید، ممکن است برایتان چندان مشخص نباشد. پیش از این درباره‌ی روند کلی ضبط صدای دیجیتال و آنالوگ بحث کردیم. در آنالوگ – سیگنال‌ها روی نوار مغناطیسی ذخیره می‌شوند و از طریق یک دستگاه‌ ضبط صوت نواری بازپخش می‌شوند. در دیجیتال – سیگنال‌ها روی یک هارد درایو ذخیره می‌شوند و از طریق رایانه بازپخش می‌شوند.

جدای از روند اصلی ضبط و بازپخش، تفاوت‌های زیادی میان تولید موسیقی با فناوری‌های آنالوگ و دیجیتال وجود دارد. یکی از بزرگ‌ترین تفاوت‌ها، روند ویرایش است. خوب دقت کنید، زیرا اینجا وقتی صحبت از ویرایش می‌شود، در مزایای فناوری صوتی دیجیتال اصلاً اغراق نمی‌کنم! ما در یک محیط کار صوتی دیجیتال (یا DAW)، می‌توانیم برش‌ها و تنظیماتی را بر روی تمام بخش‌های یک برش پیاده کنیم بدون اینکه نگران اشتباهی برگشت‌ناپذیر باشیم. در محیط ویرایش دیجیتال غیرمخرب [۳۴]، همیشه می‌توانیم دکمه‌ی «برگشت به قبل [۳۵]» را فشار دهیم و به جای قبلی برگردیم.

اما ویرایش آنالوگ باید با تیغ و نوار چسب انجام شود و نوار به صورت فیزیکی بریده و دوباره به هم وصل شود. بر خلاف محیط کار صوتی دیجیتال، ویرایش‌گر نوار آنالوگ مجبور است برای تشخیص اینکه کجا را باید برش‌ بزند، فقط به گوش‌هایش تکیه کند و باید برش‌های مورب بزند تا محو و افزایش تدریجی همزمان صدا [۳۶] بین دو برش میسر شود. هر کسی که با نوار آنالوگ کار کرده باشد، احتمالاً در این وضعیت ناخوشایند قرار گرفته است که نوار از حلقه باز شود و ساعت بعد، تماماً صرف دوباره با دقت جمع کردن آن شود.

اگر در ویرایش آنالوگ اشتباه کنید، احتمالاً راهی برای نجات کار خود از نابودی نخواهید داشت. نه تنها این، بلکه عملاً هیچ محدودیتی برای تعداد آهنگ‌هایی که می‌توان در یک تولید دیجیتال انباشته کرد، وجود ندارد، در حالی که ظرفیت بیشتر نوارهای آنالوگ چندآهنگی، حداکثر به ۲۴ آهنگ می‌رسد. این پیشرفت‌‌های فناوری، نه تنها تولید موسیقی، بلکه خود موسیقی را نیز به کلی متحول کرده است! فکرش را بکنید – توانایی انجام ویرایش‌‌های دقیق روی فایل‌های صوتی چند‌آهنگ و ضبط هر تعداد آهنگی که می‌‌خواهید بدون عواقب منفی. این مزایا درها را به روی ضبط صداهای بسیار پرجزئیات و صیقل داده‌ شده با استفاده از فناوری صوتی دیجیتال گشوده است.

قابلیت حمل و دوام

پس از پایان روند تولید، همچنان نیاز به راهی برای توزیع این محصول به میلیون‌ها شنونده داریم. به راحتی می‌توان گفت این بزرگ‌ترین تفاوت بین صدای آنالوگ و دیجیتال است. بهترین روش برای توزیع صدای آنالوگ صفحه وینیل است. نوار، حجیم و جاگیر است و علاوه بر آن بازتولید و نگهداری از آن دشوارتر است. با این حال صفحه وینیل نیز دارای معایبی است. اولاً، صفحه‌‌ وینیل یک رسانه‌ی فیزیکی است و این بدان معناست که کپی هر نسخه از آن هزینه‌بر است و باید به صورت فیزیکی برای شنوندگان ارسال شود.

ثانیاً، صفحه وینیل به مرور زمان دچار تغییر می‌شود. نه تنها نوار اصلی که روی صفحه وینیل چاپ می‌شود افت کیفیت پیدا می‌کند، بلکه هر بار که به یک صفحه وینیل گوش می‌کنید، کیفیت صدا بیشتر دچار افت می‌شود. امروزه، صدای دیجیتال را می‌توان روی اینترنت بدون افت کیفیت استریم کرد. سریعاً می‌توانید تعداد نامحدودی نسخه از یک فایل را بدون افت کیفیت به سراسر دنیا بفرستید.

نه تنها این، بلکه یک فایل صوتی را می‌توان بارها و بارها شنید بدون اینکه آسیب ببیند یا کیفیت آن افت کند. علاوه بر آن، فایل‌های دیجیتال در مقایسه با صفحه وینیل فضای خیلی کمتری اشغال می‌کنند. وقتی که فضایی که ۱۰۰۰ آهنگ بر روی صفحه وینیل اشغال می‌کند را با فضایی که ۱۰۰۰ آهنگ روی هارد درایو اشغال می‌کند مقایسه می‌کنید، جایی برای رقابت باقی نمی‌ماند.

بحث همچنان ادامه دارد

واقعیت این است که سیستم‌های صوتی آنالوگ و دیجیتال هر دو در دنیای مدرن ارزشمند هستند. بحث درباره‌ی اینکه کدام بهتر است و کدام بدتر هرگز پایان خواهد یافت زیرا پاسخ روشنی برای این پرسش وجود ندارد.

یک میلیون‌ کاربرد برای فناوری صوتی وجود دارد و هر یک از آنها مستلزم مجموعه‌ای منحصر به فرد از تجهیزات است. این ما هستیم که باید به عنوان یک مهندس صدا، موسیقی‌دان یا شنونده، درباره‌ی مجموعه‌ای از تجهیزات صوتی که نیازهای هر موقعیت منحصر به فرد را برآورده می کند، تصمیم‌گیری کنیم. آنچه که واقعاً حائز اهمیت است…

با وجودی که عاشق صحبت کردن درباره‌ی نکات ظریف مانند تفاوت میان آنالوگ و دیجیتال هستم، اما وقتی نوبت به کیفیت صدا می‌رسد، این جزئیات نسبتاً کم‌اهمیت هستند. اگر واقعاً خواهان بهترین کیفیت صدای ممکن‌ هستید، توصیه‌ی من به شما این است که روی مسائل مهم‌تری مانند تنظیم و نصب مناسب بلندگوها تمرکز کنید.

این کار تفاوت زیادی در کیفیت صدا ایجاد می‌کند و کاملاً رایگان است! در حقیقت، می‌خواهم به شما که تا اینجا مطلب را دنبال کردید، هدیه‌ای بدهم .

این لینک راهنمای نصب بلندگوها را دنبال کنید تا به شما کمک کند که مطمئن شوید سیستم شما برای عملکرد بهینه تنظیم شده است.

[۱] Vinyl صفحه‌ی گرامافون

[۲] Record head

[۳] Amplitude

[۴] Magnitude

[۵] Correlate تمایل دو یا چند سیستم که به طور مستقل رفتار ساده‌ای از خود نشان می دهند، اما پس از تعامل با یکدیگر در همبستگی با هم رفتاری پیچیده و بدیع را شکل می‌دهند.

[۶] Play head

[۷] Dropouts وقفه‌ی نامنظم در ضبط به دلیل کاهش یا عدم وجود سیگنال صوتی

[۸] PCM (Pulse Code Modulation)

[۹] Binary دودودیی – دوتایی

[۱۰] Bit

[۱۱] Quantization

[۱۲] Noise floor اندازه‌گیری سیگنال ایجاد شده از مجموع تمام منابع نویز و سیگنال‌های ناخواسته در یک سیستم اندازه‌گیری است؛ سطحی که این نویز در آن قرار می‌گیرد را کف نویز می‌گویند. کف نویز حداقل توان ورودی است که سیستم می‌تواند اندازه گیری کند، زیرا هرگونه سیگنال دیگری در آن نویز از بین می رود. در این سیستم اندازه‌گیری هر سیگنالی غیر از سیگنال تحت نظارت نویز تلقی می‌شود.

[۱۳] CD

[۱۴] Floating point عددی بدون تعداد ثابت رقم قبل و بعد از اعشار.

[۱۵] Sample rate

[۱۶] Nyquist–Shannon sampling theorem قضیه‌ی نمونه‌برداری نایکوئیست-شنون بنیادی‌ترین قضیه در پردازش سیگنال است که شرط لازم در امکان بازیابی سیگنال اولیه از نمونه‌های آن را بیان می‌کند. بر اساس این قضیه، فرکانس نمونه برداری باید حداقل دو برابر بالاترین جزء فرکانس سیگنال و یا به عبارتی نصف نرخ نمونه‌برداری باشد.

[۱۷] Anti-aliasing filter نوعی فیلتر که روی ورودی مبدل آنالوگ به دیجیتال قرار می‌گیرد و اجزای سیگنال بالاتر از فرکانس نایکوئیست (Nyquist frequency) را حذف می‌کند. بر اساس این قضیه‌، فرکانس نایکوئیست بالاترین فرکانسی است که با توجه به نرخ نمونه‌برداری می‌توان آن را به درستی نمونه‌برداری کرد. مقدار این فرکانس نصف نرخ نمونه‌برداری است. بدین ترتیب فیلتر تصحیح فرکانس با حذف سیگنال‌های بالاتر از فرکانس نایکوئیست مانع ایجاد اختلاط فرکانس یا Aliasing در سیگنال اصلی پس از بازیابی آن می‌شود. اختلاط فرکانس زمانی رخ می‌دهد که به دلیل عدم تناسب نرخ نمونه برداری با فرکانس نایکوئیست، فرکانس سیگنال به درستی اندازه‌گیری نمی‌شود. این اتفاق با ایجاد تغییرات ناخواسته در سیگنال اصلی بازیابی‌شده از سیگنال نمونه‌برداری‌شده، باعث افت کیفیت آن می‌شود.

[۱۸] Artifact هر گونه خطای صوتی ناخواسته یا نوسانات تصادفی ناشی از محدودیت های فنی در نحوه ضبط، ویرایش یا دستکاری که بر شدت سیگنال اثر می‌گذارد.

[۱۹] Stream روشی برای پخش محتوای صوتی یا تصویری به صورت جاری؛ به این معنا که جریانی از داده‌ها به صورت تدریجی از فرستنده به گیرنده منتقل می‌شود. در این روش گیرنده‌ برای دسترسی به محتوا نیاز ندارد که ابتدا تمام محتوا را بارگیری کند، بلکه فرستنده، محتوا را به صورت جاری ارسال می‌کند و هم‌ زمان با ارسال داده‌ها از طرف فرستنده، محتوا برای گیرنده قابل مشاهده است.

[۲۰] Dynamic range compression

[۲۱] Lossy vs Lossless Audio

[۲۲] Tidal

[۲۳] Waveform

[۲۴] Signal-to-noise ratio نسبتی برای مقایسه‌ی سطح سیگنال مطلوب با سطح نویز پس زمینه.

[۲۵] Inherent noise نویز اجتناب ناپذیر درون خود دستگاه که از تداخلات تصادفی سطح مولکولی در سیستم‌های الکترونیکی نشأت می‌گیرد.

[۲۶] Resolution

[۲۷] Snapshot نشانگرهای مرجع برای داده‌هایی که وضعیت یک سیستم را در یک زمان خاص نشان می‌دهند.

[۲۸] Low pass filter نوعی فیلتر که سیگنال‌هایی با بسامدی کمتر از یک بسامد معین را عبور می‌دهد.

[۲۹] DAW (Digital Audio Workstation)

[۳۰] Harmonic distortion اعوجاج هارمونیک عبارت است از وجود فرکانس هایی در خروجی دستگاه که در سیگنال ورودی وجود ندارد.

[۳۱] Overdrive

[۳۲] Tone

[۳۳] Gain

[۳۴] Non-destructive digital editing ویرایش دیجیتال غیرمخرب این امکان را فراهم می‌کند که در فایل تغییراتی ایجاد کنیم بدون اینکه نیاز باشد داده‌های جدید را روی داده‌های اصلی قرار دهیم. چون تغییرات در لایه‌های جداگانه انجام می‌شود، داده‌های اصلی در دسترس باقی می‌ماند و برگشت به آن امکان‌پذیر است. از آنجا که ویرایش غیرمخرب، داده‌ها را از فایل اصلی حذف نمی کند، کیفیت فایل بعد از ویرایش افت نمی‌کند.

[۳۵] Undo

[۳۶] Crossfade