عصر رایانه

(فناوری - شبکه - اینترنت - نرم/سخت افزار )

تاریخچه صدا در کامپیوتر و دلایل برای به وجود آمدن کارت های صدا ‏
ساعت ٢:۳٧ ‎ق.ظ روز ۱۳۸٧/٥/۱٥  
‎ ‎کسانی که تقریبا از 15 سال پیش با کامپیوتر سرکار داشتند حتما به یاد می آورند که در آن زمیان تنها ‏صدایی که از یک کامپیوتر مثلا 286 حارج میشد یک ‏BIP‏ ساده بو.دقیقا شبیه همین بوق کوتاهی که بعد از ‏روشن کردن کامپیوتر شنیده می شود.تا مدت ها کامپیوتر های شخصی سخت افزاری برای تولید صدا نداشتند و ‏البته در محیط ‏DOS‏ کاربران نیازی به وجود صدا احساس نمیکردند
تاریخچه صدا در کامپیوتر و دلایل برای به وجود آمدن کارت های صدا :‏ ‎ ‎کسانی که تقریبا از 15 سال پیش با کامپیوتر سرکار داشتند حتما به یاد می آورند که در آن زمیان تنها ‏صدایی که از یک کامپیوتر مثلا 286 حارج میشد یک ‏BIP‏ ساده بو.دقیقا شبیه همین بوق کوتاهی که بعد از ‏روشن کردن کامپیوتر شنیده می شود.تا مدت ها کامپیوتر های شخصی سخت افزاری برای تولید صدا نداشتند و ‏البته در محیط ‏DOS‏ کاربران نیازی به وجود صدا احساس نمیکردند.(لازم به ذرک است که در همان زمان ‏کامپیوترهای مثل ‏AMIGA‏ و ‏COMMODORE‏ صدا و تصویر بسیار قابل قبولی ارائه میکردند).احساس ‏نیاز به صدا وقتی در بین کاربران ایجاد شد که بازی های کامپیوتری با بازار آمدند.با پیشرفت این بازی ها هم ‏کاربران و هم تولید کنندگان بازی ها دیافتند که بدون سیستم صوتی مناسب بازی ها موفقیت چندانی نخواهند ‏داشت.اینجا بود که شرکت های مختلف دست به کار شدند و ابزارهایی جانبی مختلفی را برای تولید صدا در ‏کامپیوتر طراحی کردند.تا مدت ها بر سر یافتن استاندارد صدا بین شرکت های تولید کننده احتلاف وجود ‏داشت.تا این که همه بر استاندارد ‏SOUNDBLASTER‏ از شرکت ‏CRATIVE‏ به توافق رسیدند.اولین ‏کارتهای صوتی کارت هایی با ابعاد بزرگ کیفیت پایین و قیمت هایی بالا بودند.در این کارتهای صوتی ‏SOUNDBLASTER 16 BIT‎‏ حدود 800000 هزار ریال قیمت داشتند.به تدریج با پیشرفت تکنولوژی ‏قیمت ها کاهش یافت و کیفیت صداهای تولید شده بهتر بود.کارت های اولیه کارت های 8 بیتی بودند که فقط ‏میتوانستند صدای مونو را تولید کنند.با ورود کارت های 16 بیتی صدها استریو شد و کیفیت صدا نیز افزایش ‏یافت.سپس از کارتهای صوتی 32 و 64 بیتی نیز وارد بازار شد.این روند تا کنون هم ادامه دارد.به طوری که ‏در حال حاضر کارت های صوتی حرفه ای 128 بیتی بیش از 6 کانال صوتی رو پشتیبانی میکند و داشتن ‏خروجی دیجیتال کیفیت صدای بسیار بالایی رو ارائه می دهند.کارت های صوتی معمولی نیز قیمتی در حد صفر ‏دارند.زیرا کارت های صوتی اکنون به بردهای اصلی کامپیوتر وصل شدند و نیازی به خرید جداگانه آن نیست.‏ البته متناسب به نیاز میتونان آن را برای فعالیت هایی چون ‏SOUND EDIT OR VIDEO‏ خریداری کرد که ‏خوب همیشه قیمت های بالایی خواهند داشت و وجه تمایز این گونه کارت ها در قابلیت های مختلفی است که آن ‏را نسبت به کارت های معمولی در رده های بالاتری قرار میدهدچ آشنایی با فرمت های صدا :‏ ‎ ‎تا قبل از ورود کامپیوتر به عرصه جهانی صدا به صورت فرمت صوتی وجود نداشت.اگر چه با کیفیت به ‏روش واحدی ذخیره و خوانده میشد.ولی با ورود کامپیوتر فایل های صوتی نیز فرمت ها و قالب های مختلفی ‏پیدا کردند.در کامپیوتر فرمت یک فایل به معنی نوع ذخیره سازی اطلاعات و نحوه خواندن آنها است.برای مثال ‏در فرمت ‏MIDI‏ اصلاعات مربوط به هرساز به همراه پروزه ها نت ها و سایر اطلاعات جداگانه ذخیره می ‏شود.ولی در فرمت ‏WAV‏ اطلاعات صوتی به صورت طول موج های صدا ذخیره میشود و صدا ها قابل ‏تفکیک نیستند.به همین دلیل برنامه های خاصی به وجود دارند که میتوانند فرمت های ‏MIDI‏ را به نت های ‏موسیقی تبدیل کنند.ولی در فرمت ‏WAV‏ تمام طول موج ها ذخیره می شوند بنابراین در فرمت های ‏WAV‏ ‏حجم نسبت به فایل های ‏MIDI‏ بسیار بیشتر است.در حال حاضر علم موسیقی و صدا و سخت افزار بسیار ‏پیشرفت کردند و اکثر برنامه هایی که موجود هستند بیشتر فرمت های صوتی را پخش میکنن.‏ به عنوان مثالی کوتاه میتوان از فرمت های ‏WMA - RA - MP3 - WAV - MID‎‏ و غیره نام برد‏ مفاهیم کلی در مبحث صدا‏ ما در اینجا شما را با برخی از اصطلاحات در صدا آشنا می کنیم :‏ مونو(‏mono‏ ) :‏ به صداهای گفته می شود که از یک کانال ضبط شده و از یک کانال هم پخش می شوند.‏ این صداها قابلیت تفکیک ندارند و اگر حتی از یک سیستم استریو پخش شوند کیفیت آنها تفاوت چندانی نخواهد ‏کرد.‏ استریو ( ‏stereo‏ ):‏ صداهای استریو صداهای هستند که در دو کانال مجزا ضبط شده و پخش می شوند.‏ مثلا در یک کنسرت ممکن است صدای چندابزار در کانال چپ و صدای چند ابزار دیگر در کانال راست ضبط ‏شود.‏ صداهای استریو تفکیک پذیری بیشتری دارند و برای مثال می توان دور شدن و نزدیک شدن منبع صدا را هم ‏در آنها شبیه سازی کرد.‏ صداهای چند کاناله( ‏multi channel‏ ):‏ این صداها در واقع در چند کانال مختلف ضبط شده و پخش می شوند.‏ برای مثال ممکن است در یک فایل موسیقی صدای هر ابزار در یک کانال ضبط شده باشد.‏ این استاندارد توانائی بسیار خوبی را برای ویرایش های بعدی در اختیار ما قرار می دهد.‏ چون صداها تفکیک شده است ما می توانیم هر صدا را جداگانه ویرایش کنیم یا مثلا شدت صدای یکی از بزارها ‏را بیشتر کنیم.‏ هنگام شنیدن نیز اگر از ابزار پخش چند کاناله استفاده کنیم صدا بیشتر کنیم . هنگام شنیدن نیز اگر از ابزار پخش ‏چند کاناله استفاده کنیم صدا بسیار طبیعی تر شنیده خواهد شد.‏ دالبی( ‏dolby surround‏ ) :‏ دالبی در واقع یک نوع استاندارد برای صداهای چند کاناله است.‏ سیستم دالبی پیش از این در سینما کاربرد داشت ولی اکنون با پیشرفت تکنولوژی دیجیتال در ویدیوها و ‏کامپیوترها هم قابل اجرا است.‏ سیستم دالبی یک یک سیستم صدای محیطی است و بیشتر در فیلمها و اخیراً در بازی های کامپیوتری رواج یافته ‏است.‏ برای مثال در فیلمها هنگامی که یک اتومبیل از پشت به صحنه نزدیک می شود صدای آن نیز از بلندگوهای ‏پشتی شنیده میشود و با تغییر مکان اتومبیل صدا نیز به بلندگو های جانبی یا جلوی منتقل می شود و به این ‏صورت صداها بسیار واقعی تر شنیده می شوند.‏ فرمت ‏DVD-A ‎ ‎فرمت ‏DVD-A‏ یا بعبارت دیگر ‏DVD-Audio‏ بهمراه فرمت ‏SACD‏ برای ‏Audiophile‏ ها با کیفیت ‏صدای بالاتر از 16 بیت ارائه شده است. همانطور که از نام این فرمت پیداست اطلاعات صدا بر روی یک ‏دیسک ‏DVD‏ ذخیره میگردد و نوع کدینگ اطلاعات همانند ‏CD-Audio‏ معمولی ‏PCM‏ میباشد البته با ‏فرکانس نمونه برداری بالاتر و تعداد بیت های بیشتر. بشکلهای مختلف بر اساس تعداد بیت و فرکانس نمونه ‏برداری میتوان اطلاعات را بر روی ‏DVD‏ ذخیره نمود که بالاترین کیفیت آن برای حالت استریو 24‏bit‏ با ‏فرکانس 192‏khz‏ میباشد. یعنی در بهترین حالت هر 5 میکرو ثانیه (192000/1) یکبار از سیگنال آنالوگ ‏نمونه برداری شده و به 24 بیت اطلاعات تبدیل میشود. برای سیستمهای دالبی 5.1 که تعداد کانالها 6 میباشد از ‏حداکثر فرکانس 96‏khz‏ استفاده میشود. میتوان از روش فشرده سازی ‏Meridian‏ بدون از دست دادن کیفیت ‏MLP‏ نیز برای بالا بردن تعداد کانالها استفاده نمود. تعدادی از سازندگان سیستم های صوتی در سراسر دنیا تنها ‏از ‏SACD‏ پشتیبانی میکنند و عده ای هم مانند ‏Meridian‏ تنها از ‏DVD-A‏ و تعدادی هم مانند ‏Linn‏ از هردو ‏فرمت. دستگاهی که همه فرمت ها را پشتیبانی کند ‏Universal Player‏ نامیده میشود. تعداد آلبوم های تولید شده ‏برای هر دو فرمت تاکنون خیلی زیاد نبوده و معلوم نیست این ‏Digital War‏ به کجا بیانجامد. ‏ فرمت ‏HDCD ‎ ‎مخفف ‏High Definition Compatible Digital‏ که بدست آقایان ‏Keith Johnson‏ و ‏Pflash ‎Pflaumer‏ برای بهبود 16 بیت معمولی طراحی شده است. این فرمت هم اکنون متعلق به شرکت مایکروسافت ‏میباشد و در برابر ‏DSD‏ سونی قرار گرفته. اکثر چیپ های تبدیل دیجیتال به آنالوگ این فرمت رو پشتیبانی ‏میکنند و بسیاری از سورس های دیجیتال مانند 390 لوینسون هر دو فرمت 16 بیت و ‏HDCD‏ رو پشتیبانی ‏میکنند. ‏ بعد از 16 بیت فرمتهای زیادی اومد و متاسفانه بجای استاندارد سازی یک فرمت خوب هر شرکتی فرمت ‏خودش رو به بازار ارایه کرد. همچنان اکثر کاربران مجبورند برای پشتیبانی همه فرمتها چند تا سورس دیجیتال ‏داشته باشند چرا که یک دستگاه اصولا همه فرمتها رو پشتیبانی نمیکنه و اگر هم این کار رو بکنه با همه فرمتها ‏صدای خوبی نمیده.‏ فرمت ‏DSD ‎ ‎شرکت سونی و فیلیپس برای بهتر نمودن وضعیت دیجیتال در سال 1999 میلادی این فرمت را ارایه ‏نمودند و دیسکهای نوری این فرمت را ‏SACD‏ نامیدند (‏Super Audio CD‏). این فرمت در اکثر استودیوها ‏مورد استفاده قرار میگیرد و در بازار دنیا تا این لحظه کمتر از 4000 آلبوم با این فرمت عرضه شده است. این ‏فرمت بهمراه فرمت ‏DVD-A‏ با کیفیت ترین فرمتها بشمار میروند و از نظر بعضی ها ‏SACD‏ نسبت به سایر ‏فرمتها بخاطر نوع کدینگ ‏Musical‏ تر میباشد. من هیچ تجربه ای برای مقایسه این دو فرمت نداشتم اما میدونم ‏SACD‏ خیلی بهتر از ‏CD‏ معمولیست . پروسه تبدیل سیگنال به دیجیتال ‏DSD‏ (مخفف ‏Direct Stream ‎Digital‏) بوده و در اینحالت دیتای دیجیتال معادل یک بیت با فرکانس بازبینی 2.8224 مگا هرتز میباشد.‏ فرمت فشرده ‏MP3‎ ‎ ‎مخفف ‏MPEG-1 Audio Layer 3‎‏ میباشد. این فرمت برای فشرده سازی اطلاعات موسیقی بکار میره ‏‏(فشرده سازی همراه با کاهش کیفیت) و کیفیت بالایی نداره اما بخاطر کم حجم بودن و راحتی انتقال از طریق ‏اینترنت خیلی مورد توجه قرار گرفته. کیفیت این فرمت هم بسته به انتخاب نوع کدینگ فرق میکنه. رنج کیفیت ‏از 32 تا 320 کیلو بیت در ثانیه متغییره و بطور معمول از 128 کیلو بیت در ثانیه استفاده میشه و بر روی ‏اینترنت از طریق شبکه های ‏Peer to Peer‏ (مانند برنامه های ‏kazaa‏ یا ‏eMule‏) آلبومهای زیادی قابل ‏دسترسی هست. ویکی پدیا اطلاعات بیشتری داره میتونید به اونجا هم نگاهی بندازید.درک تفاوت همه اونها ‏برای گوش کاملا امکانپذیر هست‏ دیجیتال 16 بیت ‏Red-Book ‎ ‎اولین فرمت دیجیتال برای رکورد 16 بیت بود با فرکانس بازبینی 44.1 کیلو هرتز. معنی جمله بالا اینه ‏که از یک سیگنال آنالوگ برای تبدیل به داده های دیجیتال در بازه های زمانی کوچک (عکس فرکانس بازبینی) ‏نمونه برداری میکنند و اندازه دامنه سیگنال نمونه برداری شده را به 16 بیت اطلاعات تقریب میزنند.فواصل ‏زمانی عکس مقدار فرکانس نمونه برداریست و معنی 44.1 کیلوهرتز اینست که در فواصل زمانی 22 میکرو ‏ثانیه از سیگنال نمونه برداری میشود. هرچقدر فرکانس نمونه برداری و تعداد بیت های تقریب بیشتر باشد ‏سیگنال بشکل دقیقتری به دیجیتال تبدیل میشود. اطلاعات بیشتر اینجا است.‏ از نظر تئوری چون گوش انسان بیشتر از 20 کیلو هرتز نمیشنوه میشه با فرکانس دو برابر حداکثر فرکانس ‏شنوایی، سیگنال رو نمونه برداری کرد و مشکلی پیش نیاد اما تعداد بیت های تقریب خیلی مهم هستند و ۱۶ بیت ‏در یک موسیقی شلوغ، خوب از پس استرینگ های صدا بر نمیاد.‏ اکثر رکوردهای موجود در بازار بر روی سی دی از نوع 16 بیت 44.1 کیلو هرتز هستند.‏ از نظر من حتی بهترین رکوردهای 16 بیت که با پیشرفته ترین متد ها در استودیوهای خوب دنیا به دیجیتال ‏تبدیل شدند ارزش ‏Musicality‏ خوبی ندارند.البته احتمالا الان این وضعیت تغییر کرده....!‏ ابداع فرمت جدید صوتی، هزاران بار کوچک‌تر از ‏Mp3‎‏ ‏ سرویس اخبار خارجی ایتنا - محققین اعلام کردند فرمت صوتی جدیدی ابداع نموده‌اند که از حداقل اطلاعات ‏لازم برای بازسازی یک قطعه موسیقی استفاده می‌نماید. ‏ دانشمندان با استفاده از مدل‌سازی مجازی تعاملات موجود بین یک کلارینت و نوازنده آن موفق شدند یک قطعه ‏موسیقی بیست ثانیه‌ای را در حجمی در حدود هزار بار کوچک‌تر از یک فایل ‏MP3‎‏ عادی ایجاد نمایند.‏ ‏«این سیستم در اصل یک سیستم بازتولید موسیقی می‌باشد که بر اساس مقیاس‌های انسانی طراحی شده است.»‏ این توضیحات متعلق به ‏Mark Bocko‏ استاد مهندسی برق و کامپیوتر دانشگاه روچستر و مبدع این فناوری ‏می‌باشد.‏ ‏«انسان می‌تواند با سرعتی هزاران برابر بیشتر از آنچه که ما برای محاسبه و تولید آواهای دیجچیتالی صوتی به ‏زمان نیاز داریم زبان، تنفس و انگشتان خود را کنترل نموده و حرکت دهد.»‏ وی ادامه داد: «نتیجه این که به نظر من ما می‌توانیم میزان حداقل مطلق اطلاعاتی که برای بازسازی یک قطعه ‏موسیقی نیاز است را محاسبه و به آن دست یابیم.»‏ برای ساخت این فرمت محققین مدل کامپیوتری یک کلارینت را بر اساس کلیه مشخصه‌هایی از این ساز که بر ‏روی صدای آن تأثیر می‌گذارد از فشار هوای پشت دهانه برای هر انگشت مجزا گرفته تا نحوه بازتاب صوت از ‏داخل ساز ایجاد نمودند.‏ پس از آن تیم تحقیقاتی اقدام به طراحی مدل دیجیتالی از نوازنده کلارینت نموده و کلیه تعاملات بین نوازنده و ‏ساز شامل نحوه حرکت انگشتان دست، میزان نیروی دمیدن و اندازه فشاز لب‌های نوازنده بر روی دهنی ‏کلارینت را اندازه‌گیری نمودند.‏ Bocko‏ می‌گوید بعد از ایجاد مدل دیجیتالی ساز و نوازنده آن می‌بایستی کامپیوتر را وادار به گوش دادن به ‏نواختن ساز حقیقی می‌نمودیم تا بتواند درک کاملی از چگونگی کلیه اعمال و تراکنش‌هایی که منجر به ایجاد ‏نواها می‌شوند پیدا کند.‏ به گفته ‏Bocko‏ پس از تکمیل سنجش‌های آکوستیک و ایجاد مدل‌های الگوریتمی، این پروسه نهایتاً می‌تواند ‏منجر به دستیابی به حداکثر میزان فشرده‌سازی اطلاعات گردد.‏ ‏«شاید آینده موسیقی در بازسازی مجدد نواختن نهفته باشد، نه در ضبط کردن آن.»‏ بطور کلی دو روش برای فشرده‌سازی داده صوتی/تصویری/ویدئویی دیجیتال وجود داره: ‏ ‏۱‏ ‏. ‏lossless‏ و ۲. ‏lossy‏ ‏ فرمتهای ‏lossless‏ فرمتهایی هستند که بدون حذف هیچ داده‌ای فشرده‌سازی رو انجام میدن و فرمتهای ‏lossy‏ ‏فرمتهایی هستند که در فشرده‌سازی بخشی از داده‌ها رو حذف می‌کنند اما این کار رو به شکلی انجام میدن که ‏نتیجه فشرده‌سازی به اصل داده نزدیک باشه. ‏ در بین فرمتهای تصویری میشه از ‏PNG‏ و ‏TIFF‏ به عنوان روشهای ذخیره‌سازی ‏lossless‏ و از ‏JPEG‏ به ‏عنوان یک روش ‏lossy‏ فشرده‌سازی نام برد. در بین فرمتهای ویدئویی میشه ‏CorePNG‏ و ‏Lagarith‏ رو ‏lossless‏ و ‏MPEG-2‎‏ و ‏Theora‏ رو ‏lossy‏ نامید. ‏ اما در دنیای صدا، فرمتهای ‏lossless‏ مثل ‏Wave‏ و ‏FLAC‏ فرکانسهای صدایی که کمتر به گوش می‌رسند رو ‏حذف نمی‌کنند و فرمتهای ‏lossy‏ مثل ‏MP3‎‏ یا ‏Ogg‏ اینجور فرکانسها رو حذف می‌کنند. حالا در بین فرمتهای ‏lossy‏ بحث بر سر اینه که کدوم فرمت در کمترین حجم، خروجی نزدیکتری به معادل ‏lossless‏ همون داده ‏دیجیتال داره. اینجا یه مقاله مفصل هست که چهار فرمت ‏lossy‏ صدا رو با هم مقایسه کرده: ‏MP3‎، ‏WMA9‎، ‏AAC‏ و ‏Ogg Vorbis‏. ‏ اما درباره فرمتهای فشرده ویدئویی؛ راستش انواع این فرمتها زیاده و داره بیشتر هم میشه. ‏DivX‏ فرمتی بوده ‏که ابتدا شرکت صاحب اون توسعه‌اش رو به شکل بازمتن شروع کرده و بعد که پروژه به جاهای خوبی رسیده ‏اون رو اخصاصی کرده و در نتیجه توسعه‌دهنده‌ها توسعه فرمت ‏XviD‏ رو شروع کردند. خود این فرمتها مبتنی ‏بر روشهای فشرده سازی صدا و تصویری مثل ‏H.263‎‏ و ‏MPEG-4‎‏ هستن. بحث فشرده‌سازی ویدئو خیلی ‏مفصل و پیچیده ست و من هم بیشتر از این درباره‌اش نمی‌دونم.‏
کلمات کلیدی: سخت افزار