ഒരു പേഴ്സണല് കംപ്യട്ടറിനെ ചുറ്റിപ്പറ്റി ആര്ക്കും ഇന്ന് ഹോം സ്റ്റുഡിയോ തയ്യാറാക്കാം. നിലവാരമുള്ള ഹാര്ഡ്വെയര് കുറഞ്ഞ വിലയ്ക്കും ഉയര്ന്ന സോഫ്റ്റ്വെയര് സൗജന്യമായിത്തന്നെയും ലഭ്യമാണ്. പക്ഷേ അന്തിമഗുണനിലവാരം തീരുമാനിക്കുന്നത് അവ പ്രവര്ത്തിപ്പിക്കുന്നയാളുടെ അറിവും പരിചയവും തന്നെ. ഒരു തുടക്കമെന്ന നിലയ്ക്ക് ഇതാ ഒരല്പം സാങ്കേതികവിശദാംശങ്ങള്...
ഫ്രീക്വന്സി റെസ്പോണ്സ്
മൈക്രോഫോണിന്റെയും സ്പീക്കറിന്റെയും സ്പെസിഫിക്കേഷനുകളിൽ ഏറെ പ്രാധാന്യപ്പെട്ടതാണ് ഫ്രീക്വൻസി റെസ്പോൺസ്. എത്ര ഫ്രീക്വൻസി മുതൽ എത്ര ഫ്രീക്വൻസി വരെയുള്ള ശബ്ദത്തെ ഒരു മൈക്കിന് തിരിച്ചറിയാനാകും എന്ന് സൂചിപ്പിക്കുന്നതാണിത്. സ്പീക്കറിന്റെ കാര്യത്തിൽ ഇത് അതിനുത്പാദിപ്പിക്കാനാവുന്ന ശബ്ദത്തിന്റെ പരിധിയാണ്.
ഒരു ശരാശരി മനുഷ്യന് 20Hz മുതൽ 20kHz വരെയുള്ള ശബ്ദം കേൾക്കാം. മറ്റൊരു രീതിയില് പറഞ്ഞാല് 20Hz-നേക്കാള് കുറഞ്ഞ ശബ്ദവും 20kHz-നേക്കാള് കൂടിയ ശബ്ദവും നമുക്ക് കേള്ക്കാനാവില്ല (ഈ അളവെല്ലാം ഓരോരുത്തര്ക്കും വ്യത്യസ്തമാകാം). അതുകൊണ്ട് ഇതിനേക്കാൾ വിസ്തൃതമായ ഫ്രീക്വൻസി റെസ്പോൺസുകൊണ്ട് വലിയ പ്രയോജനമൊന്നുമില്ല. മൈക്കിന്റെ കാര്യത്തിൽ ഫ്രീക്വൻസി റെസ്പോൺസ് എത്ര വേണമെന്നത് എന്തിന്റെ ശബ്ദം റെക്കോഡ് ചെയ്യുന്നു എന്നതിനെ ആശ്രയിച്ചിരിക്കും. സ്പീക്കറുകൾക്ക് എല്ലാ ശബ്ദവും പുറപ്പെടുവിക്കേണ്ടിവരുമെന്നതിനാൽ പരമാവധി ഫ്രീക്വൻസി റെസ്പോൺസ് ഉണ്ടായിരിക്കുന്നതാണ് നല്ലത്.
പല പ്രൊഫഷണൽ മൈക്കുകളുടെയും ഫ്രീക്വൻസി റെസ്പോൺസ് അത്ര വിസ്തൃതമല്ലെന്നു കാണാം. ഓരോ മൈക്കും ചിലതരം ഉപകരണങ്ങളെ/ശബ്ദത്തെ ലക്ഷ്യം വയ്ക്കുന്നു എന്നതാണ് കാരണം. ഉദാഹരണത്തിന്, ഡ്രംകിറ്റ് റെക്കോഡ് ചെയ്യാൻ 50Hz എങ്കിലും താഴ്ന്ന ഫ്രീക്വൻസി റെസ്പോൺസ് ആവശ്യമുണ്ട്. വയലിൻ ഒരല്പം ഉയർന്ന ശ്രുതിയുള്ളതാണ്. പിയാനോയ്ക്കും ഓർഗനുമെല്ലാം ഏറെ താഴ്ന്നതും ഏറെ ഉയർന്നതുമായ സ്വരങ്ങള് ഉണ്ടാക്കാനാകുമെന്നതിനാൽ ഇവ റെക്കോഡ് ചെയ്യാന് വളരെ വിസ്തൃതമായ ഫ്രീക്വൻസി റെസ്പോൺസ് വേണ്ടിവരും.
ഓരോ ഉപകരണത്തിന്റെയും ഫ്രീക്വന്സി റെയ്ഞ്ച് വിശദമാക്കുന്ന പട്ടികകള് ലഭ്യമാണ്. ഷുവര് (Shure) വെബ്സൈറ്റിലുള്ള പട്ടിക ഈ ലിങ്കില് കാണാം: tinyurl.com/shure-freq (മുഴുവന് ലേഖനം: tinyurl.com/shure-freq-art). ഇതുപ്രകാരം വോക്കല് റെക്കോഡിങ്ങിന് 80Hz to 10kHz ഫ്രീക്വന്സി റെസ്പോണ്സ് എങ്കിലും ഉണ്ടായിരിക്കുന്നതാണ് നല്ലത്.
(ഫ്രീക്വന്സി റെസ്പോണ്സ് വിസ്തൃതമാവുക എന്നതുകൊണ്ടുദ്ദേശിച്ചത് വ്യക്തമാകാത്തവര്ക്കായി: A to B ആണ് ഫ്രീക്വന്സി റെസ്പോണ്സ് എങ്കില് A പരമാവധി കുറവും B വളരെ ഉയര്ന്നതും ആവുന്നതാണ് 'വിസ്തൃതമാകല്' (Widen). മൈക്കുകളെസ്സംബന്ധിച്ച് ഫ്രീക്വന്സി റെസ്പോണ്സ് വിസ്തൃതമാകുന്നതിനേക്കാള് ആവശ്യം എന്തിനുപയോഗിക്കുന്നോ അതിനു യോജിച്ചതായിത്തീരലാണ്.)
ഫയല് ഫോര്മാറ്റുകള്
മറ്റു പല കംപ്യൂട്ടര് ഫയലുകളില്നിന്നും വ്യത്യസ്തമാണ് മള്ട്ടിമീഡിയ ഫയലുകള്. ഇവയുടെ കാര്യത്തില് കണ്ടെയ്നര് ഫോര്മാറ്റ്, കോഡിങ് ഫോര്മാറ്റ് എന്നിങ്ങനെ രണ്ടു തലമുണ്ട്.
ഓഡിയോ ഡേറ്റ ഡിജിറ്റലായി പ്രതിനിധാനം ചെയ്യാനും (Represent) കംപ്രസ് ചെയ്യാനുമെല്ലാം ഉപയോഗിക്കുന്ന ഫോര്മാറ്റുകളാണ് ഓഡിയോ കോഡിങ് ഫോര്മാറ്റുകള്/സ്റ്റാന്ഡേഡുകള്. MP3, AAC, Vorbis, FLAC എന്നിവയെല്ലാം കോഡിങ് ഫോര്മാറ്റുകളാണ്. ഫയല്സൈസും ശബ്ദത്തിന്റെ ഗുണമേന്മയുമെല്ലാം തീരുമാനിക്കുന്നത് കോഡിങ് ഫോര്മാറ്റുകളാണെന്നുപറയാം. കോഡിങ്, ഡീകോഡിങ് പ്രക്രിയ നടത്തുന്ന പ്രോഗ്രാമുകളാണ് കോഡക്കുകള് (Codecs).
കോഡിങ് ഫോര്മാറ്റ് ഉപയോഗിച്ച് എന്കോഡ് ചെയ്ത ഓഡിയോ ഡേറ്റ പിന്നീട് ഒരു ഓഡിയോ കണ്ടെയ്നര് ഫോര്മാറ്റിലോ വീഡിയോ കണ്ടെയ്നര് ഫോര്മാറ്റിലോ പൊതിയുന്നു. ഇത്തരം ഫയലുകളാണ് .m4a (കോഡിങ്: AAC), .mp4 (ഓഡിയോ കോഡിങ്: AAC, ALAC), .ogg (ഓഡിയോ കോഡിങ്: Vorbis, Theora, Opus, FLAC, വീഡിയോ കോഡിങ്: Theora). ഇതുകൊണ്ടാണ് ഫയല് എക്സ്റ്റന്ഷന് നോക്കിമാത്രം ഗുണനിലവാരം പറയാനാവില്ലെന്നു പറയുന്നത്. കണ്ടെയ്നറിന്റേതായിരിക്കും എക്സ്റ്റന്ഷന്. ഉള്ളില് മറ്റൊരു ഫോര്മാറ്റുണ്ട്.
എന്നാല് ഇതില്നിന്നു വിഭിന്നമാണ് എം.പി.ത്രീ. അതിന് പ്രത്യേകിച്ച് കണ്ടെയ്നര് ഫോര്മാറ്റില്ല.
ഫയല്സൈസ് കുറയ്ക്കാന് ചെയ്യുന്ന കംപ്രഷന് രണ്ടുതരത്തിലുണ്ട്: ലോസി (Lossy - ഗുണനിലവാരം കുറയുന്നു), ലോസ്ലെസ് (Lossless - ഗുണം കുറയാതെ സൈസ് കുറയ്ക്കുന്നു). ഒരു തരത്തിലുമുള്ള കംപ്രഷന് ഇല്ലാത്ത ഡേറ്റ അറിയപ്പെടുന്നത് റോ (Raw) എന്നാണ്.
റെക്കോഡിങ്ങിനും മിക്സിങ്ങിനും റോ ഫയലുകളാണ് ഉത്തമം. WAV ഇത്തരത്തില് ഉപയോഗിച്ചുവരുന്ന ഫോര്മാറ്റാണ്. ലോസ്ലെസ് കംപ്രസ്ഡ് ഫയലുകളും ഉപയോഗിക്കാമെങ്കിലും കംപ്രഷന്-അണ്കംപ്രഷന് പ്രക്രിയകള് ഒരല്പം സമയം നഷ്ടപ്പെടുത്താം.
മിക്സിങ്ങെല്ലാം പൂര്ണമായാല് വിതരണത്തിനായി എം.പി.ത്രീ. പോലുള്ള ഫോര്മാറ്റുകളിലേക്കാക്കാം. നമ്മുടെ ശ്രദ്ധയില് പെട്ടെന്ന് പതിയാത്ത വിശദാംശങ്ങള് ഒഴിവാക്കി സൈസ് കുറയ്ക്കുന്ന ഓഡിറ്ററി മാസ്കിങ് ആണ് എം.പി.ത്രീ.യുടെ പ്രവര്ത്തനതത്വം.
എം.പി.ത്രീയ്ക്ക് ബദലായി ഉപയോഗിച്ചുതുടങ്ങിയിട്ടുള്ള കോഡിങ്ങാണ് എ.എ.സി. (AAC) അഥവാ അഡ്വാന്സ്ഡ് ഓഡിയോ കോഡിങ്. എ.പി.ത്രീ.യ്ക്ക് സമാനമായ ഫയല്സൈസില് കൂടുതല് നിലവാരമുള്ള ശബ്ദം സൂക്ഷിക്കാന് ഇതിനാകും. യൂട്യൂബിലും ഒട്ടേറെ വിനോദോപകരണങ്ങളിലും ഇതിനാണ് ഇപ്പോള് പ്രാമുഖ്യം.
സ്വതന്ത്രസോഫ്റ്റ്വെയര് പ്രേമികള്ക്ക് പ്രിയപ്പെട്ടതാണ് ഓഗ്ഗ് (Ogg). പേറ്റന്റ് നൂലാമാലകളില്ലാത്ത ഒരു കണ്ടെയ്നര് ഫോര്മാറ്റാണിത്. ലോസി ഓഡിയോ കംപ്രഷന് Vorbis, ലോസ്സെല് ഓഡിയോ കംപ്രഷന് FLAC (Free Lossless Audio Codec), ലോസി വീഡിയോ കംപ്രഷന് Theora എന്നിങ്ങനെ വ്യത്യസ്ത കോഡക്കുകളെ ഇത് പിന്തുണയ്ക്കുന്നു.
സാംപ്ലിങ് റെയ്റ്റും ബിറ്റ് ഡെപ്തും
മൈക്കിലെത്തുന്ന ശബ്ദവും മൈക്ക് തരുന്ന സിഗ്നലുമെല്ലാം അനലോഗ് ആണ്. തുടര്ച്ചയായ ഈ തരംഗത്തെ മുറിച്ച് കഷ്ണങ്ങളാക്കുകയും (ഇവ സാംപിളുകള് എന്നറിയപ്പെടുന്നു) ഓരോ കഷ്ണത്തിന്റെയും മൂല്യം പൂജ്യങ്ങളും ഒന്നുകളും വച്ച് രേഖപ്പെടുത്തുകയും ചെയ്യുന്നതാണ് ഡിജിറ്റല് ഓഡിയോയുടെ രീതി. ഒരു സെക്കന്ഡില് എത്ര സാംപിളുകള് എന്നതാണ് സാംപ്ലിങ് റെയ്റ്റ് കൊണ്ടുദ്ദേശിക്കുന്നത്. മനുഷ്യന് കേള്ക്കാവുന്ന എല്ലാ ആവൃത്തിയും (20Hz to 20kHz) രേഖപ്പെടുത്താന് 44,000 Hz (44 kHz) എങ്കിലും സാംപ്ലിങ് റെയ്റ്റ് ആവശ്യമാണ്.
44.1kHz ആണ് ഓഡിയോ സി.ഡി.യില് ഉപയോഗിക്കുന്നത്. ഡി.വി.ഡി.യ്ക്ക് 48kHz. മിക്സിങ്ങിനും എഡിറ്റിങ്ങിനുമിടയ്ക്ക് ഗുണനിലവാരം നഷ്ടപ്പെടാതിരിക്കാനാണ് 96kHz-ഉം അതിന് മുകളിലേക്കും ഉള്ള സാംപ്ലിങ് റെയ്റ്റുകള് ഉപയോഗിക്കുന്നത്. വിതരണത്തിനുള്ള പതിപ്പുകളില് ഇത്രത്തോളം ആവശ്യമുണ്ടെന്ന് തോന്നുന്നില്ല.
ഒരോ സാംപിളും രേഖപ്പെടുത്താന് എത്ര ബിറ്റ് ഉപയോഗിക്കുന്നു എന്നതാണ് ബിറ്റ് ഡെപ്ത്. 16, 24, 32 എന്നീ ബിറ്റ് ഡെപ്തുകളാണ് ഉപയോഗത്തിലുള്ളത്. സാധാരണ മാസ്റ്ററിങ്ങിന് 24 ബിറ്റ് അനുയോജ്യമായിരിക്കും.