Hi Res Audio ตอนที่ ๓ : ไฟล์เพลงรูปแบบ (format) ต่างๆ

ไฟล์เพลง” คืออะไร.?

เดิมทีนั้นคอมพิวเตอร์ทั้งที่ใช้ระบบปฏิบัติการณ์ Windows ของ Microsoft และระบบปฏิบัติการณ์ของคอมพิวเตอร์ McIntosh จะมองไม่เห็น หรือไม่รู้จักสัญญาณออดิโอ PCM ทำให้โปรแกรมต่างๆ ที่ติดตั้งอยู่บนคอมพิวเตอร์ที่ใช้ระบบปฏิบัติการณ์ทั้งสองไม่สามารถทำอะไรกับสัญญาณ PCM ได้ วิศวกรของทาง Windows กับ IBM ได้จับกลุ่มกันออกแบบรูปแบบของไฟล์คอมพิวเตอร์ขึ้นมาฟอร์แม็ตหนึ่งชื่อว่า Waveform Audio File Format หรือเรียกสั้นๆ ว่าไฟล์ WAV” ขึ้นมาเพื่อทำให้คอมพิวเตอร์ที่ใช้ระบบปฏิบัติการณ์ Windows สามารถทำงานกับสัญญาณ PCM ได้ ในขณะเดียวกันทาง Apple Inc. ก็ได้ออกแบบไฟล์ฟอร์แม็ตขึ้นมาใช้กับสัญญาณ PCM ด้วยเช่นกัน โดยใช้ชื่อเรียกว่า Audio Interchange File Format หรือเรียกสั้นๆ ว่าไฟล์ AIFF

ถ้าจะมองให้เข้าใจง่ายๆ ทั้งไฟล์ WAV และไฟล์ AIFF ต่างก็ทำหน้าที่เป็นเสมือน หีบ” (container) หรือกล่อง ที่ใช้เก็บข้อมูลสัญญาณ PCM เอาไว้ เมื่ออยู่ในหีบ WAV หรือ AIFF คอมพิวเตอร์ก็จะสามารถมองเห็นและทำอะไรกับสัญญาณ LPCM ที่อยู่ในหีบ WAV หรือ AIFF ได้

LPCM คือสัญญลักษณ์อีกตัวหนึ่งที่คุณจะพบหากเข้าไปค้นหาข้อมูลของ WAV หรือ AIFF ในเว็บไซต์บนอินเตอร์เน็ต LPCM มาจากคำว่า Linear Pulse-Code Modulation ในขณะที่ PCM มาจากคำว่า Pulse-Code Modulation ซึ่งความแตกต่างระหว่าง PCM กับ LPCM ก็คือ LPCMเป็นคำที่ใช้เรียกลักษณะการแทนค่าของสัญญาณอะนาลอกให้เป็นสัญญาณดิจิตัลแบบเรียลไทม์ ต่อเนื่องกันไปเรื่อยๆ ติดต่อกันโดยไม่มีหยุด ซึ่งตัวสัญญาณเสียง LPCM จึงมีลักษณะเป็นสัญญาณ bitstream ในขณะที่ PCM เป็น “ชื่อสามัญ” ที่ใช้เรียกสัญญาณดิจิตัลที่เข้ารหัสสัญญาณอะนาลอกด้วยกระบวนการ LPCM

ยังมีความแตกต่างระหว่าง PCM กับ LPCM อีกประการหนึ่ง แม้ว่าโดยพื้นฐานแล้ว ทั้ง PCM และ LPCM ต่างก็เป็นสัญญาณเสียงที่อยู่ในรูปของสัญญาณดิจิตัลเหมือนกัน มาจากแหล่งเดียวกัน แต่เมื่อนำไปบรรจุลงบนแผ่น CD ตามมาตรฐานของ Sony/Philips จำเป็นต้องมีการใส่ข้อมูลที่เป็น tag บางอย่างเข้าไปด้วยเพื่อทำให้เครื่องเล่นซีดีสามารถดึงสัญญาณ LPCM จากแผ่นซีดีออกมาเล่นได้ ในขณะที่ LPCM นั้นนับว่าเป็น RAW หรือสัญญาณดิบที่ได้จากกระบวนการ A-to-D จริงๆ และถูกนำไปแพ็คเก็บไว้ในหีบ WAV หรือ AIFF โดยไม่ต้องมีการใส่ข้อมูลเพิ่มเติมลงไปกำกับ ถ้าเอาสัญญาณ LPCM ที่อยู่ในไฟล์ WAV เขียนลงไปบนแผ่นซีดีตรงๆ เครื่องเล่นซีดีจะไม่สามารถเล่นไฟล์ LPCM ได้ ดังนั้น การเอาข้อมูลในไฟล์ WAV ไปเขียนลงบนแผ่นซีดีเพื่อนำไปเล่นบนเครื่องเล่นซีดี จะต้องทำการแปลงสัญญาณ LPCM ให้อยู่ในรูปของสัญญาณ PCM ตามมาตรฐาน Red Book ของฟอร์แม็ต CD-DA ซะก่อน

นอกจาก PCM หรือ LPCM แล้ว ในโลกนี้ยังมีสัญญาณเสียงที่อยู่ในรูปของสัญญาณดิจิตัลที่ถูกใช้กันเป็นมาตรฐานอย่างแพร่หลายอยู่อีกรูปแบบหนึ่ง นั่นคือ DSD หรือ Direct Stream Digital ซึ่งเป็นรูปแบบของสัญญาณเสียงที่ใช้กรรมวิธี Pulse-Density Modulation (PDM) ในการแทนค่าสัญญาณอะนาลอก ซึ่งเป็นเทคนิคคนละแบบกับการทำสัญญาณ LPCM

เมื่อนำสัญญาณ DSD เข้ามาใช้ในคอมพิวเตอร์ จึงต้องมีกล่องใส่สัญญาณ DSD เพื่อใช้ลำเลียงเข้าไปในคอมพิวเตอร์ ซึ่งมีอยู่สองประเภทของกล่อง (หรือ Computer File) ที่ใช้แพร่หลาย นั่นคือ DSF กับ DFF (หรือ DIFF)

สรุปแล้ว “PCM หรือ LPCM” กับ “DSD” คือ “สัญญาณเสียง” รูปแบบหนึ่ง ส่วน ไฟล์เพลงก็คือ ไฟล์คอมพิวเตอร์ประเภทหนึ่งที่เก็บสัญญาณเสียงเอาไว้ข้างในนั่นเอง ..

“ฟอร์แม็ต” ของไฟล์เพลงแบบ ‘Uncompress’
กับแบบ ‘Compressed’

เนื่องจากไฟล์เพลงฟอร์แม็ต WAV และ AIFF ถูกออกแบบมาด้วยวัตถุประสงค์เพื่อใช้ เก็บข้อมูลสัญญาณ LPCM ตั้งแต่แรก ไฟล์เพลงทั้งสองฟอร์แม็ตนั้นจึงมีสถานะเป็น Uncompressed audio formatคือเก็บข้อมูลสัญญาณเพลงลงไปตรงๆ โดยไม่มีการเปลี่ยนแปลงคุณสมบัติพื้นฐานใดๆ ของตัวสัญญาณ เพราะฉนั้น คุณสมบัติแรกของไฟล์เพลงที่เป็นแบบ Uncompressed audio format ก็คือขนาดของไฟล์ที่ เท่ากับขนาดของข้อมูลที่มันเก็บเข้าไป

ปัจจุบัน ทุกระบบปฏิบัติการบนคอมพิวเตอร์ทั้ง Windows, OSx และ Linux ต่างก็รองรับไฟล์เพลงฟอร์แม็ต WAV กับ AIFF ได้ทั้งหมด

ในยุคแรกๆ ที่ Hard Disk Drive หรือหน่วยเก็บข้อมูลดิจิตัล หัวใจหลักของคอมพิวเตอร์ที่ใช้ในการเก็บทั้งตัวโปรแกรมที่ใช้ run บนคอมพิวเตอร์และใช้เก็บข้อมูล (data) อื่นๆ รวมถึงไฟล์เพลงยังคงมีราคาสูงและยังคงมีความสามารถในการเก็บข้อมูลได้น้อย (ความจุต่ำ) การเก็บไฟล์เพลงที่อยู่ในรูปของไฟล์ Uncompressed ทำให้ไฟล์มีขนาดใหญ่ จึงสิ้นเปลืองเนื้อที่มากและทำให้ต้นทุนในการจัดเก็บอยู่ในระดับที่สูงมากอีกด้วย อีกทั้งการ transfer หรือส่งผ่านไฟล์ข้อมูล Uncompressed ไปบนคอมพิวเตอร์ก็ต้องใช้เวลาเยอะ ในปี 1991 กลุ่มผู้คิดค้นกรรมวิธีการเข้ารหัสสัญญาณภาพด้วยกระบวนการดิจิตัลที่ชื่อว่า MPEG (Moving Picture Experts Group) ได้คิดค้นกรรมวิธีการ “บีบอัด” (compress) สัญญาณเสียงให้มีขนาดเล็กลงกว่าต้นฉบับออกมาด้วย ชื่อว่าฟอร์แม็ต MPEG-1 part 3 หรือ MPEG-1 layer 3 เรียกย่อๆ ว่า MP3

MP3 ใช้ซอฟท์แวร์ในการ compressed ข้อมูลสัญญาณเพลงด้วยกระบวนวิธีที่เรียกว่า perceptual coding ซึ่งเป็นซอฟท์แวร์ที่เขียนขึ้นมาโดยอาศัยหลักการทางด้าน psychoacoustic (ลักษณะเดียวกับระบบเสียง dolby digital) มีความสามารถในการบีบอัดข้อมูลสัญญาณเสียงให้มีขนาดเล็กลงกว่าต้นฉบับเดิมได้มาก และสามารถปรับตั้งระดับของการบีบอัด (compressed) ได้ด้วย ขึ้นอยู่กับว่าจะต้องการรักษาคุณภาพเสียงไว้มากแค่ไหน หรือต้องการประหยัดพื้นที่ในการจัดเก็บมากกว่ากัน การปรับใช้ขึ้นอยู่กับวัตถุประสงค์ของงาน ยกตัวอย่างเช่น ถ้าใช้การปรับตั้งไว้ที่ 128kbit/s แล้วทำการบีบอัดสัญญาณเสียงเพลง LPCM ที่ริปมาจากแผ่นซีดี จะทำให้ได้ไฟล์ MP3 ของสัญญาณนั้นออกมามีขนาดที่เล็กเพียงแค่ 1 ใน 11 เท่าของต้นฉบับเท่านั้นเอง!

สรุปแล้ว Uncompressed audio file format ก็คือ ไฟล์เพลงที่บรรจุข้อมูลของสัญญาณเพลงที่ “ไม่ได้” ผ่านขั้นตอนการบีบอัดข้อมูลก่อนการจัดเก็บ เป็นรูปแบบของไฟล์เพลงที่ให้คุณภาพเสียงสูงสุด เพราะข้อมูลของสัญญาณเพลงที่เก็บอยู่บนไฟล์เพลงแบบ Uncompressed นี้จะมีคุณสมบัติเหมือนต้นฉบับทุกประการ

ในขณะที่ไฟล์เพลงแบบ Compressed audio file format นั้นก็คือไฟล์เพลงที่บรรจุสัญญาณเสียงเพลงมี “ผ่าน” ขั้นตอนการบีบอัดข้อมูลต้นฉบับให้มีขนาดที่เล็กลง (หายไปบางส่วน) ก่อนจะนำไปเก็บไว้

ไฟล์เพลง Compressed audio file format
แบบ ‘Lossless’ กับแบบ ‘Lossy’

ไฟล์เพลงมีอยู่ด้วยกัน 3 กลุ่มหลักๆ ได้แก่

1: Uncompressed audio  format
2: Lossless compression  format
3: Lossy compression”  format

กลุ่มแรกคือ Uncompressed audio format ได้กล่าวถึงในหัวข้อก่อนหน้าไปแล้ว ส่วนกลุ่มที่สองกับที่สามเป็นกลุ่มของไฟล์เพลงที่ผ่านขั้นตอนการบีบอัดข้อมูลสัญญาณทั้งคู่ ต่างกันก็คือ กลุ่มที่สอง Lossless Compression Format นั้นจะมีประสิทธิภาพสูงกว่า คือสามารถบีบอัดขนาดข้อมูลให้เล็กลงกว่าต้นฉบับได้ แต่หลังจากนำไฟล์เพลงกลุ่มที่สองนี้ ไปเล่นกลับออกมาเป็นสัญญาณอะนาลอก จะได้คุณภาพเสียงออกมาใกล้เคียงต้นฉบับมาก ยากต่อการฟังจับความแตกต่างเมื่อเทียบกับไฟล์เพลงที่เป็นแบบ Uncompressed Audio Format

ส่วนไฟล์เพลงกลุ่มที่สาม Lossy compression format เป็นประเภทของไฟล์เพลงที่บีบอัดข้อมูลสัญญาณเพลงในปริมาณมาก เน้นเพื่อประหยัดพื้นที่จัดเก็บมากกว่าเน้นคุณภาพเสียง และเพื่อให้ง่ายต่อการสตรีมไปบนอินเตอร์เน็ตและบนเน็ทเวิร์คด้วย ดังนั้น คุณภาพเสียงของไฟล์ประเภท Lossy compression format จึงด้อยกว่าต้นฉบับอย่างชัดเจน

ในขณะที่หน่วยเก็บข้อมูลบนคอมพิวเตอร์ (Computer Hard Disk) เริ่มมีราคาต่ำลง ได้เริ่มมีการคิดค้นกระบวนการบีบอัดข้อมูลเพลงที่มีประสิทธิภาพสูงขึ้น นั่นคือไม่ทำให้คุณภาพเสียงลดต่ำลงมากในขณะที่ยังคงสามารถประหยัดพื้นที่ในการจัดเก็บอยู่ในระดับที่น่าพอใจ

Josh Coalson นักพัฒนาโปรแกรมอิสระได้เริ่มทำการคิดค้นกระบวนวิธีในการบีบอัดข้อมูลสัญญาณเพลงที่ชื่อว่า FLAC หรือ Free Lossless Audio Codec ซึ่งเป็นกระบวนการบีบอัดข้อมูลที่จัดอยู่ในกลุ่ม Lossless compression format ออกมาเมื่อปี 2000 และปล่อยให้นักพัฒนาโปรแกรมคนอื่นๆ เข้ามาช่วยกันพัฒนาต่อยอด ก่อนที่องค์กร Xiph.org จะเข้ามาสนับสนุนให้การพัฒนา FLAC ดำเนินไปอย่างต่อเนื่องและใช้งานได้จริง

จริงๆ แล้ว กระบวนการบีบอัดข้อมูลสัญญาณเพลงที่ให้ผลลัพธ์ในระดับที่เรียกว่า Lossless audio compression หรือการบีบอัดที่ไม่มีความสูญเสียใดๆ เกิดขึ้นกับสัญญาณเสียงมีอยู่ด้วยกันหลายฟอร์แม็ต นอกจาก FLAC ก็มี Monkey’s Audio, WavPack, TTA, ATRAC, ALAC ฯลฯ แต่เหตุผลที่ทำให้ฟอร์แม็ต FLAC เป็นที่นิยมก็เพราะว่า FLAC เป็นฟรีแวร์ที่ไม่ต้องเสียค่าลิขสิทธิ์ในการนำไปใช้นั่นเอง

จากภาพประกอบด้านบน เป็นการทดลองเล่นไฟล์เพลงฟอร์แม็ต WAV ที่ริปมาจากแผ่นซีดี ดูในช่องสี่เหลี่ยมขวามือด้านล่างที่ระบุแหล่งที่เก็บข้อมูลสัญญาณและรูปแบบของไฟล์เพลง (ศรชี้ A) เมื่อนำไฟล์เพลงนี้มาเล่นบนโปรแกรมเล่นเพลง Foobar2000 ตัวโปรแกรมจะโชว์ให้รู้ว่า เนื้อสัญญาณเพลงที่อยู่ในหีบ WAV นั้นมีคุณสมบัติพื้นฐานอย่างไร ดูที่มุมซ้ายล่างสุดของภาพ (ศรชี้ B) อาทิ เป็นสัญญาณรูปแบบไหน (ในภาพคือ PCM) แซมปลิ้งเรตเท่าไหร่ (ในภาพคือ 44.1kHz เพราะเป็นสัญญาณที่ริปมาจากแผ่นซีดีโดยไม่มีการเปลี่ยนแปลงใดๆ) และมีอัตราบิตเรต หรือสปีดในการจัดส่งข้อมูลเพลงเท่าไร ซึ่งในภาพคือ 1411kbps เพราะสัญญาณ LPCM อยู่ในรูปของสัญญาณบิตสตรีมจึงแจ้งเป็นบิตเรต โดยคำนวนมาจาก 16 (bit) x 44,100 (sampling rate) x 2 (stereo) = 1,411,200 bps (bit-per-second) นั่นเอง /
***************
คลิ๊กกลับไปอ่าน –
Hi Res Audio ตอนที่ ๑ : เทรนของการฟังเพลงด้วยไฟล์ดิจิตัล
Hi Res Audio ตอนที่ ๒ : ทำความรู้จักกับ “ไฮ-เรโซลูชั่น ออดิโอ”
อ่านต่อ –
Hi Res Audio ตอนที่ ๔ : การฟังเพลงด้วยไฟล์ผ่านคอมพิวเตอร์
Hi Res Audio ตอนที่ ๕ : โปรแกรมที่ใช้เล่นไฟล์เพลงผ่านคอมพิวเตอร์

mm

About ธานี โหมดสง่า

View all posts by ธานี โหมดสง่า