ถ้าเข้าไปอ่านรายละเอียดการทำงานของอุปกรณ์ประเภท external DAC ในยุคปัจจุบันจะพบว่ามีการทำงานของกระบวนการ Upsampling เข้าไปเกี่ยวข้องอยู่แทบจะทุกตัว หลายคนอาจจะสงสัยว่า Upsampling คืออะไร.? ส่งผลอย่างไรกับเสียงของ DAC และทำไมต้องมีกระบวนการนี้อยู่ในขั้นตอนการทำงานของ DAC ? และ Oversampling กับ Upsampling เหมือนหรือต่างกันอย่างไร.? ในบทความนี้จะแจกแจงข้อสงสัยเหล่านี้ให้ทราบอย่างละเอียด
ก่อนจะไปถึงเรื่อง Upsampling เราต้องเริ่มต้นที่คำว่า ‘sampling’ ก่อน
ภาพด้านบนคือการแปลงสัญญาณมาสเตอร์อะนาลอก (ฝั่งซ้าย = Analog Wave) ให้ออกมาเป็นสัญญาณดิจิตัล (ฝั่งขวา = Digital Result) โดยอาศัย ADC (analog-to-digital converter) จากภาพสื่อว่า อัตราแซมปลิ้งที่ใช้ในการแปลงสัญญาณอะนาลอกทางซ้าย จะเทียบได้กับ “จำนวนจุด” ที่แทนค่าลงบนเส้นกราฟของคลื่นเสียงดิจิตัลทางขวา ความแตกต่างจาก A ลงมาที่ B และ C ในภาพคือการเพิ่มอัตราแซมปลิ้งในขั้นตอน ADC ให้สูงขึ้น และทุกครั้งที่เพิ่มอัตราแซมปลิ้งเรตที่สูงขึ้น ผลลัพธ์ที่ออกมาก็คือได้ “จำนวนจุด” ที่ใช้แทนค่าลงบนเส้นกราฟของคลื่นเสียงดิจิตัลที่ออกมาใกล้เคียงกับรูปคลื่นอะนาลอกที่เป็นต้นฉบับมากขึ้นเรื่อยๆ
*ขอบคุณภาพประกอบจากเว็บไซต์ diese9.com
ย้อนกลับไปยุคแรกของวงการดิจิตัล ออดิโอช่วงต้นยุค ’80 ฟอร์แม็ตแรกก็คือ CD ซึ่งใช้ ADC ในการแปลงสัญญาณอะนาลอกมาสเตอร์ให้ออกมาเป็นสัญญาณดิจิตัลด้วยอัตราแซมปลิ้งเท่ากับ 44.1kHz (*เหตุที่กำหนดเท่านี้เพราะเป้าหมายที่ต้องการคือให้ครอบคลุมความถี่ 20Hz – 20kHz เท่าที่หูของมนุษย์รับฟังได้) จะเห็นว่า อัตราแซมปลิ้งในขั้นตอน ADC จะ “มากกว่าสองเท่า” ของความถี่อะนาลอกที่เป็นเป้าหมาย ซึ่งเป็นไปตามกฏของ Nyquist-Shannon Sampling Theorem นั่นเอง
เมื่อมาถึงขั้นตอนที่สัญญาณดิจิตัลนั้นถูกแปลงกลับมาเป็นสัญญาณอะนาลอกในขั้นตอน DAC (digital-to-analog converter) ตามทฤษฎีแล้ว ก็ต้องใช้อัตราแซมปลิ้งที่ภาค DAC เท่ากับอัตราแซมปลิ้งที่ใช้ในขั้นตอน ADC จึงจะได้สัญญาณอะนาลอกที่ “คืนรูป” กลับมาเหมือนต้นฉบับก่อนจะผ่านเข้าสู่ภาค ADC ง่ายๆ แบบนี้ เพราะ digital audio ใช้พื้นฐานของการคำนวนเป็นหลัก แต่.. ในโลกของความเป็นจริง กระบวนการแปลงสัญญาณอะนาลอกให้เป็นดิจิตัล (ADC) และกระบวนการแปลงสัญญาณดิจิตัลให้เป็นอะนาลอก (DAC) ต้องอาศัยการทำงานของฮาร์ดแวร์ที่สวิทช์กลับไปกลับมา (เรียกว่า sampling switch หรือ digital pulse) อย่างรวดเร็วในการจัดการกับสัญญาณดิจิตัลที่มีค่า 0 กับ 1 ซึ่งไม่มีฮาร์ดแวร์ใดในโลกที่ทำงานเร็วๆ ระดับนั้นได้อย่างไม่มีข้อผิดพลาด ตั้งแต่ยุค CD มาแล้วที่วิศวกรที่เกี่ยวข้องอยู่ในวงการดิจิตัล ออดิโอในยุคนั้นค้นพบว่ากระบวนการ ADC และ DAC มีปัญหาที่เกิดจากการทำงานที่ไม่เป็นไปตามอุดมคติของฮาร์ดแวร์เข้ามาเกี่ยวข้อง ทำให้เกิดปรากฏการณ์ที่เรียกว่า Aliasing หรือ “ความถี่ส่วนเกิน” ที่ไม่ตรงกับต้นฉบับสัญญาณปนเข้ามาอยู่กับสัญญาณเสียงที่อยู่เหนือความถี่ที่เป็น Nyquist limit คือ 22,050Hz ออกมาด้วย ในการแก้ปัญหานี้ จึงได้มีการออกแบบวงจรฟิลเตอร์แบบ low-pass filter (เรียกว่า anti-aliasing filter) ออกมาเพื่อใช้กรองความถี่แปลกปลอมที่ว่านั้นทิ้งไป ซึ่งวงจรฟิลเตอร์ที่จะตัดปัญหา aliasing ออกไปได้อย่างเด็ดขาดจะต้องใช้ฟิลเตอร์ที่มีความชันสูงๆ และตัดใกล้ๆ กับความถี่ 22,050Hz แต่เนื่องจากความถี่สูงสุดคือ 22,050Hz ที่ได้จากฟอร์แม็ต CD นั้น “อยู่ใกล้” กับความถี่สูงสุดที่เป็นเป้าหมายคือ 20kHz มาก เมื่อใช้ฟิลเตอร์ที่มีสโลปชันมากๆ ในการกรองความถี่ที่อยู่ใกล้ๆ กับ 22,050Hz จึงมีผลข้างเคียงที่ไม่พึงประสงค์เกิดขึ้น นั่นคือ “เฟสเคลื่อน” (phase shift) ซึ่งส่งผลเสียต่อคุณภาพเสียงตามมา
Oversampling
ช่วงต้น ’80 ในยุคแรกของฟอร์แม็ต CD นั้น หลังจากค้นพบปัญหา aliasing ที่ส่งผลเสียต่อเสียง ผู้ผลิตเครื่องเล่นซีดีก็ได้มีการออกแบบวงจรฟิลเตอร์ออกมาขจัด aliasing แต่ก็พบว่ามีผลข้างเคียงคือทำให้เกิดปัญหาเฟสเคลื่อน เพราะวงจรฟิลเตอร์ที่ใช้มีความชันสูง เพื่อแก้ปัญหาเฟสเคลื่อน ในทางปฏิบัติก็ต้องปรับลดความชันของวงจรฟิลเตอร์ลง แต่ถ้ายังยึดตามกฏของ Nyquist ในการแปลงสัญญาณดิจิตัลจากซีดีด้วยอัตราแซมปลิ้งที่ 44.1kHz การใช้วงจรฟิลเตอร์ที่มีความชันน้อยๆ ก็จะทำให้ความถี่ในย่านสูงถูกวงจรฟิลเตอร์ตัดหายไปด้วย
ในเมื่อ Sony กับ Philips ล็อคสเปคฯ แซมปลิ้งเพื่อเข้ารหัส (encode) สัญญาณเสียงของฟอร์แม็ต CD ไว้ที่ 44.1kHz ซะแล้ว เปลี่ยนแปลงอะไรไม่ได้ ถ้ามองจากมุมของคนทำเครื่องเล่นซีดี เมื่อย่านความถี่เป้าหมายที่เราให้ความสำคัญมากที่สุดหลังกระบวนการ DAC ก็คือ 20Hz – 20kHz และเราไม่ต้องการให้มีปัญหา aliasing ที่เกิดขึ้นจากประบวนการ DAC ไปทำลายคุณภาพเสียง ก็ต้องใช้วงจรฟิลเตอร์เข้ามาช่วยขจัด aliasing ทิ้งไป แต่ในขณะเดียวกัน เราก็ไม่ต้องการให้วงจรฟิลเตอร์ที่ว่านี้ไปทำให้เกิดปัญหาเฟสเคลื่อน (phase-shift) ซึ่งจะไปกระทบกับคุณภาพเสียงในย่าน 20Hz – 20kHz ที่เป็นเป้าหมาย เราก็ต้องเปลี่ยนมาใช้ฟิลเตอร์ที่มีความชันน้อยลง (gentle slope) แต่ก็ต้องเจอกับปัญหาความถี่สูงบางส่วนถูกวงจรฟิลเตอร์ตัดทิ้งไปอีก ด้วยเหตุนี้ คงเหลือแค่หนทางเดียวที่จะแก้ปัญหาเหล่านี้ได้อย่างเด็ดขาด นั่นคือ “ขยายอัตราแซมปลิ้ง” ที่ใช้ในขั้นตอน DAC ให้ “สูงกว่า” ความถี่แซมปลิ้งของสัญญาณอินพุตที่ 44.1kHz ขึ้นไปอีก นี่เป็นที่มาของเทคนิคที่เรียกว่า ‘Oversampling’
หลักการของเทคนิค Oversampling ก็คือการใช้อัตราแซมปลิ้งในขั้นตอน DAC ที่สูงกว่าอัตราแซมปลิ้งของสัญญาณดิจิตัลอินพุต (ก่อนส่งเข้า DAC) ซึ่งในยุคแรกของการใช้เทคนิคนี้ เริ่มต้นด้วยการทำ โอเว่อร์แซมปลิ้ง 2 เท่า ของสัญญาณอินพุตที่ 44.1kHz คือขยับขึ้นไปเป็น 88.2kHz ซึ่งก็พบว่าเทคนิคนี้ช่วยแก้ปัญหาได้จริง และมันช่วยทำให้ได้เสียงที่ดีขึ้น ต่อมาจึงได้มีการทดลองเพิ่มอัตราแซมปลิ้งขึ้นไปอีกจนถึง 8 เท่า จึงพบว่าได้ค่าเฉลี่ยของคุณภาพเสียงออกมาดีที่สุดเมื่อเทียบกับต้นทุนในการผลิตเชิงพานิชย์ในยุคนั้น (ปี ’80)
ในอดีต ผู้ผลิตเครื่องเล่นซีดีแบรนด์ Cambridge ในยุคนั้นได้ออกแบบวงจร DAC ที่ใช้อัตราโอเว่อร์แซมปลิ้งสูงถึง 16 เท่า โดยนำไปใช้ในเครื่องเล่นซีดีรุ่น CD 2 ของพวกเขาแต่ก็ไม่มีแบรนด์อื่นใช้อัตราโอเว่อร์แซมปลิ้งที่สูงถึงระดับนั้น
Upsampling
หลังจากเทคนิค ‘Oversampling’ ถูกคิดค้นขึ้นมาไม่นาน ก็มีการนำเสนอเทคนิคที่เรียกว่า ‘Upsampling’ ตามมา ซึ่งโดยพื้นฐานแล้ว การทำ Upsampling ก็คือการ “เพิ่มอัตราแซมปลิ้งสัญญาณ” ขึ้นมาจากสัญญาณต้นฉบับที่เข้ามาทางอินพุตเหมือนกัน ด้วยเหตุนี้ คนส่วนใหญ่จึงมีความเข้าใจว่า ‘Upsampling’ กับ ‘Oversampling’ เป็นเรื่องเดียวกัน แต่จริงๆ มันแค่ “คล้ายกัน” แต่ไม่เหมือนกันซะเลยทีเดียว
“Oversampling is an upsampling process where the ‘ratio’ between output sampling frequency and input sampling frequency is an integer larger than 1. Upsampling is any kind of transformation providing an output sampling frequency that is higher than the input sampling frequency and not necessarily a ratio.“
ข้างบนนั้นคือความหมายที่แตกต่างระหว่าง Oversampling กับ Upsampling ที่คุณ Thierry Heeb ผู้ก่อตั้งบริษัท Anagram Technologies ของสวิสเซอร์แลนด์กล่าวไว้ (*ขอบคุณสื่อ Soundstagenetwork.com สำหรับข้อความนี้) แปลความได้ว่า การทำ Oversampling คือการยกระดับ “แซมปลิ้ง” ของสัญญาณทางด้านเอ๊าต์พุตที่มีอัตราส่วน “มากกว่า” สัญญาณที่เข้ามาทางอินพุตเป็นจำนวนเท่าขึ้นไป อย่างเช่น 2 เท่า, 4 เท่า, 8 เท่า ฯลฯ แต่การทำ Upsampling ก็เป็นการยกระดับ “แซมปลิ้ง” ของสัญญาณทางด้านเอ๊าต์พุตให้ “สูงกว่า” สัญญาณที่เข้ามาทางด้านอินพุต โดยไม่จำเป็นต้องมีอัตราส่วนที่เป็นจำนวนเท่าของสัญญาณอินพุตเสมอไป ซึ่งสังเกตได้ว่า การทำ Upsampling จะถูกใช้ใกล้กับอินพุตของชิป DAC ในขณะที่การทำ Oversampling จะเกิดขึ้นตั้งแต่สัญญาณอินพุตผ่านเข้ามา และการทำ Upsampling มักจะกำหนดระดับแซมปลิ้งเป็นเป้าหมายที่ปลายทางไว้คงที่ (อย่างเช่น 192kHz หรือ 352.8kHz/384kHz) ไม่ว่าสัญญาณอินพุตที่เข้ามาจะใช้อัตราแซมปลิ้งที่กี่ Hz ก็จะถูกอัพฯ ขึ้นไปอยู่ที่ระดับแซมปลิ้งที่ตั้งไว้เป็นเป้าหมายที่ปลายทางเหมือนกันทั้งหมด
แบบไหนดีกว่ากัน.? ระหว่าง Oversampling กับ Upsampling
ทั้งๆ ที่เป็นการยกระดับแซมปลิ้งของสัญญาณทั้งคู่ แต่ผลที่เกิดขึ้นกับเสียงจะออกมาต่างกัน เนื่องจากการทำ Oversampling จะอาศัยสัญญาณ clock ที่ติดมากับสัญญาณเป็นตัวกำหนด clock input สำหรับภาค DAC แต่เนื่องจากสัญญาณอินพุตถูกทำโอเว่อร์แซมปลิ้งมาตั้งแต่ต้นทาง กว่าจะเดินทางมาถึงภาค DAC ก็มีโอกาสที่จะทำให้เกิดปัญหา clock บนสัญญาณปลายทางไม่ตรงกับสัญญาณต้นทาง ซึ่งจะเกิดขึ้นได้มากในกรณีที่มีอุปกรณ์ที่เกี่ยวข้องกับระบบดิจิตัลเพลย์แบ็คมากกว่าหนึ่งเครื่อง ซึ่งปัญหาความไม่ซิ้งค์กัน (ไม่ in-phase กันเป๊ะๆ) ระหว่างตัวสัญญาณกับ clock ที่กำกับมากับสัญญาณนั้นจะก่อให้เกิดความเพี้ยนขึ้นมารูปแบบหนึ่ง เรียกว่า jitter ซึ่งจะฝังอยู่กับตัวสัญญาณ และยิ่งมีกระบวนการ Oversampling เข้ามาเกี่ยวข้อง ก็จะยิ่งทำให้ปัญหา jitter ที่เกิดขึ้นมีความรุนแรงมากขึ้น ด้วยเหตุนี้ การทำ Oversampling จึงไม่ได้ทำให้เกิดผลดีต่อเสียงแต่อย่างใด มิหนำซ้ำ จะยิ่งทำให้เกิดผลเสียต่อเสียงมากกว่า
ส่วนกระบวนการทำ Upsampling ผู้ออกแบบ DAC จะกำหนดอัตราแซมปลิ้งเป้าหมายที่มีค่าคงที่เอาไว้ระดับหนึ่ง เมื่อมีอัตราแซมปลิ้งเป้าหมายแค่ค่าเดียว ก็ทำให้พวกเขาสามารถออกแบบวงจรฟิลเตอร์ที่ใช้กับอัตราแซมปลิ้งนั้นได้อย่างมีประสิทธิภาพสูงสุดได้ และเมื่อกระบวนการทำ Upsampling ถูกกำหนดไว้ใกล้กับอินพุตของชิป DAC ทำให้ผู้ออกแบบไม่ต้องกังวลกับ clock เพี้ยนๆ ที่ติดมากับตัวสัญญาณ เพราะสามารถแก้ไขได้ด้วยการออกแบบวงจร re-clocking ขึ้นมาใช้ ซึ่งจะทำการล้าง clock เพี้ยนๆ ที่ติดมากับสัญญาณดิจิตัลอินพุตออกไป แล้วเปลี่ยน clock ที่กำหนดใหม่ให้กับสัญญาณดิจิตัลอินพุตที่เดินทางมาถึงขึ้นตอนอัพแซมปลิ้ง ซึ่งเป็นวิธีที่สามารถขจัดปัญหา jitter ออกไปได้อย่างเด็ดขาด ทั้งหมดนี้เป็นเหตุผลที่ทำให้กระบวนการ Upsampling ส่งผลดีต่อคุณภาพเสียง
นี่คือเหตุผลที่ DAC ยุคใหม่ๆ ที่เน้นคุณภาพเสียงจริงๆ จังๆ มักจะมีการทำงานของกระบวนการ Upsampling เข้ามาเกี่ยวข้องเสมอ ซึ่งในยุคแรกนี้ อัตราแซมปลิ้งที่เป็นเป้าหมายปลายทางจะอยู่ที่ระดับ 192kHz และเมื่อเทคโนโลยีในการประมวลผลสูงขึ้น จะทำให้อัตราแซมปลิ้งที่เป็นเป้าหมายปลายทางถูกขยับสูงขึ้นไปเป็น 384kHz และ 768kHz ในอนาคต ในขณะเดียวกัน DAC ที่ออกแบบด้วยความพิถีพิถันและเน้นคุณภาพเสียงมากยิ่งขึ้น จะมีการใช้ clock ที่มีประสิทธิภาพสูงสำหรับจัดการกับสัญญาณอินพุตโดยแยกออกเป็น 2 ชุด คือ clock สำหรับจัดการกับสัญญาณดิจิตัลอินพุตที่ใช้ฐาน 44.1kHz (44.1, 88.2, 176.4, 352.8, 705.6kHz) กับ clock อีกชุดที่ใช้กับสัญญาณดิจิตัลอินพุตที่ใช้ฐาน 48kHz (48, 96, 192, 384, 768kHz) ซึ่งจะยิ่งทำให้ได้ผลลัพธ์ทางเสียงที่ดีมากขึ้นไปอีกขั้น
**********