Những Điều Cần Biết Về Âm Thanh

Những Điều Cần Biết Về Âm Thanh

Ý nghĩa các tính chất và định dạng của một bản nhạc số

Các tính chất

Các bản nhạc số thường được thu âm trong các studio với không ít thiết bị phức tạp. Nhưng về thực chất, thu âm là quá trình chuyển đổi sóng âm thanh thành tín hiệu số. Như đã biết, “âm thanh thực” là các sóng cơ học, có hình dáng sin tuần hoàn liên tục (analog) trong lúc “âm thanh số” chỉ là những xung điện tử rời rạc (digital). Do đó, bằng những “mẩu” rời rạc, âm thanh số chỉ có thể mô phỏng một cách gần giống nhất với âm thanh thực tế mà thôi. Việc mô phỏng này được đặc trưng bởi các thông số sau:

– Sample: Là thành phần nhỏ nhất của bản nhạc số. Để có những xung điện tử rời rạc, cần phải tiến hành rất nhiều lần lấy mẫu. Mỗi mẫu gọi là một sample – là giá trị biên độ của tần số sóng âm tại thời khắc lấy mẫu. Càng lấy nhiều mẫu, tín hiệu số thu được càng chuẩn xác hơn.

– Sample Rate: (Sampling Rate, Sampling Frequency): Là số lần lấy mẫu trên một giây, có đơn vị Hz. Một bản nhạc có sample rate là 44100 Hz thì mỗi giây nhạc sẽ tiến hành lấy mẫu 44100 lần.

– BitDepth: Để lưu lại dưới dạng số, mỗi mẫu được trình diễn bằng một lượng bit tài liệu nhất định, gọi là BitDepth. Các bản nhạc hiện nay thường có BitDepth là 16 bits, 24 bits…BitDepth càng lớn âm thanh càng sắc nét, trung thực nên nó còn được gọi là Resolution (độ sắc nét).

– Channel: Bằng các thuật toán, tín hiệu số sẽ tiến hành tách ra thành nhiều kênh (Channel) sao cho lúc nghe tới bằng khối hệ thống loa thích hợp sẽ có được cảm giác như khi đang nghe nhạc trong không gian thực tế.

Từ 4 thông số cơ bản trên, ta không những biết được chất lượng sản phẩm mà còn tồn tại thể tính được dung tích của bản nhạc. Ví dụ một phút của bản nhạc có : Sample rate = 44100 Hz, BitDepth = 16 bits = 2 bytes, Channel = 2 kênh sẽ có được dung tích: 44100 đợt lấy mẫu x 2 bytes x 60 giây x 2 kênh = 10.584.000 bytes, tức khoảng tầm 10.1 MB.

– BitRate: Là thông số thu gọn, thay mặt cơ bản cho những tính chất trên. Bitrate có đơn vị Kbps (Kilobits per second) – dung tích (tính theo bit) của âm thanh số trên một giây. Với Bitrate, ta có thể xác định nhanh chóng dung tích cũng như phần nào chất lượng sản phẩm của bản nhạc. Một phút nhạc 128 kbps có dung tích khoảng tầm 1 MB và bản nhạc 320 kbps thì vững chắc sẽ hay hơn bản nhạc 128 kbps.

Các định dạng

Sau quá trình thu âm, ta được một file nhạc wav có chất lượng sản phẩm nguyên gốc nhưng dung tích rất lớn, khoảng tầm 10 MB cho từng phút nhạc. Bởi vậy, để tiện việc lưu trữ hay san sớt, người ta phải nén các bản nhạc lại dưới các định dạng. Mỗi định dạng ứng với một thuật toán nén nhất định và tỉ lệ nén cũng như chất lượng sản phẩm sau thời điểm nén của bản nhạc cũng khác nhau. Có hai cách nén đây chính là: nén có mất (lossy compression) tạo ra các file nhạc mp3, wma, ogg…và nén không mất (lossless compression) để tạo các file nhạc flac, ape… Khi nén có mất (rip hoặc convert nhạc), lớp học nén sẽ cắt bớt đi những dải tần số âm thanh nhất định (thường là dải tần trên 20 Khz, theo đặc điểm về khả năng nghe của tai người), từ đó giảm được dung tích bản nhạc. Nhưng cái phải trả giá là chất lượng sản phẩm âm thanh sẽ giảm đi. Do vậy, càng giảm ít thì định dạng nhạc hay thuật toán mã hóa càng tốt.

Theo nhiều đánh giá và thẩm định thì định dạng ogg, wma cho chất lượng sản phẩm tốt hơn mp3 với cùng một dung tích. Bạn cũng nên nhớ rằng việc chuyển đổi qua lại các định dạng cũng làm giảm chất lượng sản phẩm bản nhạc.

Có rất nhiều cách nén với loại bitrate khác nhau như: CBR/ABR/VBR:

– CBR: Constant bitrate: Tức thị bitrate của stream là một hằng số và không thay đổi tại bất kỳ điểm nào của stream.Sử dụng bitrate nhất thiết để mã hoá toàn bộ file. Đây là thiết lập mặc định của hồ hết các máy nghe nhạc

– ABR: Average bitrate: Tức thị stream có thể sử dụng bitrate thay đổi cho từng frame,nhưng bitrate trung bình của toàn bộ stream là nhất thiết.gần giống VBR ngoại trừ kích thước file biết trước (với VBR, kích thước file có khi lớn, khi nhỏ tuỳ vào độ phức tạp của âm thanh) nhờ kiểm soát và điều chỉnh mức thay đổi quanh giá trị bitrate trung bình ấn định trước.

– VBR: Variable bitrate: Tức thị stream có thể sử dụng bitrate thay đổi cho từng frame và tùy biến để đạt được bitrate cấp thiết cho từng frame,vì vậy bitrate trung bình không thể xác định trước lúc encode hay tính toán cụ thể….Sử dụng bitrate thay đổi tuỳ theo yêu cầu của từng đoạn âm thanh. Thường thì VBR cho chất lượng sản phẩm tốt hơn với kích thước file nhỏ hơn CBR nhờ cấp phép bitrate “thông minh” hơn. Tất cả định dạng “lossless” đều được mã hoá theo VBR, nhiều định dạng “lossy” mới (như WMA phiên bản 9) cũng tương trợ VBR.

Lưu ý là việc convert lại để tăng bitrate không thể làm tăng chất lượng sản phẩm bản nhạc. Một bản nhạc 320 kbps được tạo ra từ bản nhạc gốc có bitrate 64 kbps giống như bạn lấy 90% vật liệu của một chiếc bánh nhỏ để làm một chiếc bánh to ra hơn.

Khác với nén có mất, việc nén nhạc không mất giống như ta nén dạng zip, rar. Tỷ lệ nén của định dạng này không đảm bảo (tối đa là nén còn bằng 1/3 dung tích bản nhạc gốc) nhưng bù lại, chất lượng sản phẩm âm thanh lại tương đương với bản nhạc gốc (bởi thực chất ta không cắt xén bản nhạc gốc, lúc chơi nhạc, các phần mềm chỉ tiến hành giải nén mà thôi). Khi lưu trữ các đĩa nhạc, muốn tiết kiệm chi phí dung tích mà chất lượng sản phẩm âm thanh vẫn không đổi, ta hãy rip thành các bản nhạc nén không mất.

Âm thanh được ghi trên đĩa CD và định dạng file âm thanh WAV được sử dụng chuẩn định dạng pulse-code modulation (PCM) (tạm dịch là điều biến nhịp, tức là trong analog ta thấy 1 tần số sine diễn tả âm thanh, nhưng trong kĩ thuật số ta không thể có sóng sine mà người ta sử dụng những “nhịp đập” cao thấp khác nhau một cách liên tục để diễn tả cần đúng nhất hình dạng sóng sine”) . Đây là những tín hiệu âm thanh gốc và hoàn toàn không được nén.

Theo chuẩn PCM, mỗi giây âm thanh được lấy mẫu với tần số lấy mẫu 44.1KHz, và mỗi mẫu được diễn tả bởi 16 bit tài liệu. Có tức là trong một phút nhạc/âm thanh ta có: 44100 đợt lấy mẫu X 2 kênh trái phải X 2 bytes (16 bit = 2 bytes) X 60 giây = 10.584.000 bytes = 10.1 Mb

Như ta đã biết, 1 CD thường có dung tích là 750Mb, hoặc lưu được 74 phút nhạc, vì thế nếu như khách hàng nhân số lượng 10Mb của mỗi phút nhạc cho 74 các bạn sẽ thấy rõ vì sao CD nó lại như vậy

Như vậy tóm lại, 1 giây của âm thanh gốc sẽ có được bitrate là 1411kbps

MP3, WMA, … – Lossy compression (nén mất tài liệu

Với sự phát triển của PC và internet, nhu cầu san sớt thông tin và nhạc ngày càng đc yên cầu cao. Nhưng người ta không thể nào gửi cả album nhạc đến 700Mb qua internet với tốc độ èo uột 56kps thời đấy được. Do đó các nhóm nghiên cứu, các tổ chức, và nhiều đơn vị khác nhau đã cố gắng nỗ lực tìm ra những định dạng âm thanh mới sử dụng những thuật toán riêng để nhằm giảm bớit dung tích tài liệu cần đề diễn tả âm thanh gốc cùng lúc đó cố gắng nỗ lực giữ cho âm thanh gần với âm thanh gốc nhất.

Có rất nhiều định dạng khác nhau đã ra đời như mp3, wma, aac, ogg, mpc, atrac, … Chúng hoạt động gần giống nhau nhưng mỗi định dạng có một thuật toán khác nhau để xác định xem giữ lại mẫu âm thanh nào, bỏ mẫu âm thanh nào, hoặc kiểm soát và điều chỉnh mẫu âm thanh thế nào. Thế thì vì sao lại sở hữu thể bỏ, hoặc giữ? Vì theo lí thuyết tai con người sẽ rất khó nhận ra sự hiện hữu của một tần số âm thanh nhất định nào đó (có thể là quá 20Khz). Việc bỏ đi một trong những phần tài liệu âm thanh này giúp cho những định dạng âm thanh mất dự liệu như Mp3 có thể giảm tài liệu cấp thiết để diễn tả 1 lần lấy mẫu (sẽ thấp hơn rất nhiều so với 16bit cho 44100 lần 1 giây như của âm thanh gốc).

Ngoài ra các định dạng âm thanh này còn tạo ra những âm thanh giả nhằm đắp vào những phần nó đã loại bỏ, điều này là thực sự không thể chấp thuận đồng ý đc, nó tạo ra những âm thanh ta hay gọi là “éo éo” hoặc vang hoặc méo hẳn so với âm chuẩn, đ/v những file đc nén với bitrate càng thấp thì hiện tượng kỳ lạ này xẩy ra càng nhiều (ví dụ tiêu biểu nhất: bạn hãy nghe thử 1 đoạn người theo dõi vỗ tay của một file mp3 và 1 track trong CD gốc hoặc 1 file nén không mất tài liệu (lossless) sẽ ngay ngay tức khắc nhận ra. Vì sao tiếng vỗ tay lại gây ra nhiều vấn đề như vậy ? Bởi vì tiếng vỗ tay là 1 trong những âm thanh hỗn hợp tình cờ, nếu trong âm thanh chuẩn gốc nó sẽ đc diễn ta đầy đủ, thế tuy nhiên với âm thanh nén, định dạng nén buộc phải “ép” bitrate của mình vào khoảng tầm được cho phép do đó nó tạo ra những âm thanh vỗ tay túc tắc nhau rất ít sự khác biệt hoặc bị hiệu ứng vang). Tất cả chúng ta thường thấy rằng MP3 hay được nén với bitrate là 128, hoặc 192, hoặc 320 kilobit 1 giây (kbps) . Chúng ta có thể nhận thấy rằng nó chỉ bằng 1/10 so với biterate của WAV (1411kbps) đó là lí do vì sao 1 phút nhạc MP3 128kbps chỉ tốn khoảng tầm 1Mb. Đúng là trong một số trường thống nhất định, hoặc 1 dạng âm thanh/nhạc nào đó, sẽ rất khó phân biệt sự khác nhau giữa âm thanh gốc và MP3. Sát đó các thuật toán nén của khá nhiều định nhạc mất tài liệu đã được cải thiện rất nhiều. Thế nhưng không có gì hoàn hảo, và vững chắc cái gì đã mất đi thì sẽ làm cho nó hỏng đi. Nhất là âm thanh. So với những album nhạc như vocal, nhạc cụ, hay nhất là cổ điển thì đây là 1 trong những tai họa, vì với những album nhạc này, thường những nhạc cụ được sử dụng hoặc giọng hát có tần số âm thanh rất cao hay rất trầm do đó rất nhiều dự liệu đã bị nockout bỏ hoặc kiểm soát và điều chỉnh khác đi so với thực tế. MP3, âm thanh nén, nhiều người nhận định rằng chỉ thích phù hợp với nhạc pop hoặc các dạng nhạc thông thường khác.

Lossless Compression (Nén không mất tài liệu)

Trong công việc hàng ngày với máy tính, hẳn nhiều lần bạn đã nén 1 file tài liệu gửi cho đồng nghiệp. Có thể bạn đã sử dụng Zip hoặc Rar làm định dạng nén. File tài liệu được bạn nén sau thời điểm qua Zip hoặc Rar sẽ trở thành nhỏ hơn rất nhiều nhưng khi người nhận nhận được file, họ sẽ giải nén và giành được file tài liệu gốc mà bạn đã tạo. Vậy Zip và Rar đã làm gì ? Nói đơn giản, đó là những thuật toán nhằm tìm ra những quy luật lặp của tài liệu từ đó tìm một cách hiển thị khác tối ưu hơn, tốn ít tài liệu hơn. (ví dụ ta có chuỗi: aaaaa bbbbbbb aaa 11111 , bạn thấy rằng cách diễn giải tốt hơn nhiều mà tốn ít chữ hơn là ax5 bx7 ax3 1×5). Đấy là 1 trong những ví dụ rất đơn giản để bạn hiểu, còn thì nó phức tạp hơn rất nhiều . Như vậy khi người nhận nhận file và giải nén, Zip và Rar đóng nhiệm vụ sử dụng những chuỗi tài liệu nén đấy tập hợp và tạo lại file gốc ban sơ.

Đó cũng là mục tiêu của định dạng âm thanh nén không mất tài liệu (lossess). Với cấu trúc trên của zip hoặc rar thì chúng ta có thể thấy rõ rằng khi đối chiếu với lossless audio, nó lấy nguồn vào là âm thanh gốc của CD, cố gắng nỗ lực tìm ra những quy luật âm thanh và nén nó lại. Việc nén lại này là không đảm bảo vì tài liệu âm thanh rất đa dạng và sử dụng nhiều tài liệu. Ngày nay mức độ nén rất chất lượng có thể của kĩ thuật nén không mất tài liệu là bằng khoảng tầm 1/3 dung tích gốc của âm thanh gốc. Do đó mỗi album lossless sẽ có được dung tích khoảng tầm 200 đến 300 Mb. Khi giải nén hoặc lúc nghe tới lossless điều vững chắc ta đạt được đó đây chính là tín hiệu gốc của âm thanh CD (44.1Khz, 16bit, 1411Kbps) . Điều này là cứu nhân cho mọi người yêu âm nhạc luôn yên cầu âm thanh trung thực nhưng không có xét tuyển có CD gốc hoặc muốn sử dụng máy tính làm nơi lưu trữ albums.

Hoạt động của việc ghi CD nhạc:

Như đã đề cập, định dạng âm thanh của CD là PCM 1411kbps. Và nguồn vào của nó cũng phải ở định dạng PCM 1411kbps. Do đó khi ta ghi 1 CD nhạc việc trước nhất của một trình ghi đĩa là nó phải convert (chuyển) bất kì định dạng cho vào ra WAV, bất kể nó là mp3 hay ape, lossy hay lossless. Đó là lí do vì sao mà ngoài mp3 thường được tương trợ sẵn, khi đối chiếu với các định dạng âm thanh khác ta phải cần plugin cho trình ghi đĩa mới có thể ghi được. Như vậy bất kì định dạng nhập vào là gì trước lúc ghi ra đĩa ta sẽ có một tài liệu âm thanh định dạng WAV, mà WAV thì luôn là PCM 1411kbps. Cho nên dù tài liệu vào “xấu” hay “đẹp” nó cũng sẽ tiến hành cho mặc 1 cái áo được dệt bởi 1411 kí sợi để ghi ra CD. Vì sao cùng 1 album, ta có 2 định dạng mp3 và ape , mp3 chỉ 50Mb, ape đến 200Mb mà ghi ra đĩa vẫn đầy, vẫn cùng ngần đấy phút nhạc ? đã có lời giải đáp vì sao.

Hoạt động của việc nén CD nhạc:

Như vậy sau thời điểm ghi ra CD 1 rổ tài liệu “xấu” đấy, nếu như khách hàng sử dụng nó để đọc trong máy sẽ vẫn thấy rằng bitrate của nó là 1411kbps . Tiếp theo nếu như khách hàng sữ dụng software để rip CD này và xác định bitrate là 320 hay lơn hơn đi nữa thì nó sẽ vẫn thực hiện công việc nén 1411kbps tài liệu “xấu” đấy trở thành 320. Nhưng cũng phải nói thêm rằng dù nén 320kbps nhưng đữ liệu “xấu” của các bạn sẽ càng trở nến xấu hơn vì chính trong lúc nén ở 320kbps, nó sẽ tiếp tục bị mất tiếp tài liệu . Đã xấu lại càng xấu .

Vậy theo lí thuyết bài trước, để giữ nguyên độ “xấu” gốc bạn chỉ có cách nén ở định dạng lossless không mất tài liệu … “xấu”.

Phần lớn, hay ko muốn nói là tất cả những đĩa nhạc copy (cả nhạc Việt lẫn nhạc ngoại) mà ta thấy ngoài tiệm đều là ghi ra đĩa với nguồn là MP3 trong máy tính. Bạn có rip với bất kì định dạng nào thì chất lượng sản phẩm vẫn là hàng truất phế phẩm, không nói gì chất lượng sản phẩm CD, mà chất lượng sản phẩm âm thanh không thể nào bằng đĩa gốc.

Vậy với lossless nó sẽ thế nào ? Cũng vẫn thế, nhưng khi APE được trình ghi đĩa giải nén ra WAV ta sẽ có được lại tài liệu đẹp ban sơ ở 1411kbps, tạo ra 1 đĩa CD chuẩn ở 1411kbps, rồi ta lại rip lossless, rồi lại ghi ra. Cho dù bao nhiêu lần đi nữa thì tài liệu vẫn (có thể) được giữ nguyên. tôi nói có thể là vì nó còn phụ thuộc nhiều vào chất lượng sản phẩm CD, chất lượng sản phẩm đầu đọc, 2 thứ đấy có đảm bảo được cho việc an toàn, hoàn chỉnh của tài liệu khi ghi và đọc hay là không. Vì vậy mà người ta luôn nói là với CD thì phải là TDK, ổ đĩa thì phải là Plextor, hơn nữa khi ghi hay đọc thì chỉ ở tốc độ 1x , vâng 1x , như vậy mới giảm thiểu tối phần lớn lỗi đọc ghi.

Công nghệ ghi đĩa và loại đĩa được sử dụng là rất quan trọng do đó đĩa hiệu mới đắt như vậy. Ngoài ra còn tồn tại đủ loại đĩa giành riêng cho dân audiophile như đĩa vàng, đĩa thủy tinh. Công nghệ thì có XRCD, DCC, Chesky, MFSL ,… rất rất nhiều. Sự khác nhau của họ là phương pháp xử lý tín hiệu gốc đạt đến độ hoàn chỉnh, sau đó sử dụng công nghệ máy móc đc fát triển riêng để ghi lên đĩa đặc hiệu, máy ghi đĩa luôn đảm nói rằng không có lỗi xẩy ra, tài liệu không bi nhiễu, và khi ghi lên mặt bằng đĩa đạt đc hiệu quả tối ưu.

You May Also Like

About the Author: v1000