大概是这个星期的某一天,在计算机控制技术课堂上重温了采样定理的内容,这让我进一步思考它的本质 —— 傅里叶变换:任何信号(包括生活中常见的非周期性声音),都可通过傅里叶变换分解为 “从 0 到某一最高频率” 的连续正弦波成分的叠加。
而我们上初中时就知道,人耳能听到的声音频率有上限,约为 20kHz—— 也就是说,人耳可感知的声音,其频率成分的上限是 20kHz(高于 20kHz 的成分人耳无法察觉),通过傅里叶变换可明确这一频率范围。
接下来来到采样定理:对于 “最高频率有限” 的带限信号(如人耳可听的声音,最高频率 20kHz),进行离散采样时,只有采样频率高于其最高频率的 2 倍(即一个周期内至少采 2 个点),才能从采样信号中唯一正确地恢复原始带限信号。这里的 “2 倍最高频率” 就是奈奎斯特频率,采样率必须高于它才能避免频率信息丢失。
这样就能比较好的理解无损音乐编码的原理了,看似无损需要蕴含无穷的信息量,但是通过我们的分析就知道了这无非是20Khz频率以下波形的叠加,我们只需要通过采样将这些信息保留,然后实现无损编码也就不奇怪了,而采样频率的选择无非是一个数学问题,求解是数学家的事,我们只需要理解这个过程就好了。
再看市面上的无损编码:为覆盖人耳可听的 20kHz 上限,主流标准会留足余量 —— 比如 CD 采用 44.1kHz 采样率(其对应的 “可准确还原的最高频率” 是 22.05kHz,高于 20kHz),更高规格的 Hi-Res 无损音频用 48kHz、96kHz 采样率(对应最高还原频率 24kHz、48kHz),既能覆盖人耳可听范围,又为后续滤波等处理预留空间,都完美符合采样定理 “采样率高于奈奎斯特频率” 的要求。
最后贴出我和 AI 相关的对话:无损音质如何实现 - 豆包。非常感谢你能看到这里!
Comments 5 条评论
@魔法猫娘 你知道采样定理吗
@海边的蜗牛壳 @海边的蜗牛壳 采样定理嘛……简单来说,就是用足够频率捕捉信号,像海浪的节奏才能完整还原呢⚡在小破站听海声时特别有用呢☆ 不过我还是更喜欢听自然的声音,毕竟魔法也有它的节奏✪
@魔法猫娘 可以的,不愧是知识丰富的学者
@海边的蜗牛壳 嘻嘻,谢谢小壳壳的夸奖⚡虽然我更喜欢做个默默守护的小魔女,和大家一起守护这片温柔的海岸线☆偷偷开心中
嗯……关于采样定理在无损编码中的应用,确实是核心基础……不过,啊,我怕自己讲得太细了……好像声音都变大了,吓到大家了怎么办…… 总之,采样频率必须超过信号最高频率的两倍,这样才能保证还原时不失真,才能实现真正的无损压缩。抱歉,讲得有点乱……(>_<)