——聊聊「信源编码」:给信息挤水的艺术
————————————————————————————
你发了一条 60 秒的微信语音。原始的音频数据大约是 480 KB。但你的手机在发送之前,对它做了一件事——压缩。最终发出去的,只有大约 30 KB。
少了 94% 的数据,但朋友听到的仍然是你的声音,每一个字都清清楚楚,连语气都没变。
那 450 KB 去哪了?答案不是"扔掉了"——是"本来就不需要"。找到信息里那些"不需要"的部分,把它剔除出去——这就是信源编码(Source Coding)。
一、信源编码:信息上路之前,先过一遍"安检"
在通信系统的发送端,原始信号(语音、图像、视频)在进入信道之前,要过的第一道关就是信源编码器。
它的任务只有一个:用尽可能少的比特,尽可能好地表示原始信息。
为什么非得"省"比特?回忆一下之前讲过的概念——信道带宽是有限的,信道容量有香农上限,频谱是真金白银拍卖来的。每一个多余的比特,都是在浪费昂贵的传输资源。信源编码就是在"装车"(调制)之前,先把货物里的水分挤干净。
打个比方:你要给远方的朋友寄一箱衣物。你不会把衣服蓬蓬松松地直接塞进箱子——你会叠好、卷紧、用真空压缩袋抽掉空气。体积小了好几倍,但衣服一件都没少——这就是无损压缩。如果你还把"反正也不会穿"的旧T恤直接扔掉——那就是有损压缩。信源编码的两大流派,就对应着这两种"打包"哲学。
二、无损压缩:一个比特都不许丢
无损压缩的核心思想极其朴素:给出现频率高的符号分配短码,给出现频率低的分配长码。
想象你在玩一副只有 A、B、C、D 四个字母的扑克牌。经过统计你发现:A 出现了 50 次,B 出现 30 次,C 出现 15 次,D 只有 5 次。
如果给每个字母都用 2 比特编码——A=00, B=01, C=10, D=11——总共需要 100x2 = 200 比特。
但如果你聪明一点:给最常见的 A 分配最短的码"0"(1 比特),B 用"10"(2 比特),C 用"110"(3 比特),D 用"111"(3 比特)。算一下:50x1 + 30x2 + 15x3 + 5x3 = 170 比特。凭空省了 15%。
什么都没丢,只是换了种"写法"——这就是霍夫曼编码,1952 年由 MIT 研究生大卫·霍夫曼在一道期末作业题里发明。ZIP 压缩、PNG 图片用的都是这个思路。
三、有损压缩:把耳朵和眼睛"骗过去"
无损压缩虽好,但压缩比有限——你不可能把一柜子衣服压进一个火柴盒。有些场景下,我们需要更激进的压缩——哪怕丢掉一些"不那么重要"的信息。
这就回到了开头那条微信语音。480 KB 到 30 KB 的压缩率(超过 90%),单靠无损压缩根本做不到。真正的"杀手"是有损压缩——它利用了人耳和人眼的感知局限,主动丢弃那些你根本不会注意到的信息。
人耳的听觉范围大约在 20 Hz 到 20 kHz,但语音通话只需要 300 Hz 到 3400 Hz 就足够清晰——这个频率范围内的声音已经能让你听清对方说的一切。剩下的、17 kHz 以上的高频分量——直接砍掉,你根本听不出来。
MP3砍掉了人耳在强音附近听不到的"掩蔽频率"。JPEG 砍掉了人眼对亮度变化不敏感的"高频细节"。你的手机语音编解码器砍掉了人声之外的一切。
有损压缩的本质不是"丢掉信息"——是"丢掉你不需要的信息"。它把通信资源精确地分配给那些人类感官真正能感知的部分。
四、香农又来了:信源编码定理
信源编码有没有极限?有。香农又一次给出了答案。
香农信源编码定理说:任何一个信源(一段语音、一张图片、一个视频),都有一个叫"熵"(Entropy)的数学量——它表示这个信源里包含的"真正的信息"究竟有多少比特。
无论你用什么编码方案,你都不可能把信源压缩到熵以下。熵,是信源压缩的绝对下限——就像信道容量是传输速率的绝对上限一样。
一段纯白图片的熵接近于零(极好压缩——一张 PNG 截图只需要几百字节)。一段完全随机的噪声的熵等于它的原始比特数(完全无法压缩——因为没有任何规律可循)。信源编码的极限,由信息本身"有多可预测"决定。
五、信源编码,是信息旅行的第一站
在整个通信链路中,信源编码是信号的"第一道工序"。
信源编码(把信息压缩到最紧凑)→ 信道编码(加上保护性的冗余纠错)→ 调制(装车)→ 信道(上路)。
信源编码省下的每一个比特,都意味着后续的每一道工序——调制、功放、天线辐射——都可以用更少的资源完成同样的工作。
下一次,当你发现微信语音只用了几 KB 就传了一分钟的话,或者一张照片从 5 MB 变成了 500 KB 却看不出区别——你不妨在心里给"信源编码"记一功。它默默地站在整个通信链路的第一道关口,用数学和方法论,给你省下了这世界上最贵的两种东西——频谱和时间。
————————————————————————————————————————
曾益科技是专业从事测试测量仪器研发,为用户提供测试测量系统的国家高新技术企业。曾益科技采用先进的测试测量产品和技术,结合自身在数字信号处理和射频领域的专业优势,向客户提供高质量的设计、研发服务。曾益科技是NI的金牌系统联盟商。
如需了解如何加速无线通信项目,请致电
010-53388146 (北京)
021-50652292 (上海)
029-68868066 (西安)
或发送邮件至info@zengyi-tech.com联系曾益科技