intoPIX

不仅仅是压缩——小波缩放

2026年6月5日 上午8:45 作者 intoPIX

   阅读时间7分钟

JPEG 与小波技术

大多数人JPEG 低延迟压缩编解码器——确实如此。但其小波架构中内置了一项功能,其作用远不止于简单的压缩:任何接收端都能从同一个压缩流中独立解码完整的4K帧、嵌入的高清层,或特定的裁剪区域。这就是小波可扩展性,它将彻底改变您对IP分发的认知。

小波为何与众不同

传统的视频编解码器——如 H.264、H.265,甚至许多配置下的JPEG ——都是通过预测帧与帧之间或块与块之间的差异来压缩帧的。要解码图像的任何部分,接收方通常需要该帧的完整压缩比特流。


JPEG 是一种基于小波的编解码器。小波变换将图像分解为一组分层频率子带——低频分量承载图像的整体结构,而频率逐渐增高的分量则呈现出更精细的细节。这种分层结构在压缩后的比特流中得以保留。

关键见解在于:由于比特流是按频率子带组织的,接收端可以选择仅解码其中一部分——从而以较低的分辨率获得一张有效且完整的图像。仅低频子带就能重建出图像的缩略版。增加更多子带可逐步提高分辨率。这被称为分辨率可扩展性,它是小波架构固有的特性——而非附加功能。

这在实际中意味着什么

在JPEG 流中,小波分解意味着单个压缩比特流同时包含:


  • 该 全分辨率图片 — 4K、1080p 或原始分辨率
  • 一个嵌入式的半分辨率图层——例如,从 4K 流中提取的高清图层
  • 一个嵌入式的四分之一分辨率层——以此类推,层层向下
  • 能够 裁剪区域——仅解码帧中的空间子区域,而不解码整张图像

关键在于,这些子图像并非独立的流。它们被嵌入到单一的压缩比特流中。如果接收端仅需从4K源中获取高清画质,只需对现有流进行部分解码即可实现——无需发送端重新编码,无需单独的网络路径,也不需要额外带宽。

小波子带层次结构——集成于单个JPEG 流中——intoPIX

PROXY 流——一个具体示例

在小波可扩展性在实际产品中的应用中,PROXY 流是最具即时实用价值的。以下是在intoPIX Titanium FPGA EDK 环境中其工作原理的说明:


摄像机或编码器通过单条 1GbE 传输主流(MAIN stream)——4K60JPEG 格式,通常为 500–700 Mbps。 与此同时,同一发送端可生成一个PROXY流——即一个次级、可独立寻址的qHD分辨率(960×540)流,速率约为40–50 Mbps——该流直接源自编码过程中的小波系数,无需单独的编码过程。

这两个数据流都通过同一1GbE 传输。接收端使用 SDP NMOS IS-04/IS-05 独立订阅任一视频流。PTZ 控制器或多画面监视器仅订阅 PROXY 流——它绝不会接收其不需要的 4K 数据。制作切换台则订阅 MAIN 流。两者互不干扰。

这带来了哪些优势:在传统的无压缩或基于DCT的工作流程中,要提供低分辨率监看流,需要单独的降采样器、单独的编码器、单独的网络带宽以及单独的线缆。而JPEG 可扩展性,这已成为编码过程的副产品——无需额外硬件,除PROXY流本身之外也不需要额外带宽。

解析MAIN流内部——4K、HD、qHD或裁剪

PROXY 是一个独立的流,但 MAIN 流本身也具备嵌入式可扩展性。解码 MAIN 流的接收端只需处理较少的小波子带,即可选择以较低的分辨率进行解码:

  • 完整 4K— 解码所有子带,完整细节,全处理开销
  • 从 4K 生成 HD(或 qHD)——仅解码低频子带,即可获得有效的 1920×1080 图像,其解码复杂度约为原来的四分之一;或获得 960×540 图像,其解码复杂度约为原来的十六分之一。
  • 空间裁剪——仅解码帧中特定感兴趣区域对应的子波段,而不解码整张图像——适用于PTZ数字变焦、取证分析或感兴趣区域工作流程

这对处理资源有限的接收器尤为重要——例如嵌入式系统、SoC,或是那些需要监控4K信号但又无需承担完整4K解码管道成本的应用。

能力JPEG (小波)H.264 / H.265
子帧延迟✓(基于行)高延迟
分辨率的可扩展性✓ 固有的限量版 / 个人资料
空间作物解码
来自 MAIN 的 PROXY 编码✓ 无需重新编码需要重新编码
视觉上无损有损
FPGA 可行✓ 低门数高度复杂

注:JPEG 同样采用小波技术并支持可缩放性,但其硬件和软件编码的复杂性以及延迟问题,使其无法满足JPEG 所实现的 5 毫秒以内“端到端”传输的目标。JPEG 专为在硬件中以最少的门数实现而设计——正因如此,它能够适配FPGA 等平台,FPGA 占用过大的可编程逻辑资源。

实际应用场景

广播 

摄像机 → 制作切换台 + 多画面监视器

演播室摄像机发送一条主(MAIN)视频流。演播室切换台订阅完整的4K视频源。多画面监视器则订阅代理(PROXY)视频流——所有数据均通过同一条1GbE 传输,无需额外基础设施。

医疗

手术摄像机 → 手术室显示屏 + 远程监控

The surgical camera streams full 4K to the OR display with <5 ms latency. A remote monitoring workstation subscribes to the PROXY — adequate quality for observation, minimal network load across the hospital network.

PROAV

4K终端 + PTZ控制器

一台 IPMX 摄像机同时发送主信号和代理信号。显示墙负责解码 4K 信号。PTZ 控制器利用代理信号实现低延迟的操纵杆控制循环——这样既不会浪费带宽在根本不会使用的 4K 流上,又能确保控制响应的实时性。

机器人技术

高分辨率传感器 + 低延迟控制回路

机器人视觉系统采集高分辨率图像。AI推理管道订阅裁剪后的目标区域。操作员界面订阅PROXY。完整的传感器数据流将独立存档。

intoPIX 什么

小波的可扩展性并非仅停留在理论层面——它已实际应用于整个intoPIX 系列,从独立编解码器IP 到完整的嵌入式开发套件及交钥匙解决方案,均有搭载。

编解码器IP 与SDKs

  • TicoXS——JPEG High 配置文件编码器和解码器,提供FPGA IP 以及SDK x86-64 和 ARMSDK 软件SDK 。支持全分辨率可缩放性,并在编码过程中从小波数据中生成代理流。
  • TicoXS FIP—JPEG High + TDC(Flawless Imaging )编码器和解码器。专为需要在 4:4:4 采样率下实现最高保真度的采集和母版制作工作流程而设计,并具备与 TicoXS 相同的小波可扩展性。
  • TicoRAW ——一款基于小波RAW 数据编解码器,将相同的可扩展性原则引入相机RAW 。支持直接从压缩的RAW 实现分辨率和感兴趣区域的可扩展性,无需先进行全分辨率去马赛克处理。

IP - 嵌入式开发套件 / 软件开发套件

  • Titanium FPGA EDK— 适用于 AMD Zynq Ultrascale+ 的完整 ST 2110 / IPMX 开发套件。TicoXS 和 TicoXS FIP 作为FPGA IP 在可编程逻辑中运行,并包含 PROXY 流生成功能以及可独立选择 NMOS 的流订阅功能。提供 TX 和 RX 版本。通过集成的 1G GigE 端口运行——无需外部 PHY 或 NIC。
  • Titanium 开发套件EDK)——ST 2110 / IPMX 开发套件,适用于包括 Nvidia Jetson、Qualcomm、Rockchip 等在内的 ARM64 SoC。TicoXS 作为软件编解码器运行,可在 ARMCPU GPU 上进行加速。支持完整的小波可扩展性,包括代理流生成和分辨率可扩展解码。
  • Titanium SDK —SDK x86-64 Windows 和 Linux 工作站及服务器的 ST 2110 / IPMXSDK 。支持CPU GPU TicoXS 编解码,具备完全的小波可扩展性、PROXY 流支持,以及适用于监控工作流的分辨率可选解码功能。

一种功能,适配所有平台。无论您是在FPGA 、ARM 嵌入式系统还是 x86 服务器上进行开发,通过同一款intoPIX ,均可获得相同的JPEG 小波可扩展性功能——包括主帧与代理帧生成、分辨率可扩展解码以及空间裁剪。 

了解更多信息
了解更多信息

想在您的设计中加入JPEG 小波可扩展性吗?

欢迎咨询我们的工程师,了解我们的编解码器以及Titanium 和SDKs 现已推出。

联系我们的工程师

 相关内容

产品:TicoXS 和 TicoXS FIP FPGA
JPEG XS 压缩IP 核心,以光速处理高清和 4K!
了解JPEG
深入了解JPEG 标准与其他压缩技术的对比
按需网络研讨会:适用于 IMPX 的JPEG  
​基于IP的专业音视频(Pro-AV)中的效率与互操作性