近日,中国电信人工智能研究院(TeleAI)发布了一项名为生成式视频压缩(GVC)的新技术,该技术能够将视频数据压缩至原始大小的0.02%,同时保持画面的高清、连贯和细节。这项技术的核心在于不再直接传输画面像素,而是传输“如何画出画面”的指令,通过神经编码器和生成式视频解码器传输压缩Token,包含视频的语义信息和运动信息。GVC技术在MCL-JCV数据集上的测试结果显示,在极低码率下,其画质和分割准确度均优于传统视频编码标准HEVC。
GVC技术的实现,意味着在带宽受限的极端环境下,如远洋船舶和应急现场,也能实现高清视频的流畅传输。例如,在卫星信号微弱的情况下,通过GVC技术,远洋货轮上的船员能够直接观看高清的世界杯直播。此外,GVC技术在DAVIS2017视频分割任务上的表现也证明了其在AI分析中的准确性,即使在极限压缩下,关键物体的位置和轮廓也能被精准重建。
GVC技术的发展基于“智传网(AIFlow)”理论体系,通过网络分层架构实现智能的传递和涌现。这项技术不仅为远洋通信、应急救援等场景提供了解决方案,也预示着视频通信从像素搬运向语义生成的新阶段转变,为未来互联网中数据的传输和处理提供了新的可能性。


