编者寄语

随着虚拟现实、增强现实等沉浸式技术的快速发展,全景视频作为提供深度沉浸感和自由交互体验的重要媒介,正逐渐成为多媒体领域的研究热点。全景视频通过360度环绕视角使用户能够自主选择观看内容,极大增强了场景的真实感和参与感。然而,全景视频的超高分辨率、超大数据量、准实时交互等特点,给传输、压缩、渲染与评估等带来了显著挑战。如何在有限带宽下实现低延迟、高质量的视口自适应传输,如何科学评估全景视频的感知质量,如何在不依赖高精度三维重建的情况下提升漫游体验,成为当前亟待解决的关键问题。

本期聚焦“面向沉浸式交互的全景视频技术”,从智能传输、感知与质量评价、动态物体处理与视点合成、以及视口预测等多个维度,系统梳理该领域的前沿进展与典型实践。通过对相关优质资源的梳理与推荐,旨在为研究者、工程师以及对沉浸式技术感兴趣的广大读者提供一个全面了解全景视频技术现状与趋势的窗口,推动该技术在娱乐、教育、工业等更广泛场景中的创新应用。


编委主任:苏金树 CCF会士 军事科学院教授

本期主编:汪   淼  CCF虚拟现实与可视化技术专委秘书长 北京航空航天大学计算机学院教授

交互视频智能传输技术

在沉浸式多媒体应用快速发展的背景下,360度全景视频因其沉浸感和交互性受到广泛关注。然而,其庞大的数据量和复杂的用户交互行为对网络传输提出了新的挑战。已有研究通常依赖视口预测与图块化传输来提升带宽利用率,但存在预测精度波动和终端解码复杂度增加的问题。为此,报告提出了一种适应预测性能波动的图块切分动态调整机制,并将解码复杂度模型融入码率自适应决策,形成优化问题表述与高效求解方法。该方案在保证用户体验的同时有效降低了传输开销,为全景视频的高效传输与播放提供了新的思路。

格式:
视频
通往沉浸式媒体体验之路:全景视频感知、质量评价与压缩

沉浸式媒体业务已经成为未来多媒体业务的主要发展方向。近年来,全景视频逐步普及,成为沉浸式通信主要载体,可提供身临其境体验。全景视频覆盖广、分辨率高,产生数据量爆炸式增长,造成通信带宽供求矛盾日益尖锐;另一方面,人类观看全景视频的视场仅占全景区域1/10,存在大量感知冗余。为突破沉浸式通信带宽受限瓶颈,可从全景视频感知模型出发,开展全景视频感知、质量评价与压缩的研究工作。本报告主要内容包括:(1)基于深度模仿学习的全景视频视觉注意模型;(2)面向用户体验的全景视频感知失真度量方法;(3)带宽受限下全景视频压缩的质量优化方法。

格式:
视频
三维全景漫游中的动态物体消除与视图修补方法
  • ,

高真实感的三维全景漫游通常依赖精准的三维建模,但在复杂工业场景中,非规整区域和设施的高质量建模仍面临挑战。为此,报告提出了一套基于虚拟视点合成的三维全景漫游系统,以全景视频为输入,结合多视点与深度信息生成虚拟视点图像,从而增强视点切换时的临场感。针对虚拟视点合成中出现的移动人体、空洞等问题,提出了基于实例分割和多视点信息的修补方法,有效提升了目标视图质量。该方法无需依赖高精度三维重建即可生成高质量的虚拟视点图像,为电网系统等复杂工业场景下的全景漫游体验提供了新的解决方案。

格式:
文章
360度视频与视口预测方法综述

360度视频作为沉浸式虚拟现实体验的重要媒介,近年来受到广泛关注。报告聚焦视口预测技术并介绍了360度视频的基本概念、流式框架、球面到平面投影方法及视频编解码标准,并分析了其高网络资源消耗的原因,阐明了视口预测在流式传输中的关键作用。系统梳理了现有视口预测方法,介绍了相关注意力数据集及360度显著性检测技术,并比较了各方法的特点与局限。

格式:
文章
智能视频创作工具

视频是分享我们的生活、想法、故事和情感的美好方式。生成模型的最新进展使我们能够生成逼真的图像像素或短视频片段。然而,现有的方法还远远不能创造出需要更多人类创造力的复杂作品,例如具有复杂活动的长片或细节丰富的图画小说。在本次演讲中,我将介绍我最近使用生成模型和三维信息来设计可靠的视频创作系统的探索。

格式:
视频

本期编委成员