时间:2013/08/19 来源:专业视听网
关键词:
【专业视听网报道】:与人的沟通, 一段视讯胜过千万个字, 这是说明视觉沟通的优越性。 由于科技的进步在网络带宽倍数增加, 数据压缩技术的成熟及储存媒体的便宜化。 让我们得以不用到学校教室当场聆听老师上课, 就可以透过因特网看录播视讯来学习新知识, 也不用坐飞机或开车到某处做面对面开会。 只要有视频会议系统,随时都可做会议沟通。科技已让我们大大提升做事的效率。
由于智能型手机的普及化让摄像机的技术及产业已成今日的显学人们都有很多的日常生活经验接触视讯,如每天接触的电视及手机像机。因此对于视讯画质评价几乎是不学而能的本能。
录播及视频会议应用其关键在于,优质的视讯是系统性能的关键。 而摄像机更是录播及视频会议系统的关键周边组件, 画质好坏是人们对系统的优劣最直接的评价。 选择适当摄像机得以发挥系统的效用并达到机器的期望效能。
在市售的摄像机里头常见标示,标清(SD), 及高清(HD)的规格, 这是选择摄像机画质的关键参数。
高清及标清信息比较表, ( 以50Hz 来计算 )
项目 | 标清(SD) | 高清(Full HD) |
画面点数 | 768x576 | 1920x1080 |
点数比率 | 100% | 468% |
画面长宽比 | 4:3 | 16:9 |
带宽需求 | 42MB/Sec | 198MB/sec |
图1 高清 图2 标清
目前日常中常听到高清, 标清的字眼。针对这两种规范略做说明:标清是1963年制订的电视信号(PAL), 经由数字电数标准制订成768x576 画素以4:3 方式呈现, 高清则是近期发展的趋势, 有更多的画素达1920x1080 并以16:9 宽银幕方式呈现, 更合适人眼的视界,并以约4.6 倍数的点数呈现细腻画质及鲜艳的色彩。 请看图1,2 感觉高清的超级画质。
高清需以较大带宽来传送或储存画像, 必须藉助 SDI或HDMI 接口,让摄像机的信号输出可以无损失地传送到高清显示器,或是经由H.264 压缩后以缩减带宽, 透过因特网传送到远程。
以下我们来探讨录播及视频会议系统对摄像机的要求。
录播系统的使用情境
图3. 录播系统的安装架设(一般教室空间约为 10mx8m)
录播系统是一个单向广播的系统, 安装在教室。 将老师教学内容及与学生互动视讯, 经由信号压缩录制,储存到网络硬盘及同时透过因特网传送以提供远程学习者观看。
摄像机需取景教室内的黑板教学信息及老师的脸部表情, 并同时取景同学上课情形及同学老师的互动。因此在架设上需有两个以上的摄影机。如图3.
老师的摄影机需看到黑板全景,且能主动跟踪移动, 黑板的文字需能看清楚。学生部分则摄像机必须有PTZ能力, 可以以寻航方式,看到全部学生, 或以两个摄像机来构筑学生的全景,有同学举手发问时需能迅速定位作特写。
录播系统的摄像机机运作:
一个摄像机针对老师及黑板, 且需跟随老师移动。 设想老师以0.2m/秒踱步行进, 则镜头视角移动的速度约为1.1 deg/sec。
另一个摄像机则针对学生做广角取像, 但当有学生发问则镜头需转向并适当Zoom In 。
录播系统针对照老师及学生的摄像机视讯做压缩录制,并储存到硬盘系统,同时透过因特网传送出去,给远距学习者观看。
视频会议系统使用情境
图5. 视频会议使用情境
图6. 视频会议安装架设图
视频会议的系统如图5, 6。视频会议系统在于提供分离两地的团体, 透过会议系统经由因特网或特定专线做语音、视讯及数据交换。双方必须注视LCD 银幕上的人脸表情做实时交谈。 这是一个被严格要求的及时互动系统。 表情会影响意见交换, 画质优劣也是会议成功与否的因素。一般的会议室安装一个摄像机, 时而看全景, 时而Zoom In 发言者。 发言者切换时,摄像机取景需迅速转换场景,以让会议进行顺畅。实时互动是这系统的关键规格要求。
摄像机讯号以HDMI or SDI传输到视频会议主机(codec), 经由视频压缩( H.264) 以减少带宽再透过因特网传到远程的视频会议主机, 经由解压缩把画面还原呈现在远程会议室的LCD TV, 供与会者观看。 两端的视频会议主机需执行同时压缩现场视讯及解压缩远程视讯。
视频会议主机需接收摄像机的原始视讯(无压缩), 不喜欢接收已压缩的数据。 因视频会议主机需要把视讯及声音一起整合压缩处理, 另外依实时网络带宽做压缩比率的调整, 以保持视讯顺畅。
视频会议系统的运作:
一个摄像机置放于LCD TV 上方,直视着全体与会者,且全体人员也会注视着LCD TV。
摄像机的操作会时而停留在全景, 时而转到发言者, 在发言者中轮流转动取景。
与会者需注视LCD TV 及摄像机,专心听取或观看对方传达的视讯画面及其他信息以示礼貌。
摄像机将画面以HDMI 或 SDI 连接到视频会议主机做压缩并传送至远程。
远程的视频会议主机 接收到压缩画面, 还原它并显示在LCD TV 上。
远程与会者看着LCD TV 的画面与开会者做互动。
由以上的使用情境及场景, 整理两个应用对摄像机规格要求的差异, 供读者当作选用时的考虑参数。
录播系统摄像机的规格及性能要求:
传输接口SDI : 由于一般距离大于15m。
像机噪声要求 :无须像视频会议严格要求。 只是影响档案数据变大, 并不会造成系统操作不顺
摄像机镜头视角 :视角要求不需70 度广角 , 照老师的部分因有足够距离空间。 看学生全景的部分可以用两台摄像机或用单台巡航。
像机个数: 2 ~3个。
像机的画面延迟, 不在乎长短, 因不是实时互动应用。只在乎影音同步。
像机云台性能要求 : 着重于慢速时的顺畅性。 针对老师的摄像机需做跟踪。
画面色彩传真及清晰度要求: 无须像视频会议严格要求。
镜头的几何畸变: 不需如视频会议的严格要求。
镜头变焦倍率: 5~10x 比视频会议大。因教室约10mx8m, 要达到 1000mmx600mm 的视野, 需10x才能达到。
视频会议摄像机的规格及性能要求:
传输接口HDMI: 由于摄像机与视频会议主机距离近.
像机噪声要求:要求严格, 因噪声会增加压缩后的带宽, 造成通讯质量不好。
摄像机镜头视角:视角要求70 度, 因只有一台像机,又需要可以看到所有与会人员
像机个数: 1个
像机的画面延迟 : 非常在乎长短, 因是实时互动应用。过长的延迟会造成对话困难
像机云台性能要求 : 着重于快速运动及定位精度。 因需要切换发言者的画面。
画面色彩传真及清晰度要求 :要求严格, 需要清晰及正确色彩才能有互动效果。
镜头的几何畸变: 严格要求不乐于看到大于 3% 以上的畸变。
镜头变焦倍率: ~ 5x 由于会议室空间小
摄像机的功能方块及关键组件
以下我们就需求规格与技术的相关性说明。摄像机的功能方块如下图7。 其关键组件包括 1. 镜头 2. 感光器(sensor) 3. 图像处理器(ISP) 4. 信号传输接口 5. 控制云台 6. 中央控制单元(CPU) 。 其工作原理叙述如下:
图7. 摄像机的功能方块
镜头负责收集光线并距焦于感光器上, 镜头聚焦则由中央控制单元控制镜头马达来达成。 图像处理器则负责把Bayer 图形的RGRG, GBGB 转成RGB 8:8:8 24 Bits 并送到传输接口转换成SDI或 HDMI信号与显示器,录播系统或会议系统主机链接。
图8. 图像处理器进行传感器产生的色彩转换
图像处理器是摄像机的核心器件, 从画面所萃取出来的特征值,以提供中央控制单元去控制镜头的对焦及光圈变动, 完成摄像机的自动对焦(AF), 自动亮度平衡(AE)及白平衡(AWB) 。
中央控制单元同时也接受外界(视频会议主机,录播主机) 通讯命令, 以控制云台转动及摄像机的运作模式。
以下我们将描述 摄影机的关键组件及其关键参数物理意义
镜头:决定80%取像质量。 以下是镜头几个重要参数。
MTF 决定清晰度: 1/3“ 1080P 传感器搭配的镜头MTF 需要达200 Line Pair/mm。 才是合适的搭配。 2.5um 的传感器应选用多少MTF 镜头, 计算如下:
Pixel Size = 2.5um ; 一个Line Pair = 2 Pixels(一黑一白)
1000um/(2.5umx2) = 200 Line pair/mm
焦距决定摄像机的视角 (与Sensor 搭配计算的数字) : 以SONY IMX136 当参考, 焦距与视角关系
变焦或定焦: 变焦与定焦在设计上及价格上有非常大的差异。 变焦主要提供我们对远距离物体做拉近放大做特写用途。
以10 m 距离, 10倍变焦, 约可以看到1.0mx0.6m 的视野, 但5倍变焦会看到2.0mx1.2m较大视野,也就是一人占画面比率变小。
几何畸变: 一般镜头几何失真大于 3%, 是可以明显察觉的。 畸变越小设计越复杂, 成本越高。
光圈 : 决定进光量。 在一般室内教室或办公室400流明 , 光圈值F1.6~F2.0可以提供合适的进光量。
镜头参数与设计关系:光圈大, 畸变小, 变焦倍率高, 焦距短, MTF 值高 都是让镜头复杂化成本高的参数。
影像传感器: 决定影像色彩质量及信噪比性能。
图9。 镜头尺寸, 传感器尺寸图示
光学尺寸: 传感器光学区块尺寸(D) 必须小于镜头光学尺寸(L)否则会有暗角出现。 目前在录播及视频会议主流尺寸是 1/2.7”~1/3.2”
Pixel 尺寸 : 尺寸(P)越大对光的敏感度好,暗部噪点小。 一般数字3.0um ~2.2um。 小于 2.0um 则低噪性能不佳。
Pixel 个数: 决定分辨率,目前主流数字 1920x1080或1280x720 这是属高清。
图像处理器(ISP:Image Signal Processor) 。
3A: 自动对焦(AF), 自动亮度平衡(AE)及白平衡(AWB)的通称。ISP 从画面信息萃取出特征信息, 供CPU 做控制镜头对焦, 画面亮度调节及修正光源对画面色温的影响。
色彩还原 : 将 Sensor Bayer 图像的RGRG, GBGB 转化成 RGB 8:8:8格式, 并依传感器的频谱做色彩转换以达色彩传真的效果。 ( 不同传感器的频谱响应大不同)
图 10. 传感器的频谱响应 ( 厂家之间差异大, 关键在于传感器的Color Filter )
噪声抑制 : 由于传感器本身就具有热噪声, 雪花噪声及坏点。 噪声在暗部则相对明显。需要靠电子方式以抑制噪声。 方法有 2D 及 3D 噪声, 一般而言3D 的效果较佳。
输出接口
USB3.0 : 直接与计算机链接的应用, USB 是最简洁的界面。
HDMI : 合适距离10m 以内的范围的信号传输。
SDI : 合适用于超过30m长距离的连接。 但系统上需要在远程增加一个SDI 接收器。
评价摄像机的重要参数与关键组件及技术的相关性
我们对摄像机的评价项目如下
清晰度 : 这跟镜头MTF 的选择, ISP 的性能及厂家调画质能力有关。
色彩 : 这跟传感器选用, ISP 的性能及厂家调色能力有关
对焦正确性及速度 : 视频会议常需切换场景, 因此需要能快速对焦, 以保持画面显示清楚。 这跟ISP 所能提供信息, 及各家算法能力有关。 目前最普遍的是使用对比信息极大化, 不断移动距焦点并同时统计对比信息, 并停留在极大值。 这是摄像机的关键技术。 困难点在于画面的内容千变万化, 在暗画面及较单调的画面是挑战。 这部分是厂家能力差异最大的项目。
讯噪比 : 这跟传感器的感亮度, 镜头的光圈大小有关系。 ISP 仅能做数码降噪功能。 让原本传感器噪声降低一些。 有分2D, 3D 降噪。 2D 会造成清晰度下降。 3D 可以维持清晰度但对于动态画面会产生不自然画面。 传感器pixel 大小是占 80% 信噪比的关键。
几何畸变 : 纯粹是镜头造成的。 镜头畸变端赖镜头设计的复杂度。 随变焦倍率或广视角会让畸变变大。 目前有些ISP 可以提供数码修正, 但会有视角缩小及画质降低的副作用。
云台移动画面顺畅性 : 录播系统跟踪老师的摄像机会以每秒1 度的角度跟踪, 这么慢的速度下, 云台机构及传动设计及马达驱动需避免起共振及马达的走走停停。
云台定位精准度: 视频会议在会议前就会先设定发言人位置。 在会议中发言人的切换, 摄像机云台需迅速移动且精确地定位。
评价摄像机需注意外在显示器的影响因素
摄像机所取得的画面, 最后是透过LCD TV 呈现出来做评价。但每个厂家的LCD TV 的数字调色,信号处理, 面板色彩及LED 背光设计不同, 这些参数都对画质的表现有影响。
LCD TV的简化方块图如下。
图11 LCD TV 简化方块图
几个重要差异在于LCD TV 内部的设计及材料。
显示颜色 :
贡献的因素有 Color Filter 及背光的色温。
Scaler IC 的内部的色彩调整及亮度调整设定。
输出Gamma 的曲线设定。
TV 菜单有调适的项目, 尽可能中性化调整参数。
2. 画质清晰度
若面板分辨率与摄像机的输出分辨率不一致时,Scaler IC 会执行缩小或放大的动作。
缩小或放大是一个柔化的处理, 会导致画面锐利度下降。
菜单中的锐利化选项, 过重的锐利化导致画面轮廓不自然。
TV 菜单有调适的项目, 尽可能中性化调整参数。
3. 画面反应延迟 :
每个LCD Scaler 将画面存入内存内, 再读出来。 因此会增加一个Frame Delay。
评价时将显示模式设在游戏模式, 可以免除这增加的延迟。
技术趋势
顺着手机像机的普及化, 衍生了巨额的生意机会, 因此厂商投入大量资源, 不断在创新以提升性能及成本大众化。 录播及视频会议系统也跟着产业前进。 以下是一些观察未来改善方向。
性能提升 :
以BSI 的技术制作传感器。以提升光的灵敏度。 改变传感器结构排列, 将光感二极管摆到color filter 直接下方, 减少因光透过多层硅晶的损失。 可以增加约50% 的效果。
图12. BSI (新技术) 与FSI ( 传统技术)内部结构的比较
WDR 的多次曝光:以提升摄影机的动态范围, 抑制亮部提升暗部。 效果如下图13.1, 13.2。
图13.1 无 WDR 的画面 图13.1 有 WDR 的画面
ISP 以更好的技术做3D消除噪声:画质改善又不会造成移动的不自然画面
图 14.1噪点消除对画质的改善(前) 图 14.2 噪点消除对画质的改善(后)
4K2K 的超高分辨率, 以同时提供更多的信息达高清的4 倍量的细腻度。
简化系统整合及成本下降
ISP 做几何畸变修正及均匀度补偿:以降低光学镜头的设计复杂度以降低成本。
图15.1 数码修正几何畸变 (前) 图 15.2 数码修正几何畸变(后)
USB3.0 或Ethernet 界面: 摄像机数据可以透过USB3.0 或 Ethernet直接进入计算机内存, 供计算机运算, 免除影像截取卡的安装及成本。 同时输出压缩过的画面数据, 以简化后台的系统不需具有压缩的能力。