Friday, February 21, 2014

下一世代影音壓縮標準發展新趨勢

在網路發達的今天,影音多媒體相關產業受到各界重視,尤其是像手機及數位相機等的手持式裝置加入之影音功能。去年全球彩色行動電話佔 61% ,其中內建相機模組約佔 51.5% 。預估今年彩色行動電話將佔 73.1% ,其中內建相機模組將佔 58.7% 。這個趨勢說明了影音多媒體應用已成為行動電話服務之主流。為了促進消費者能夠使用更多高品質之影音應用服務,無論是行動電話大廠或是電信業者都希望隨著第三代行動電話的來臨,能夠進一步提供消費者高品質的影音服務。因此如何能夠將數位影音訊號有效的壓縮並傳送,是設計影音多媒體相關產品所需重視的問題。 但是影音資料量非常龐大,例如以大約 320 x 240 大小的解析度, 24 位元/像素,每秒 30 張的形式傳輸時,其資料量高達 56 M 位元/秒。而以這個速率保存的 1 分鐘未壓縮影像將佔用 3.3G 位元的儲存空間,顯然這樣的要求對現有的網路頻寬來說仍是難以接受。尤其運用在手機、視訊電話上,頻寬仍過於狹窄,收訊品質不佳 , 所以想要在手機上傳輸高畫質視訊,需要有更好的壓縮技術。事實上,近十年來影音壓縮技術不斷的進步,依 McC ann 定律所指稱,壓縮率平均每年仍會以 15% 的速率增加中,尤其這幾年的確有一些不錯的成果,並引起廣泛的重視 。 因此, 本文主要目的在介紹邁入二十一世紀後 ,除了原影音壓縮界的四大天王 (MPEG-4/WMV/DivX/RMV) 外,一些讓各界震驚的新影音壓縮技術與標準,以及預估未來壓縮技術可能之發展趨勢 。
H.264/AVC
  首先登場的是 H.264/AVC。H.264/AVC挾著前輩MPEG-4 的餘威,打著世界第一的旗號,在近幾年狂掃整個影音壓縮界 ,廣泛被 3GPP、DVB、HD-DVD 與 藍光 DVD所接受。 H.264/AVC是ITU-T Video Coding Experts Group (VCEG)與ISO/IEC Moving Picture Experts Group (MPEG)共同組成的Joint Video Team (JVT) 所制定的視訊壓縮標準。JVT制訂H.264/AVC視訊壓縮標準的主要目標在發展一套高效能、具有網路親和性 (network-friendly) 及具有抗誤性 (error resilience) 能力的視訊壓縮技術,並且大幅改進壓縮率,使得相較於MPEG-2、H.263或MPEG-4 Advanced Simple Profile視訊壓縮標準,在相似的視訊壓縮品質下可節省約50%以上的位元率 (壓縮率比MPEG-2 高約2.25-2.5倍;比MPEG-4 ASP 高約 1.6-2倍) 。 H.264/AVC 不只相當有效率,將超高品質的視訊以較小的檔案儲存,它同時也具有相當的延展性,能夠製作出各式用途的視訊影片,包括手機上使用的 3G 標準以及高解析度(HD)視訊等等。H.264/AVC 可製作出相當賞心悅目,50-160 Kbps 的 3G 手機影片, 800-1500 Kbps 的標準解析度(SD)視訊影片,5-7 Mbps 的優質 HD 視訊(1280x720),以及7-9 Mbps 的 full HD 視訊(1920x1080)。以今日以MPEG-2為主的SD DVD 為例,H.264/AVC 可以相對製作出 full HD 的視訊。
雖然 H.264/AVC之壓縮效能遠較於先前之視訊壓縮標準為高,但由於其具有相當複雜之編碼技術及模式選擇,使得其運算複雜度也遠高於先前之壓縮標準。根據JVT會議文件之評估,H.264/AVC相較於MPEG-4 Part 2,其編碼器複雜度約為10倍以上,而解碼器複雜度則為3倍以上。如此高之複雜度將使得H.264/AVC難以使用在具有即時需求之應用上。因此如何在不犧牲H.264/AVC之壓縮效能之前提下,降低其運算複雜度使其適於實用化之程度,為目前相當重要之研究方向。此外如何根據網路視訊串流應用之特點,善加使用H.264/AVC之各種編碼工具及找出最佳之編碼模式組合,以發揮其最大效能,也值得加以研究。 在業界動態方面 , 蘋果電腦已將 H.264/AVC 直接整合在 QuickTime播放器中,同時也有數家公司提供H.264/AVC的晶片,預料過一陣子 ,就可以看到內建 H.264/AVC 的手機、 SET-TOP Box、DVD 播放機等設備了。
圖一 : H.263 與 H.264/AVC 壓縮效果的比較 圖片來源:APPLE QuickTime
AVS
  中國大陸因為內需市場夠大 ,又因民族主義的關係, 一直希望能掌握技術標準的主導權,所以常常在國際標準之外,又另行制定一些屬於中國大陸自己的標準 , 在影音壓縮方面也是採同樣的態度。自從 2003年中國大陸便開始制定自己的影音壓縮標準,業界一般通稱為AVS( Audio Video Standard)。制定AVS時,著時吸引了不少中國大陸專家學者和企業的參與。在技術上,AVS與H.264/AVC是“近親” ,其最大的優勢,是壓縮率比現行技術高出1倍以上,特別適用於需要高壓縮率的視訊相關產品。然而,AVS或H.264/AVC都需要超強的計算能力,中國大陸的IC設計公司能否突破技術難點、自行研發成功符合AVS標準的晶片,是AVS能否真正進入市場的重要因素,只有攻克這個制高點,才能與世界級的巨頭正面競爭,以達成取代MPEG-2的願望。從2005年到2007年這段期間,SET-TOP BOX、藍光DVD、DTV、Smart Phone等都將依次進入新產品的部署期,在這個時期,系統廠商將選擇晶片進行設計、測試、定型、試產,主要設計方案一旦確定,後來的晶片就很難打入市場了。因此,如果AVS錯過了這段寶貴的時間,也就意味著,將要在未來若干年內喪失掉在主流產品市場上的競爭機會,果真如此,儘管AVS有中國政府力量的支撐,還是難以在市場上存活。另外,從技術角度分析,AVS對H.264/AVC仍是屬於局部的改進,而不是革命性的突破,換句話說,在新一代技術的競爭中,AVS相較於H.264/AVC等技術並無真正太多的優勢。
Nancy Codec
  目前視訊領域所採用的壓縮技術大都是屬於類似 MPEG系列的技術。 雖然MPEG-4或H.264/AVC已經獲得較高的壓縮比,但想在2.5G甚至2G行動通信網路上採用這種壓縮方式實現視訊傳送還是比較困難,所以在一般情況下,行動通信的視訊服務主要是鎖定在3G普及後才會提供的服務。然而若能馬上在2G或2.5G網路上提供視訊服務,將可為電信業者帶來巨大的利益,也將使行動用戶享受更多更豐富的行動服務。Nancy Codec技術正是為此目的而開發。Nancy Codec 主要是由日本 Office Noa公司所研發之成果,目前採用該技術的,除日本J-Phone與NTT DoCoMo外,還有中國大陸的中國移動通信公司,而包括台灣中華電信在內的亞洲及歐美各大 電信業者 ,則尚在測試或研究採用的階段。傳統的視訊壓縮,需要一個高速的 CPU或一個專用的處理晶片,不僅占空間,而且還會增加耗電量。相對來說,像 Nancy Codec 這樣的軟體解決方案,則不必要有高速 CPU或專用處理晶片,因此能夠解決行動通訊市場對於具備視訊處理功能之行動化設備的需求。 Nancy Codec 主要係利用 SMSP(Structure Meta Sale Polygon)的觀念所獨立開發的技術,其原理是將行動影像分割成許多不同形狀和尺寸的模型,然後進行壓縮,因採用全新的簡易四則運算法則,不需要進行移動偵測(Motion Estimation)與離散餘弦轉換(DCT) ,所以運算量小、傳輸速率快。
J-Phone在2002年便開始提供名為「影像郵件」(Movie-Sha-Mail)的服務,這種服務主要是利用裝載在行動電話上的數位相機拍攝包括聲音的動態影像,經由手機內建的Nancy Codec技術進行壓縮,以郵件方式寄出,收件對方便可以接收傳來的動態影像。不過,先決條件是雙方必須都是採用此種技術的手機。當時J-Phone便是透過這種服務創下其歷史上行動電話銷售量的最高記錄,甚至超越了日本排名第二的KDDI,也使「影像郵件」一戰成名。之後,原本推出視訊會議業務的NTT DoCoMo與提供動態影像下載服務的KDDI,也開始提供類似的「影像郵件」服務。而採用此項技術的J-Phone,其用戶數已達六百萬人。目前可支援 Nancy Codec的手機有 夏普( Sharp)、Panasonic、三洋(Sanyo)、東芝(Toshiba)、Kenwood、諾基亞(Nokia)7650與3650以及索尼愛立信(Sony Ericsson)的P800等。
Nancy Codec是具有相當優勢的一種壓縮技術,因為Nancy Codec是以軟體實現視訊壓縮,所以硬體處理能力只需MPEG4的10%,而運算速度又比MPEG4快1倍,壓縮率又為MPEG4的十分之一,因此利用現有行動通信網路即可傳送視訊 。 目前已有多家公司推出支援 Nancy Codec的DSP晶片,包括德州儀器、愛普生等 。 另外背後還有眾多電信業者的支持,包括日本 J-phone和中國移動等。 然而雖然Nancy Codec在發展應用方面確實具有優勢,但它也存在一些問題:由於日本OFFICE NOA公司獨家擁有這項技術,因此在技術上不可能很開放,所以並不利於該技術進一步的發展,另一方面,有可能因為各方利益衝突而造成推廣應用上的困難。
AAC +
  由於 APPLE iPod的帶動風潮 , MP3 與 MPEG-4 AAC ( Advanced Audio Coding) 已成為數位音樂界的天王巨星。這幾年 MPEG 組織又再接再厲, 完成了 MPEG-4 High-Efficiency AAC , 也就是俗稱的 AAC + , 的最終規格。 AAC + 大約相當於 AAC兩倍的壓縮率,還能夠保證高音質呈現。 在AAC +中主要組合了MPEG-4 AAC以及由Coding Technologies所開發的SBR (Spectral Band Replication)技術。SBR擴大了播放頻寬,能夠以AAC一半的壓縮率重現同等音質。例如使用AAC + 只要128Kbps就能有5.1多聲道音質;只要48Kbps就能有相當於CD的音質;只要32Kbps就能有立體聲音質。另外SBR技術可以與多種壓縮技術組合 ,例如SBR技術與MP3組合就形成了所謂的MP3 Pro技術 。在 英國 , Siemens推出搭配O2無線音樂下載服務的音樂播放器 ,稱為 DRM Music Player , 已支援 AAC + 作為下載的音樂格式,同時隨機附送了 64MB SD 記憶卡,若以 AAC + 作為音樂格式,最多可儲存約 64首歌曲。
未來發展趨勢
Scalable Coding
  在網際網路 、 無線網路與異質網路的環境下,頻寬變動往往會造成視訊資料無法傳送 (頻寬太小)或頻寬浪費的情況(頻寬大但傳送資料少造成畫面品質差)。目前的解決方式是預先備妥各種頻寬速率的資料,根據網路的情況再作動態的調整。但因為每一個影片都需要數個備份,這種方式會造成儲存資源的浪費。新一代的壓縮技術開始考慮採用可調式壓縮(scalable coding)的方式,希望能有效對抗頻寬變動的問題。 此技術主要特色是達到encode once , decode many times的目標。最高的理想是,只需一種壓縮編碼,就可以應付不同的頻寬使用者,且視訊品質則因頻寬不同,而有不同的對應品質,使用者在收看網路視訊節目時,可擺脫因頻寬變動所造成的畫面暫停、破損、甚至無法收看的窘境。在MPEG-4 2002 修正版 (ISO/IEC 14496-2:2001/Amd 2:2002)中的Streaming Video Profile 就增加了FGS (Fine Granularity Scalability)的 可調式視訊壓縮標準,FGS採用位元平面編碼(Bit-plane Coding),所產生的加強層(enhancement layer)位元流可以在任意位置作切割,具有良好適應頻寬的能力與最細微的可調解析度,並能抵抗網際網路上封包遺失的問題。不同使用者可依照頻寬與本身解碼器的運算能力,選擇適當的資料量來解碼, 希望達到有多少頻寬就擁有多少品質的目標。然而這幾年FGS在產業界的發展並不十分理想,主要原因是該方法過於強調 可調式的彈性卻造成視訊品質普遍不佳 ,因此無法取代現有非 可調式壓縮標準的地位 。然而追求 可調式壓縮的努力一直持續 ,只是戰場轉到了MPEG-21的標準制定會議中, 目前scalable coding 仍在MPEG-21制定中,約在2007年會完成制定 。 根據MPEG第70次會議(2004/10)的結論,在眾多提案中,以HHI所提出以H.264/AVC為基礎的改良方式效能最佳,正式被採納成為工作草案(working draft),也就是說scalable coding的系統架構已初步敲定, 而 原先大家看好的另一陣營,由微軟亞洲研究院主導,以wavelet為基礎的改良方式則敗下陣來 。照 目前情勢來看,DCT 與 wavelet 在視訊標準上長達十年的纏鬥,仍舊是DCT佔了上風!至於 MPEG-21 之 scalable coding 能否一舉奪下最後的聖杯,圓了大家 encode once , decode many times的終極夢想 ,值得我們繼續密切觀察下去 。
Universal Codec
  從上述的描述可以發現目前存在的壓縮技術相當多,幾乎到了氾濫的程度 。然而 到目前為止,所有壓縮標準的架構都差不多,在觀念上,應該可以設計一個  ”universal codec” ,能 同時支援MPEG-1/2/4、H.264/AVC、WMV-9 、AVS等壓縮標準 。 因此在MPEG第69次會議(2004/7)明確研擬制定universal codec標準的計劃,希望能設計支援多重壓縮標準的泛型單一編碼,並預留產業客制化與最佳化的空間,以提供有別於微軟Windows Media Platform的另一解決方案(MPEG真的將微軟視為主要的對手) 。該計劃如果施行順利 ,不論對IC設計公司或系統廠商都是一大利多,因為不用再為不同的壓縮方式傷腦筋,而且許多開發過的元件也都可以重複使用。
結論
  事實上,只要頻寬的需求以及人類視覺的慾望沒被滿足,影音壓縮技術便會不斷的發展下去。當然有人會懷疑到底還有多少進步空間,其實當初在 MPEG-4制定完成時就有人提出類似的疑問,可是隨著H.264/AVC、WMV9、Nancy Codec等壓縮技術陸續出現,證實影音壓縮技術還是有相當大的改進空間 。至於 接下來影音壓縮技術到底會朝何處發展,且讓我們拭目以待。
本文轉載自 2005 年 5 月 CA Designer 雜誌第 205 期

Reference:
http://media.iii.org.tw/itpd/itis/epaper/9501/9501_media01.htm

No comments: