一年一度的CVPR 視覺盛宴在西雅圖召開,CVPR是國際上視覺的第一大會議。2020年是一個特殊的年份,CVPR 也歷史性的轉到ZOOM 視頻會議上。為了促進深度學習在視頻壓縮行業的發展,由google ,Netflix等巨頭聯合舉辦的CLIC(CHALLENGE ON LEARNED IMAGE COMPRESSION)已經舉辦到了第三屆。
繼2018年圖鴨科技clic獲得圖片壓縮兩項世界冠軍,2019年包攬圖片壓縮4項世界冠軍,在2020年的cvpr大賽上,圖鴨科技登頂視頻壓縮的桂冠,力壓阿里達摩院,拿下了視頻壓縮的世界冠軍。
深度學習視頻壓縮發展已經有5年左右,在過去幾年的時間里,深度學習在圖片壓縮上有很大的突破,但是在視頻壓縮上進展一直不是很理想。無論是從速度上還是壓縮性能上,都無法和傳統的h.266競爭。從今年的比賽結果看,圖鴨科技的性能已經超越了傳統的h.266,比起阿里巴巴使用的傳統方法,具有更快的解碼速度。在今年的比賽中,也加入了對模型大小的考量,在深度學習弱勢的模型大小下,圖鴨科技摘文件大小比阿里巴巴小的情況下,依然在指標上超越了阿里巴巴為代表的h.266傳統模式。從2020年開始,深度學習視頻壓縮真正的開始走向成熟。在編碼效率上,深度學習壓縮和解碼效率相當,甚至更快,這是傳統方法無法想象的。
目前圖鴨科技的深度學習壓縮的在單張2080ti 顯卡上,已經可以實現3840*2160 @26fps的壓縮,真正的開始走向商用。由于編碼效率和解碼效率相當,對于大量的非結構化數據(圖片和視頻)的存儲和傳輸帶來了巨大的好處。
隨著安防行業的發展,中國每年鋪設的攝像頭數據達到2億個以上,每個攝像頭視頻的存儲時長已經由30天提升到90天,單個攝像頭的存儲成本也達到了2000元,這對數據的存儲的壓力是超級大的,深度學習壓縮的出現可以解決大量視頻的存儲問題。隨著智慧城市的發展,每個城市每天產生幾十億張高清的照片,無數的攝像頭拍攝了大量的照片,對圖像存儲的壓力也很大。一個5000個攝像頭的抓拍系統,存儲成本高達800萬元。使用圖鴨科技的技術可以節約600萬元的成本。
4K+5G的發展成為了社會發展的動力,隨著5G的發展,數據量爆炸,5G解決了數據傳輸的最后一公里問題,但是,在公共網絡上,光纖網絡的升級是緩慢的,成本因為5G的到來而逐步升高。利用圖鴨的技術,可以解決公共網絡傳輸的帶寬問題。一個4K電視升級,存儲和帶寬花費1500萬元,一路4K視頻的讀寫速度已經接近硬盤的讀寫速度上限,數據太大,已經成為了生產4K內容的巨大負擔,圖鴨的技術可以解決4K的讀寫問題。
新冠病毒的發展,使得每個人都在家辦工,視頻會議,視頻教育,短視頻都產生了大量的數據,給網絡和存儲帶來了巨大的壓力,數據量隨著新冠的發展而爆炸。圖鴨科技的技術可以解決視頻會議,視頻教育的流量和存儲問題,節約70%的成本。
3840*2160 @25fps GPU 和cpu 使用率
一個新的時代已經到來,深度學習結束了傳統的266每年提升3%壓縮的率的節奏,壓縮率每年以20%-40%以上在提升,今年正式超越了h.266,也意味著拐點的到來。整個行業的洗牌也從2020年開始。