近日,人工智能領域國際頂級學術會議AAAI(2025)公布論文錄用結果,西華大學成果《GLIC:General Format Learned Image Compression》被錄用,計算機與軟件工程學院2023級碩士研究生周明勝為第一作者,導師孔明明為通訊作者。
AAAI(Association for the Advancement of Artificial Intelligence)為人工智能領域國際頂級學術會議,同時也是中國計算機學會(CCF)和中國人工智能學會(CAAI)推薦的A類國際學術會議。本屆會議在美國費城召開,共收到12957篇有效投稿,最終錄用3032篇,錄取率為23.4%。
在數字信息時代,圖像壓縮技術是影像傳輸和存儲的重要基礎。隨著人工智能技術發展,基于深度學習的圖像壓縮方法在主觀視覺效果和定量指標上超越了傳統算法。然而,當前學習圖像壓縮方法多適用于三通道圖像格式,限制了其實際應用。針對這一現狀,研究團隊提出高性能學習圖像壓縮模型General Format Learned Image Compression(GLIC),旨在處理通用圖像格式,拓展技術應用范圍。研究工作引入圖像通道轉換方法,將任意通道數圖像統一為適合神經網絡處理的格式,并通過信息熵和同態理論驗證其有效性。同時,在熵模型中加入自適應注意力殘差塊(AARB)提升模型泛化能力,提出均勻分組跨通道上下文模塊(CCCT)用于漸進式預覽圖像解碼。
GLIC模型框架
GLIC模型框架通過Reconstruction Split and Concat(SC/RSC)模塊,將任意通道數圖像轉換為二維矩陣處理,解碼時還原原始格式。模型核心由分析器、合成器以及超先驗分析器和超先驗合成器構成,用于優化編碼效率。CCCT模塊通過均勻分組潛在表示、優先處理信息量較大塊,解決多通道圖像信息冗余問題,加速編解碼并保證預覽圖像質量。AARB模塊融合注意力機制與殘差網絡優勢,自適應識別語義信息重要性,提升壓縮效率的同時保證圖像高保真度。
CCCT模塊
AARB模塊
該項成果代表了學習圖像壓縮領域的重要進展,為解決實際應用中的圖像壓縮難題提供了強有力的技術支持。隨著GLIC模型的不斷優化和推廣,有望在醫療影像處理、無線通信、大規模數據存儲等眾多領域發揮重要作用。