在多媒體技術(shù)和互聯(lián)網(wǎng)高速發(fā)展的現在,高清晰度、大尺寸圖片越來(lái)越被人們所需要,然而高清晰度、大尺寸帶來(lái)的問(wèn)題也隨之出現:存儲圖像所需的空間成本大大增加,以及傳輸圖像所需的時(shí)間成本大幅攀升。
為了保證圖像失真盡可能少的情況下,用更少的網(wǎng)絡(luò )帶寬傳輸圖像或者用更少的空間存儲圖像,2023年初,我校章為川教授聯(lián)合青島認知人工智能研究院黃杰研究員提出了一個(gè)注意力再注意力的非線(xiàn)性變換端到端網(wǎng)絡(luò )架構來(lái)代替線(xiàn)性變換作為圖像和視頻壓縮的主體架構。該成果較好的應用于浙江某銀行業(yè)務(wù)單據壓縮,該行在全省有支行82個(gè),網(wǎng)點(diǎn)大約4000個(gè),平均每個(gè)支行每天產(chǎn)生的業(yè)務(wù)流水單據圖片數據量約20GB;總行擬對全省82家支行業(yè)務(wù)流水單據進(jìn)行統一管理,通過(guò)對這些業(yè)務(wù)單據數據進(jìn)行壓縮,降低支行到總行的傳輸帶寬投入,以及總行的存儲設備投入。每年為該銀行直接節省成本1217萬(wàn)元。并且該成果已應用于三一重工昆山園區的視頻壓縮。該園區建設有視頻監控7000路,且均為800萬(wàn)超高清像素,視頻時(shí)長(cháng)需保存90天,存儲投入成本巨大,經(jīng)壓縮系統壓縮后,微動(dòng)態(tài)場(chǎng)景下,可將視頻碼率從4M壓縮到150K左右,復雜動(dòng)態(tài)場(chǎng)景下,可將視頻碼率從4M壓縮到800K以?xún)?,?huà)質(zhì)肉眼無(wú)法區分;降低了廠(chǎng)區存儲成本投入以及前端網(wǎng)絡(luò )帶寬總費用節省近1000萬(wàn)。
(核稿:強濤濤 編輯:劉倩)