好未來斬獲人工智能領域國際大賽兩項冠軍
2022-05-31
日前,CVPR 2022(Computer Vision and Pattern Recognition,計算機視覺與模式識別國際頂級會議)的多項挑戰(zhàn)賽結果正式出爐。好未來旗下美校智學云視覺團隊憑借暗光下動作識別和大氣擾動文字圖像恢復等前沿技術,分別在UG2+挑戰(zhàn)賽中Semi-Superviced Action Recognition in the Dark(暗光條件下的半監(jiān)督動作識別)賽道、Atmospheric Turbulence Mitigation(圖像去湍流擾動)賽道上,擊敗眾多國內外團隊,斬獲兩項國際冠軍。
這是好未來繼榮獲CVPR2020和CVPR2021多項冠軍后,再次在該國際技術賽場上取得佳績。CVPR由IEEE電氣與電子工程師協(xié)會舉辦,是計算機視覺和模式識別領域最具影響力、內容最全面的頂級A類學術會議之一。
本次UG2+挑戰(zhàn)大賽由新加坡科技局資訊通信研究院(Institute for Infocomm Research, A*STAR, Singapore)、新加坡南洋理工大學(Singapore Nanyang Technological University)聯(lián)合舉辦,吸引了包括來自馬里蘭大學、中國科學院大學等在內的眾多國內外高校和研究機構的上百支專業(yè)團隊參加。
Semi-Superviced Action Recognition in the Dark挑戰(zhàn)賽要求識別暗光場景下視頻序列的動作類別。由于在暗光環(huán)境下視覺特征相較正常環(huán)境下差異巨大,使用現(xiàn)有動作識別算法不能有效工作,對識別算法與研究人員都是很大的挑戰(zhàn)。
為了應對這些問題,好未來美校事業(yè)部視覺團隊結合了深度學習方法的數(shù)據(jù)處理方案,將暗光數(shù)據(jù)“去黑暗化”以及一系列的圖像處理技術與GAN技術,將正常的圖像(來自于HMDB51, K600等)實現(xiàn)“域”遷移,得到與黑暗圖像變亮效果類似的圖像。此外,該團隊基于自監(jiān)督學習訓練的視頻分類方法,充分挖掘視頻的時序關系和視覺特征,并通過自適應的多輪次偽標簽迭代訓練的半監(jiān)督方法,取得91.33%的準確率,奪得冠軍。
圖:Semi-Superviced Action Recognition in the Dark挑戰(zhàn)賽最終前五名榜單,好未來位居第一
近一個世紀以來,人們對于光在介質中擾動和傳播進行了大量研究。然而對于受大氣擾動圖片的恢復、重建算法的研究卻進展緩慢。Atmospheric Turbulence Mitigation挑戰(zhàn)賽旨在促進相關算法的研究。
好未來(隊伍名:Summer)在該競賽中使用Restormer模型用于圖像重建。利用擾動圖片之間存在空間關聯(lián)的特性,采用多幀輸入,充分學習、提取不同幀之間的空間特征,使最終端到端圖像重建效果顯著提升。另外,結合NIMA模塊,使得pipeline能適用于不同場景。最終,以重建后圖像字準98.53%的絕對優(yōu)勢奪魁。
Atmospheric Turbulence Mitigation挑戰(zhàn)賽最終前五名榜單,好未來位居第一
好未來美校智學云的前身為好未來AI研究院,是國內教育領域較早進行AI技術研究與落地探索的研究機構。經(jīng)過近5年的沉淀,好未來美校智學云不斷取得前沿核心技術突破,涉及圖像與視頻理解、機器學習、自然語言理解、語音合成與評測等多個領域,面向行業(yè)開放了視覺、語音、NLP和數(shù)據(jù)挖掘等領域的100余項AI能力,提供智能批改、智能評測、虛擬形象、內容生產(chǎn)和教學管理等方面的AI解決方案,累計獲得包括CVPR2020競賽、CVPR2021競賽、ICCV2021競賽、UbiComp2020競賽、NeurIPS2020“教育挑戰(zhàn)”競賽、CCL 2020幽默計算評測、INTERSPEECH 2021“非母語兒童識別”競賽在內的十余項國內外競賽冠軍,發(fā)表70多篇高水平學術論文,獲得190余項專利。