NVIDIA 的研究人員日前研發(fā)出一個(gè)基于深度學(xué)習(xí)的系統(tǒng),能夠?qū)⒚棵?0幀的視頻轉(zhuǎn)換為高清慢鏡視頻,其效果優(yōu)于其它同類方法當(dāng)前能夠?qū)崿F(xiàn)的最佳效果。
研究人員在其研究論文中寫道,“生活中有許多難忘時(shí)刻單憑肉眼很難看清,這時(shí)你可能想要用慢鏡頭記錄下來,例如嬰兒第一次蹣跚學(xué)步、高難度的滑板技巧、愛犬成功接球等。”“雖然可以用手機(jī)拍攝每秒240幀視頻,但用手機(jī)以高幀率完成所有拍攝的做法也并不實(shí)際,因?yàn)檫@需要很大的內(nèi)存空間,而且功耗很大?!?/p>
而基于這項(xiàng)新的研發(fā)成果,用戶則可以在拍攝視頻后制作慢鏡視頻。
研究團(tuán)隊(duì)利用NVIDIA Tesla V100 GPU和cuDNN加速的PyTorch深度學(xué)習(xí)框架,基于1.1萬多個(gè)日常和體育活動(dòng)視頻,以每秒240幀的速率對(duì)系統(tǒng)進(jìn)行了訓(xùn)練。訓(xùn)練完成后,卷積神經(jīng)網(wǎng)絡(luò)便能對(duì)更多的視頻幀進(jìn)行預(yù)測。
團(tuán)隊(duì)采用了另一套數(shù)據(jù)集來驗(yàn)證系統(tǒng)的精確度。結(jié)果表明系統(tǒng)能夠使以較低幀率拍攝的視頻看起來更加流暢且清晰。
研究人員表示:“NVIDIA采用的方法能夠生成多個(gè)時(shí)空連貫的中間幀。我們的多幀法始終優(yōu)于當(dāng)前最佳的單幀法?!?/p>
為展示研究成果,研究團(tuán)隊(duì)從著名的在線科技系列視頻《The Slow Mo Guys》中截取了多個(gè)片段,并進(jìn)一步放緩了視頻速度。以每秒30幀的速率拍攝,之后轉(zhuǎn)換為每秒240幀的視頻。
這種方法可用于記錄日常生活中彌足珍貴的時(shí)刻,然后將其速度放緩,就像電影慢鏡頭場景一樣,起到增添懸念、突出重點(diǎn)、更加引人入勝的效果。
Huaizu Jiang、Deqing Sun、Varun Jampani、Ming-Hsuan Yang、Erik Learned-Mille和Jan Kautz等研究人員將于6月21日(星期四)下午2:50 – 4:30在猶他州鹽湖城舉辦的年度計(jì)算機(jī)視覺與模式識(shí)別(CVPR)大會(huì)上展示其研究成果。