AIGC是什么?
AIGC( AI Generated Content)是利用人工智能來(lái)生成你所需要的內(nèi)容,GC的意思是創(chuàng)作內(nèi)容。與之相對(duì)應(yīng)的概念中,比較熟知的還有PGC,是專業(yè)人員用來(lái)創(chuàng)作內(nèi)容;UGC是用戶自己創(chuàng)造內(nèi)容,顧名思義AIGC是利用人工智能來(lái)創(chuàng)造內(nèi)容。
AIGC技術(shù)原理
AIGC 是指利用等 GAN(生成對(duì)抗網(wǎng)絡(luò))、Transformer 模型、Diffusion 模型等基礎(chǔ)生成算法模型、預(yù)訓(xùn)練模型以及 CLIP(跨模態(tài)學(xué)習(xí)模型)等 AI 技術(shù),通過(guò)對(duì)既有數(shù)據(jù)的學(xué)習(xí)和發(fā)散,基于與人類交互所確定的主題,由 AI 算法模型完全自主、自動(dòng)生成對(duì)應(yīng)內(nèi)容,從而幫助互聯(lián)網(wǎng)、傳媒、電商、影視、娛樂(lè)等行業(yè)進(jìn)行文本、圖像、音視頻、代碼、策略等多模態(tài)內(nèi)容的單一生成或跨模態(tài)生成,以提升內(nèi)容生產(chǎn)效率與多樣性。
AIGC 也是繼 UGC、PGC 之后新型利用 AI 技術(shù)自動(dòng)生成內(nèi)容的生產(chǎn)方式,被認(rèn)為是繼專業(yè)生產(chǎn)內(nèi)容(PGC)、用戶生產(chǎn)內(nèi)容(UGC)之后的新型內(nèi)容創(chuàng)作方式。目前主要用在文字、圖像、視頻、音頻、游戲以及虛擬人上等。
AIGC 的功能
文字創(chuàng)作
AIGC 生成文字目前主要被應(yīng)用于新聞的撰寫(xiě)、給定格式的撰寫(xiě)以及風(fēng)格改寫(xiě)。比如用戶可以通過(guò)輸入一段對(duì)于目標(biāo)文章的描述或者要求,系統(tǒng)會(huì)自動(dòng)抓取數(shù)據(jù),根據(jù)我們描述的指令進(jìn)行創(chuàng)作。
圖像創(chuàng)作
技術(shù)平臺(tái)降低了藝術(shù)繪畫(huà)創(chuàng)作的門檻,用戶只需要通過(guò)輸入文字描述,計(jì)算機(jī)將會(huì)自動(dòng)生成一張作品。
視頻創(chuàng)作
例如 Google 推出了 AI 視頻生成模型 Phenaki 能夠根據(jù)文本內(nèi)容生成可變時(shí)長(zhǎng)視頻的技術(shù),在公布的 DEMO 中,Phenaki 基于幾百個(gè)單詞組成一段前后邏輯連貫的視頻只需兩分鐘。
音頻剪輯
AIGC 生成音頻早被應(yīng)用于我們的日常生活當(dāng)中,比如常用的手機(jī)導(dǎo)航中的聲音。更深層次的應(yīng)用將會(huì)是虛擬人領(lǐng)域,AIGC 不僅可以生成虛擬人的聲音,并可以創(chuàng)造出說(shuō)的內(nèi)容。
游戲開(kāi)發(fā)
AIGC 在游戲當(dāng)中的應(yīng)用可分為兩方面,一方面用于場(chǎng)景和故事的搭建,另一方面玩家可以通過(guò) AIGC 的平臺(tái)工具來(lái)創(chuàng)建自己的虛擬人,可以用于游戲中的打金等活動(dòng)。
代碼生成
資料顯示,2022 年 AIGC 發(fā)展速度驚人,迭代速度更是呈現(xiàn)指數(shù)級(jí)爆發(fā),其中深度學(xué)習(xí)模型不斷完善、開(kāi)源模式的推動(dòng)、大模型探索商業(yè)化的可能,成為 AIGC 發(fā)展的“加速度”。
AIGC 的創(chuàng)作類型
目前為止,與 AIGC 相關(guān)的創(chuàng)作類型主要有三種:
1、內(nèi)容平臺(tái)的一種自動(dòng)化作業(yè)方式
比如 CCTV 的 AIGC 平臺(tái),就包括智能采編、模板生成、畫(huà)質(zhì)優(yōu)化等等;部分語(yǔ)音類 app,通過(guò)語(yǔ)音合成(TTS)技術(shù),提供文本自動(dòng)轉(zhuǎn)語(yǔ)音的能力;流媒體平臺(tái),通過(guò)算法對(duì)畫(huà)面畫(huà)質(zhì)進(jìn)行優(yōu)化,提高清晰度等等。
2、AI 科研機(jī)構(gòu)的多模態(tài)應(yīng)用,實(shí)現(xiàn)內(nèi)容生成
比如中科院自動(dòng)化所的跨模態(tài)通用人工智能平“紫東太初”,就能夠做到“以圖生音”“以音生圖”。百度文心大模型的“AI 畫(huà)家”,則在前不久的元宵節(jié),生成與地點(diǎn)相匹配的專屬畫(huà)作。
3、科技企業(yè)及創(chuàng)業(yè)公司的數(shù)字人、虛擬人制作
通過(guò)自主開(kāi)發(fā)、平臺(tái)開(kāi)發(fā)等形式,合成全新的人物形象,與用戶開(kāi)展互動(dòng)。比如 AI 手語(yǔ)主播,通過(guò) AI 算法將文本轉(zhuǎn)化為手語(yǔ)信息,為聽(tīng)障朋友提供服務(wù);品牌代言人,火星車數(shù)字人祝融號(hào)跟廣大用戶進(jìn)行互動(dòng);虛擬偶像,通過(guò)生動(dòng)的表情、動(dòng)作、語(yǔ)言等展示才藝,與粉絲對(duì)話;以及智能客服、游戲陪玩等等。
(本文根據(jù)網(wǎng)絡(luò)公開(kāi)資料整理)