AI生成短片工具震撼登場

廖錦興博士| 2月21日2024年

新年伊始,先向各位讀者拜年,祝萬事如意,龍精虎猛。

上周,全球熱議美國人工智能(AI)開發公司OpenAI最新發布的文字生成短片模型Sora。AI生成短片之前並非新鮮事,包括RunwayPika LabsSynthesia等科企,都已為市場帶來不同體驗。去年奪得第95屆奧斯卡最佳影片的《奇異女俠玩救宇宙》,更應用了Runway的視覺特效工具。這些程式都離不開文字到圖像生成模型(Transformer Model)或基於擴散模型(Diffusion Model)。

Sora厲害之處不僅融合了上述兩種模型,還能呈現出細膩且詳細的短片效果。目前使用Sora生成的影片長達一分鐘,其中越野車山崖中奔馳、時尚女子在東京雨後街頭漫步等等,效果都十分逼真,令人嘆為觀止。其後數日內Sora再發布一個更複雜效果的AI短片,在一次性生成短片中,分別展現5個不同的視角,讓觀眾能多角度觀賞,再令人對Sora模型更有信心和期待。

Sora厲害之處不僅融合了上述兩種模型,還能呈現出細膩且詳細的短片效果。 (shutterstock網上圖片)

Sora厲害之處不僅融合了上述兩種模型,還能呈現出細膩且詳細的短片效果。 (shutterstock網上圖片)

在Sora公布前,OpenAI行政總裁阿爾特曼(Sam Altman)表示,將籌資7萬億美元以重塑全球半導電體格局。當大家還在問憑什麼時,Sora便給大家答案。在原有ChatGPT等基礎上,加上文生短片,並再追求更大的人工智能想像力。因此,世界需要提高現有的AI設施規模,包括晶圓製造能力、能源、數據中心等。目前的建設遠遠未能滿足這需求,龐大規模的AI基礎設施和具有穩定及安全的供應鏈,需要在融資方案上作好準備,這也是對金融界的好消息。

對ChatGPT仍未找到應對方法的多個行業,Sora的出現毋庸置疑對更多行業帶來巨大挑戰,尤其是商業相片及影片供應商、廣告製作公司、影視行業等。如Adobe和Shutterstock,它們在Sora公布後不久股價下挫5至7%。各方面從前沿AI技術的開發、法規的跟進、物理模型是否準確等,以不同角度去評論Sora的程式和效果。

科技圈對Sora的橫空現世反應各異,有的對「寫得出做得到的高質影片」非常讚嘆,亦有人認為未來即使小學生,亦可製作充滿想像力的史詩式大片,亦有人擔心更多職位從此被AI替代。無論如何,人工智能技術將改變世界,人類可持續發展的想法是不會變,但方式將隨着科技發展而有所改變。電動車生產商特斯拉(Tesla)行政總裁馬斯克(Elon Musk)在OpenAI發布Sora短片後稱:「人類認賭服輸」。我不清楚他所指人類在「賭博」什麼?對於科技發展而言,絕大部分人類都是被動的追隨者,我們無權選擇只有跟隨,沒有下注的機會又何來賭博?此話可能有點無奈及唏噓,但這是個事實。


接收最新資訊

要接收最新的文章,請考慮成為訂閱者。每星期發布新科網人語的內容。多謝支持青工俠說!