<del id="79rpt"><ruby id="79rpt"></ruby></del>
<del id="79rpt"></del>
<del id="79rpt"><thead id="79rpt"><address id="79rpt"></address></thead></del><noframes id="79rpt">
<ruby id="79rpt"><dl id="79rpt"></dl></ruby><strike id="79rpt"></strike><strike id="79rpt"><video id="79rpt"></video></strike>
<strike id="79rpt"><video id="79rpt"></video></strike>
<span id="79rpt"></span>
<menuitem id="79rpt"><progress id="79rpt"></progress></menuitem>
<span id="79rpt"></span><span id="79rpt"></span>
<strike id="79rpt"></strike> <strike id="79rpt"></strike>
<strike id="79rpt"><i id="79rpt"><del id="79rpt"></del></i></strike>
<strike id="79rpt"></strike>
您的位置: 首頁 > 推薦

Sora沖擊波

出處:北京商報 作者:楊月涵 網編:武杉 2024-02-18

2023年春節,AI圈的絕對主角是屬于ChatGPT的,2024年春節,OpenAI再投一顆“深水炸彈”,毫無預兆發布的文生視頻模型Sora,讓AI圈又一次“一夜變天”。

一是時長,二是逼真程度,Sora實現了兩個老大難問題的同時解決,以至于外界毫不吝嗇地將其形容為“顛覆性”的存在。360創始人周鴻祎說,Sora的發布意味著AGI(通用人工智能)的實現將從十年縮短到一年。

北京商報

現實,不存在了?

沒有任何預兆和消息的提前透露,OpenAI突然發布了首個文生視頻模型Sora,逼真程度瞬間“引爆”市場。

“一句話生成視頻”正無限接近于現實。在OpenAI的展示中,只需要一段簡單的文本指令,Sora就可以直接輸出最長達60秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭以及富有情感的多個角色。

一位行走在東京街道上時尚女性的視頻幾乎成了Sora的“代表作”。這段一分鐘的視頻里,從主要人物到背景人物,從近景到遠景,細致、逼真的畫面和流暢轉換的鏡頭幾乎以假亂真。

國泰君安研報指出,Sora具有三大突出亮點,一是60秒長視頻,Sora可以保持視頻主體與背景的高度流暢性與穩定性。二是單視頻多角度鏡頭,Sora在一個視頻內實現多角度鏡頭,分鏡切換符合邏輯且十分流暢。三是理解真實世界的能力,Sora對于光影反射、運動方式、鏡頭移動等細節處理得十分優秀,極大地提升了真實感。

對于文生視頻的技術問題,北京市社會科學院副研究員王鵬對北京商報記者提到,這首先涉及到算法的復雜性。文生視頻技術不僅涉及文本到圖像的轉換,還需要處理時序信息和音頻同步。這需要復雜的深度學習模型,如生成對抗網絡(GANs)和變分自編碼器(VAEs)等,以捕捉視頻中的動態變化和細節。

不過OpenAI也承認,目前Sora還存在著一定的短板,比如無法準確地模擬復雜場景的物理原理,且無法理解這其中的因果關系,呈現在視頻上,可能就會出現一個人咬了一口餅干后,餅干并沒有咬痕的結果。

Sora生成視頻截圖
Sora生成視頻截圖。提示詞為:在東京街頭,一位時髦的女士穿梭在充滿溫暖霓虹燈光和動感城市標志的街道上。

AGI加速

“通過文字描述的方式來生成前后有關聯的連續視覺內容的時代來臨了”。在接受北京商報記者采訪時,新壹科技CTO張華偉說,從Sora的效果看,穩定性已經很高了,這也意味著視頻內容的生產效率大大提升了。

中國企業資本聯盟副理事長柏文喜對北京商報記者提到,Sora有望顛覆影視、游戲、廣告等多個行業。隨著Sora等文生視頻技術的成熟,各行各業都可以利用其生成高質量的視頻內容,提高內容創作效率,降低制作成本。

“從長期來看,這種顛覆效應將更加明顯,可能導致傳統視頻制作人員的需求減少,進而推動整個行業的變革。”柏文喜稱。

不過中國信息協會常務理事、國研新經濟研究院創始院長朱克力提到,這種顛覆還需要一定的時間,因為Sora盡管在技術上取得了突破,但在實際應用中還需要解決許多問題,如模型的穩定性、可擴展性和計算效率等。此外,各行業對于新技術的接受和應用也需要一個過程。

但Sora真正的“星辰大海”,很可能早就超過了視頻的范疇。就像周鴻祎在評價Sora時說的,“我認為AGI很快會實現,就這幾年的事兒了”。

在接受北京商報記者采訪時,天使投資人、資深人工智能的郭濤提到,與文本和圖像相比,視頻不僅包含了靜態圖像的空間信息,還加入了時間維度,要求模型能夠理解和預測隨時間變化的動態場景。

這意味著Sora需要處理更加豐富的數據類型,包括物體的運動、光影變化、遮擋關系等,這些都是AGI所需解決的核心問題。

朱克力也表示,文生文和文生圖主要關注的是靜態信息的轉換和表達,而文生視頻則需要在連續的時間序列中保持場景的一致性、物體的動態關系和光影的變化,這要求模型具備更強的時空建模能力和更高的計算復雜度。因此,文生視頻技術的成功對于推動AGI的發展具有更為顯著的作用。

“所以Sora只是小試牛刀,它展現的不僅僅是一個視頻制作的能力,而是大模型對真實世界有了理解和模擬之后,會帶來新的成果和突破。”周鴻祎說。

理想與現實

據悉,目前Sora并未對公眾全面開放,僅邀請部分測試者進行體驗。造成這一情況的原因,是Sora所引發的關于濫用視頻生成技術所帶來的安全性擔憂,而這也幾乎可以看做是Sora想要“做大做強”必然需要邁過的一道坎。

王鵬總結出了文生視頻的三大難點,分別是真實性問題、創意和版權問題以及可解釋性和透明度問題。

但這些并不足以阻擋文生視頻的發展。2023年是國內大模型競爭白熱化的一年?!侗本┦腥斯ぶ悄苄袠I大模型創新應用白皮書(2023年)》顯示,我國10億參數規模以上的大模型已超過200個。而從2023年下半年開始,大模型競爭焦點也開始從底層模型的搭建轉移向行業的落地應用。

不過從整體而言,國內在AI領域的發展仍稍顯遜色,未出現代表性應用的同時,行業發展也出現“降溫”跡象。CB insights報告顯示,去年,中國AI領域投融資數量約為232筆,同比下降38%,融資總額約為20億美元,同比下降70%。

有分析師解讀,這意味著,熱錢可能集中地涌向了少數團隊背景和技術實力強大的公司。從資源分配的角度而言,后來者想要再擠進模型層創業,空間已經不多。

“不少國內的大模型企業仍然面臨缺少自主創新的問題,如果不能知其然,必然不能知其所以然。”在接受北京商報記者采訪時,一位業內人士如此說道。

北京商報記者 楊月涵

右側廣告

本網站所有內容屬北京商報社有限公司,未經許可不得轉載。 商報總機:010-64101978 媒體合作:010-64101871

商報地址:北京市朝陽區和平里西街21號 郵編:100013 法律顧問:北京市中同律師事務所(010-82011988)

網上有害信息舉報  違法和不良信息舉報電話:010-84276691 舉報郵箱:bjsb@bbtnews.com.cn

ICP備案編號:京ICP備08003726號-1  京公網安備11010502045556號  互聯網新聞信息服務許可證11120220001號

新婚娇妻被朋友粗大高潮白浆,最近中文字幕大全免费1,超碰97久久国产精品牛牛