平發(fā)集團
搜索

我國自研視頻大模型面向全球上線

發(fā)表時間:2024-08-02 08:54作者:記者 魏夢佳來源:新華社

輸入文字描述或上傳圖片,就能生成一段逼真視頻。近日,我國自主研發(fā)的通用視頻大模型Vidu(www.vidu.studio)面向全球正式上線。據(jù)悉,這款視頻大模型開放文生視頻、圖生視頻兩大核心功能,提供4秒和8秒兩種時長選擇,分辨率最高達1080P,生成一段4秒的視頻片段經(jīng)實測僅需30秒。

Vidu由清華大學聯(lián)合北京生數(shù)科技有限公司共同研發(fā),于今年4月在2024中關村論壇年會上首次發(fā)布。清華大學人工智能研究院副院長、北京生數(shù)科技首席科學家朱軍介紹,Vidu具有“長時長、高一致性、高動態(tài)性”的特點,可根據(jù)文字和圖片生成高清視頻,且能保持高流暢、高動態(tài)的畫面效果。截至目前,Vidu可支持一次性生成最長32秒的視頻。

“Vidu能模擬真實物理世界,生成細節(jié)復雜且符合物理規(guī)律的場景,例如合理的光影效果、細膩的人物表情等,還能創(chuàng)造出具有深度和復雜性的超現(xiàn)實主義內(nèi)容?!敝燔娬f,對于科幻、西部、浪漫、動畫等多類型電影,Vidu能生成符合對應風格的畫面片段,還能生成影視級特效畫面,如煙霧、特效光影等效果。

據(jù)介紹,在動態(tài)性方面,Vidu可生成復雜動態(tài)鏡頭,支持大幅度、精準的動作生成,能在畫面里實現(xiàn)遠景、近景、中景、特寫等不同鏡頭的切換,能直接生成長鏡頭、追焦、轉場等效果。

記者從北京生數(shù)科技有限公司獲悉,除文生視頻和圖生視頻的兩大基礎功能外,為了給用戶提供更多樣化和個性化的視頻創(chuàng)作體驗,Vidu還上線“動漫風格”和“角色一致性”兩大新功能。在“圖生視頻”板塊中,利用“角色一致性”功能,用戶可上傳人像圖或自定義的角色圖,通過文字描述就可指定圖中角色在任意場景中做任意動作。該功能簡化了視頻制作流程,也提升了創(chuàng)作自由度。

據(jù)悉,操作Vidu無須申請,用戶直接使用郵箱注冊即可上手體驗。Vidu的技術突破源于研發(fā)團隊在機器學習和多模態(tài)大模型方面的長期積累,其核心技術架構由團隊在2022年就提出并持續(xù)開展自主研發(fā)。

宜章县| 舞钢市| 莫力| 新化县| 家居| 齐河县| 沈阳市| 信宜市| 濮阳县| 神池县| 本溪市| 南岸区| 泸定县| 上思县| 邯郸市| 潼关县| 建水县| 海林市| 萍乡市| 罗田县| 同仁县| 通化县| 宣城市| 镇安县| 兴化市| 呼玛县| 丹寨县| 上思县| 肇源县| 拜泉县| 新密市| 巨野县| 井冈山市| 河北区| 托克托县| 海南省| 鄂伦春自治旗| 泰和县| 彭州市| 兴安盟| 黔江区|