更新時間:2025-03-27 21:10:13來源:安勤游戲網(wǎng)
OpenAI在3月25日宣布了對GPT-4o和Sora的重大更新,引入了一項引人注目的新功能——一個全新的文本到圖像生成模型。這一新模型不僅限于文本到圖像的轉(zhuǎn)換,還具備自定義操作、連續(xù)提問、風(fēng)格轉(zhuǎn)換以及圖像PPT制作等一系列實用功能。
在周二的一次直播活動中,OpenAI的首席執(zhí)行官奧爾特曼正式宣布,基于GPT-4o模型的原生圖像生成功能已經(jīng)問世,這標(biāo)志著DALL-E這一獨立的文本到圖像生成模型被整合進(jìn)了ChatGPT系統(tǒng)?;仡櫄v史,ChatGPT在2022年底推出時,僅支持文字聊天功能,大約一年后,雖然集成了DALL-E 3圖像生成模型,但兩者在系統(tǒng)層面上仍然是獨立的。此前,AI圖像生成器存在諸如“理解提示詞能力不足”和“無法準(zhǔn)確生成圖片中的文字”等問題,這些問題極大地限制了其在教育和職場等領(lǐng)域的應(yīng)用潛力。
然而,此次升級后的ChatGPT在圖像生成功能方面取得了顯著的進(jìn)步。它能夠更加準(zhǔn)確地根據(jù)提示詞生成圖像中的文本,特別是在生成黑板板書、印刷體以及科學(xué)常識繪圖等涉及圖像文字的場景中,其表現(xiàn)從幾乎不可用提升到了接近商用水平。圖像編輯功能也得到了極大的增強,例如,可以將合照轉(zhuǎn)化為動畫風(fēng)格,根據(jù)簡單的提示詞生成相對論主題的彩色漫畫,還能根據(jù)漫畫草稿一鍵上色或更換主要角色。
在商業(yè)應(yīng)用方面,這一新模型也展現(xiàn)出了巨大的潛力。用戶可以根據(jù)上傳的照片和卡片模板自定義生成新的卡片,甚至能夠基于聊天的上下文生成一系列風(fēng)格一致的圖像。這對于游戲角色設(shè)計等領(lǐng)域來說,無疑是一個重大的突破。然而,OpenAI也坦誠地承認(rèn),新的圖像生成器仍然存在一些局限性,特別是在處理密集文字和非拉丁語文字的圖像生成時,可能會遇到問題,這在一定程度上受到了模型幻覺的影響。
盡管存在這些局限性,但OpenAI的這一升級仍然為ChatGPT的發(fā)展注入了新的活力。從周二開始,這一新功能已經(jīng)向所有免費和付費用戶開放,而在未來幾周內(nèi),開發(fā)者還可以通過API接口進(jìn)行調(diào)用。這一系列的更新和改進(jìn),無疑讓我們對ChatGPT在更多領(lǐng)域的應(yīng)用表現(xiàn)充滿了期待。
相關(guān)資訊
其他推薦