在與谷歌(GOOGL.US)等公司的激烈競爭中,AI巨頭OpenAI持續(xù)強(qiáng)化其旗艦聊天機(jī)器人產(chǎn)品。該公司于周二宣布,將為ChatGPT的圖像生成功能推出重大更新,不僅能提升圖像生成的精準(zhǔn)度與編輯靈活性,生成速度更較前代模型最高提升4倍,同時(shí)還將在移動端應(yīng)用及網(wǎng)頁端增設(shè)獨(dú)立圖像生成入口,無需通過聊天交互即可直接使用。
作為OpenAI打造“全能應(yīng)用”戰(zhàn)略的重要一環(huán),ChatGPT正逐步整合搜索引擎、語音助手、圖像及視頻生成等多元功能。然而,當(dāng)前行業(yè)競爭日趨白熱化:谷歌近期推出了重磅AI模型Gemini 3,其旗下熱門圖像生成工具Nano Banana用戶粘性持續(xù)提升;埃隆?馬斯克創(chuàng)辦的xAI公司推出的聊天機(jī)器人Grok,也已上線類似圖像生成功能,對ChatGPT形成圍追堵截之勢。
據(jù)此前的報(bào)道稱,受Gemini 3發(fā)布沖擊,OpenAI首席執(zhí)行官薩姆?奧爾特曼在內(nèi)部備忘錄中宣布進(jìn)入“紅色警報(bào)”狀態(tài),要求團(tuán)隊(duì)全力推進(jìn)ChatGPT功能升級。就在上周,OpenAI剛剛發(fā)布了一款更先進(jìn)的AI模型,重點(diǎn)強(qiáng)化了ChatGPT在編程、科學(xué)計(jì)算及各類辦公場景的應(yīng)用能力。
此次圖像功能升級,旨在同時(shí)滿足個人創(chuàng)作與專業(yè)生產(chǎn)需求。升級后的系統(tǒng)支持對上傳圖像進(jìn)行多維度編輯:例如將照片級寫實(shí)風(fēng)格轉(zhuǎn)換為水彩畫質(zhì)感,或?yàn)楫嬅嬷械娜宋锾砑有屡滹棧宜芯庉嫴僮骶鼙A粼紙D像的細(xì)節(jié)完整性。OpenAI特別強(qiáng)調(diào),新模型在多次編輯過程中可穩(wěn)定保持光線效果、人物外觀及場景構(gòu)圖的一致性——這一痛點(diǎn)曾導(dǎo)致前代圖像模型在多輪編輯中頻繁出現(xiàn)細(xì)節(jié)失真問題。
此外,新模型在文本生成能力上實(shí)現(xiàn)突破,支持創(chuàng)建包含更多小型文字的圖像內(nèi)容,例如根據(jù)用戶提示生成詳細(xì)信息圖表或多段落文本;同時(shí)在單張圖像中生成多個清晰的小尺寸人臉圖像方面,表現(xiàn)也更為出色。