首頁>科技>

Dall-E 2 是一種可以根據文本描述創造高質量圖像的 AI 模型,從而允許用戶快速地進行藝術創作。

在今年 7 月下旬,該文本生成圖像模型的創造者 OpenAI 宣佈將公開測試 Dall-E 2,並打算在幾周內讓一百萬人參與測試。

自此之後,很多人都開始利用 Dall-E 2 進行各種創作,比如製作雜誌封面、音樂視頻等。

近日,一位名叫雅各布·馬丁(Jacob Martin)的軟件工程師分享了他如何使用 Dall-E 2 來生成一個查詢工具徽標的詳細過程。

在經歷一步一步調整後,馬丁最終獲得了他滿意的標識圖像,如下圖所示。

接下來,看一下這個徽標是如何隨著文字的不斷調整慢慢演變的。

在馬丁發佈的博客文章中,他提到,首先他對即將設計的徽標有一個大概的想法,因為查詢工具的名稱是 OctoSQL,這來源於octopus(章魚)和 SQL(Structured Query Language,結構化查詢語言)的結合,所以他希望徽標體現出“一隻有許多手臂的卡通章魚,在操縱一些實體元素”的畫面。

馬丁先從一個相對簡單的句子開始。在輸入文字“A baby octopus juggling diagrams of databases, digital art, cartoon, drawing”(一隻小章魚在雜耍數據庫、數字藝術、卡通、繪畫的圖表)後,Dall-E 2 返回了一些圖像,其中兩個相對較好圖像(據馬丁所寫,他捨棄了超 70%的可怕圖像)如下圖所示。

在上面左邊圖的基礎上,馬丁做了一些更有深度的變化,在章魚觸角上添加了一些抽象的形狀,並讓圖像偏向繪畫風格。

輸入文字“A baby octopus juggling 3D shapes representing databases, arm wrapped around one cube, streams of data passing through the cubes, digital art, cartoon, drawing, logo”(一隻小章魚在處理代表數據庫的 3D 形狀,手臂纏繞在一個立方體上,通過立方體、數字藝術、卡通、繪畫、標識的數據流)後,獲得瞭如下圖像。

隨後,在去掉了數據方面的描述,只保留章魚元素描述後,Dall-E 2 返回如下圖像。

在上圖基礎上進行編輯,添加一些數據流、藍色數據存儲柱體、3D 形狀等描述後,得到以下圖像。

然後,在輸入了“Baby octopus, logo, digital art, drawing”(小章魚、標識、數字藝術、繪畫)幾個單詞後,生成了一個除具徽標樣式的圖像。

馬丁在博文中寫道:“徽標通常具有背景,這個黑色的背景圓圈是我需要的。嘗試了基本的短語(Baby octopus, logo, digital art, drawing, in a dark circle as the background)後,我得到了一些漂亮的徽標!”

在這些圓圈背景基礎上,馬丁又添加了一些實體供章魚玩耍。輸入文字:Cute baby octopus playing with cubes, logo, digital art, drawing, in a dark circle as the background(可愛的小章魚玩著立方體,標誌,數字藝術,繪畫,在一個黑暗的圓圈作為背景),得到以下圖片。

馬丁還在博文中提到,“OctoSQL 是針對嚴肅數據處理的,徽標應該反映這一點。另外,黃色安全頭盔能激發信心,可以嘗試添加它。”

在提供“Cute baby octopus playing with cubes wearing a yellow safety helmet, logo, digital art, drawing, in a dark circle as the background, vibrant, cheerful, bubbles”(可愛的小章魚玩著戴著黃色安全帽的立方體、標識、數字藝術、繪畫,在一個黑暗的圓圈作為背景,充滿活力、歡快、泡沫)文字,並針對黃色頭盔優化後,得到了幾張非常不錯的圖像。

馬丁又想到,章魚並不習慣完“立方體、數據記錄”等東西,隨之他將這些數據立方體替換成了貽貝,得到下面圖像。

然後,在對貽貝的數量、大小(替換為 3D 形狀)和章魚眼睛做了替換、調整後,Dall-E 2 生成了可作為最終徽標(中間圖)的圖像。

據 OpenAI 之前公開的消息,每次使用 Dall-E 2 都會消耗積分。“用戶首月可獲得 50 個免費積分,後面每月也能免費得到 15 個積分。每個文本消耗一個積分,能讓 Dall-E 2 返回 4 張圖像。用戶還可花錢兌換積分,15 美元可兌 115 積分。”

馬丁在博文中表示,Dall-E 2 仍然處於“第一次迭代”階段,該模型進一步快速發展,須比現在便宜 10-100 倍。

值得一提的是,該模型生成的圖片可作為商業用途使用。如今,已經有人將 Dall-E 2 創造的圖片用在了兒童讀物的插圖、新聞通訊的藝術圖、遊戲的概念藝術和角色圖等方面。

參考資料:https://jacobmartins.com/posts/how-i-used-dalle2-to-generate-the-logo-for-octosql/https://openai.com/blog/dall-e-now-available-in-beta/

5
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 魔幻!通貨膨脹下,為讓孩子吃飽,英國媽媽一天只吃一頓飯……