“少數人” 的勝利,Midjourney 走上 AIGC 神壇

華爾街見聞
2023.04.26 14:33
portai
I'm PortAI, I can summarize articles.

Midjourney 的風格是簡單、直接、高效,所有精力集中在模型上,不做 app,也不做網站。

作者|於惠如 編輯|羅麗娟

如今,不知道 Midjourney 這家公司,似乎就不配談 AIGC。

不久前,AI 繪圖工具 Midjourney 發佈了第五代 V5 模型,由它生成的一張 “中國情侶” 圖片因效果酷似真人而火爆出圈。緊接着,又進一步宣佈推出針對二次元、動漫風格的版本。

圖源:網絡

新版 Midjourney,用户使用風格化命令,就能輕而易舉地生成大師級作品。以高頻迭代速度不斷優化使用體驗,一時間,針對 Midjourney 的極簡入門法則、使用攻略、進階玩法、變現指南等在網上被廣泛傳播。

大量新用户的湧入,再加上 GPU 臨時性短缺,導致 Midjourney 付費用户的服務陷入了癱瘓。為此,公司只好叫停免費試用。

有機構用 “產品效果驚豔” 評價 Midjourney。作為文生圖領域的 “領跑者”,Midjourney 由 David Holz 創立於 2021 年 8 月,僅擁有 11 名全職員工,成立至今未融過資,卻憑藉着付費訂閲的商業模式,實現年營收 1 億美元。

資料來源:The information 官網

就是這樣一個僅有 11 人的小公司,沒有任何外部重金投入,卻成為 AI 繪畫領域的 “當紅明星”,甚至將同類型的公司都甩在其後。

現如今,Midjourney 在聊天軟件 Discord 上已經積累了將近 1500 萬用户,這家公司也成了瞭解 AI 繪畫無法繞開的公司。

創始人曾兩次拒絕蘋果

“我們沒有壓力銷售什麼東西,也不用成為上市公司,只是為了未來十年能夠有一個家,可以從事很多比較有意義的、酷的項目,希望不僅是對我,還是對世界有意義,並且享受樂趣。” 一年半前,Midjourney 創始人 David Holz 在接受媒體採訪時表示。

在 David Holz 的藍圖中,他要打造的是一個 “想象力引擎”,他認為想象力是人們在世界上所需東西的重要支柱。而同時,人們可以把 AIGC 變成一種力量,擴展人類的想象力。

圖源:Midjourney 官網

Midjourney 官網上,關於 David Holz 的此前經歷的介紹非常簡潔:Leap Motion 創始人;NASA 和 Max Planck 研究員。

圖源:Midjourney 官網

"這很 Midjourney。” 一位 AIGC 領域創業者説,它的風格就是簡單、直接、高效,就像他們做產品的思路一樣:“所有精力集中在模型上,不做 app,也不做網站。”

高中時期的 David Holz 感興趣的是設計,也做過設計生意。上大學後,他學了與設計幾乎不相干的物理和數學。研究生期間,他希望能選擇與現實有關的專業,於是讀了應用數學專業。之後,他又攻讀了流體力學博士。

創業的想法很偶然。“有一次我不知所措,把所有的事情放在一邊。所以我搬到了舊金山,創辦了 Leap Motion。” David Holz 曾在接受媒體採訪時説。

Leap Motion 成立於 2010 年,彼時 VR、AR 行業還未開始火熱。兩年後,極具極客氣質的 Leap Motion 控制器誕生。這個看起來像 U 盤一般大小的盒子儘管看似毫不起眼,但一經展示便立即吸引了大量的關注。

這個控制器內裝有多種傳感設備,能追蹤到小到 0.01 毫米的動作,當你把手放在它正上方,便可以跟蹤十指動作,並藉助計算機視覺技術,讓你的手部動作投射在虛擬空間中。

這款充滿着想象和憧憬的產品推出後,Leap Motion 一炮而紅。2013 年經過 B 輪融資之後達到巔峯狀態,估值達到 3.06 億美元。

彼時,蘋果的 AR 項目還在初期,希望通過收購將優秀的團隊和項目整合到自己的項目中。然而理念的差異讓蘋果吃了閉門羹。這是 David Holz 第一次拒絕蘋果。

五年後的 2018 年,Leap Motion 已沒有昔日的名氣,但技術實力依然不弱。接到蘋果再次邀約之後,雙方開始了談判,但在交易進展到尾聲階段時,收購再一次叫停。

在之後的公開報道中,David Holz 間接解釋了拒絕蘋果的原因,他認為蘋果已經失去了創造力,甚至直言:“我永遠不會為那些傢伙工作,他們是魔鬼。”

MidJourney 的創始人大衞·霍爾茨 圖源:網絡

最終在 2019 年,David Holz 以 3000 萬美元將 Leap Motion 賣給了競爭對手 UltraHaptics。

Midjourney 是 David Holz 在 AI 藝術領域探索新機會的產物。

後面的這次創業,David Holz 沒有融資,但靠 “刷臉” 解決了 Midjourney 算力問題。

據報道,David Holz 給一個雲供應商的負責人發郵件,希望對方提供 10000 個 GPU。很快,Midjourney 獲得了雲供應商的支持,原因便是他們瞭解到 David Holz,知道他以前的創業經歷。

低使用門檻搶佔用户心智

“相比其他同類產品,Midjourney 的 Prompt 簡短,用户門檻低。” 一家第三方研究機構在其報告中寫到。

Midjourney 使用起來極為簡單,註冊 Discord 賬號之後,即可進入 Midjourney 頻道,隨後可以加入公測服務器。使用時,用户只需要輸入命令提示符,就可以生成對應的高品質圖形。它可以讓用户避開復雜的使用技巧,同時可以用算法讓機器想象你輸入命令的樣子。

這也是 Midjourney 能夠脱穎而出的地方。憑藉簡單的 Prompt,Midjourney 藉助 Discord 社區持續迭代,社區用户將近 1500 萬。

圖源:Discord

一位 Midjourney 使用者告訴全天候科技,Midjourney 給人的感覺是用起來簡單而且無約束,“有一種不可思議的力量和流動,就像一款能讓我上癮的遊戲。”

而在前述 AIGC 領域從業者看來,Midjourney 擁有遊戲的所有元素:能夠讓你想象任何實物的可靠核心圈層,魔咒一般靈巧的指令符,以及基於社區的開放文化。

Midjourney 生成的人物圖 圖源:推特賬號 Nick St. Pierre

為何不直接做一個 iOS 拍照應用?而是選擇 Discord 用户界面。最初其實是因為 Midjourney 團隊是一個遠程工作的團隊,所以建立了一個機器人。

後來,團隊用同樣的機器人在 Discord 上做了一個用户測試,得到的結果是:用户很喜歡這個實時交流想法,富有想象力的環境。這也讓 David Holz 看到了 Discord 體驗的神奇之處。

“我們發現人們真的喜歡一起想象,所以我們讓 Midjourney 更具社交性。我們有一個巨大的 Discord 社區,用户在這些共享空間中共同想象。” David Holz 曾在公開採訪中表示。

他認為,人們想要一起做事情,如果是在 iOS 平台去做,就必須做自己的社交網絡,這非常困難。但相反,如果用户想要自己的社交體驗,Discord 是很好的選擇。

作為一款適用於遊戲玩家一體化語音和文字聊天軟件,Discord 平台的社交屬性也讓 Midjourney 搶佔了更多的用户心智。“它在 Discord 上更像是一個藝術 AI 的社交空間,能夠讓它易於迭代、學習、發現和發展。” 上述 AIGC 領域從業者説。

Midjourney 生成的 “卡塔爾世界盃” 畫面。圖源:小紅書博主 Ai 船長

換言之,Discord 社區生態幫助了 Midjourney 的推廣。反過來,龐大的用户能夠根據自身需求針對性地訓練模型並快速迭代產品。

作為 AI 繪畫領域的兩個 “領頭羊”,人們總會把 Midjourney 和 Stable Diffusion 放在一起對比。

對比而言,Stable Diffusio 是一個免費開源的模型,完全免費、不限次數、任何人都可用的。因而,Stable Diffusion 的優勢在於其無需任何成本即可使用。

同時還可以在 GitHub 上找到完整的源代碼和文檔。另外,開源前提下,模型代碼迭代的速度也增快,優化效率高於閉源模型。

但缺點也顯而易見:如果沒有其它護城河,商業化問題難以解決,很容易成為別人前進的墊腳石。

而 Midjourney 則需要付費使用。和大部分軟件類應用類似,Midjourney 採用付費訂閲的模式,按月向用户收取費用,共有 3 種收費套餐:10 美元/月、30 美元/月、60 美元/月。

圖源:Midjourney 官網

相較而言,收費模式容易勸退用户,在社區支持和維護方面也遜於開源的 Stable Diffusion。

然而,相對封閉也成為 Midjourney 構建自身護城河的重要方式。因為沒有公開其源代碼,因此無法被廣泛地研究、改進和應用,Midjourney 積累的數據集具有獨家性,可以進行針對性訓練。

Midjourney 的成功或許包含了多種因素,比如:清晰的目標定位,快速在一個仍然混沌的市場中找到合適的產品形態;專注在有價值的具體業務方面,迅速形成技術優勢;找到一個有充沛流量的場景 Discord,實現低成本獲客,低成本營銷等。

想象力的空間已經打開,AIGC 的競爭越加激烈,Midjourney 還能贏在未來嗎?