
Interview with the CEO of "Hangzhou AI Six Little Dragons" Qunhe Technology: Physical AI is just the beginning of a new era, entrepreneurship is about first making the hammer, then changing the world

物理 AI 只是一個新時代剛開始。未來的世界,包括家裏、辦公環境,工廠全是具身機器人或者人形機器人;創業是拿着錘子找釘子,但你要先把錘子造出來;只有中國能沉澱這些數字資產,美國它沒有這麼龐大的工業體系,全世界可能找不到第二個國家有這麼龐大的規模。這規模大到他靠人工去生產不行,而得靠無人工廠自動去生產。
在杭州未來科技城的一隅,一家從閣樓裏成長起來的科技公司,正以 “數字孿生 + 物理 AI” 為畫筆,勾勒着全球機器人產業的新圖景。它是羣核科技 —— 被譽為 “杭州六小龍” 之一的空間智能領域隱形冠軍。
公司聯合創始人兼董事長黃曉煌日前接受央視《面對面》節目的深度採訪,透露他從 “拿着錘子找釘子” 到 “定義空間智能基礎設施” 的創業心路歷程。
以下是對談要點:
物理 AI 只是一個新時代剛開始。未來的世界,比如十年後或二十年後,設備全是智能化,包括家裏、辦公環境,工廠全是具身機器人或者人形機器人。
科技賽道里面,大家不是零和博弈的。大家一起合作,可能這個蛋糕會突然 100 倍、1000 倍大。
我其實在英偉達工作的時候,他整個公司的方法論都是先把很牛的技術做出來,然後花各種成本去找應用。所以我受的薰陶也是大概這種方法論,説白了就是拿着錘子找釘子。你先把錘子造出來。
我們得判斷這個賽道是有很多家,就是成千上萬家在做,還是就一兩家。如果就給一兩個大客户服務的話,就變成做項目了。我們還是希望夢想還是做一個產品型公司,而不是項目型公司。
我把他原來這種物理正確的渲染,從原來要半小時一小時才能出一張圖,變到 10 秒。
推動這個事情往前發展比賺多少錢更重要。我們相信有產生價值之後,未來一定賺得到錢。但是這個事情如果我們不去推動的話,全世界其他地方可能沒有這個資源,那永遠就卡在那邊了。
(為什麼你能沉澱下來找到這些數據而美國公司不行)這個是我們當時做到工業 4.0 時候實現的。所以這就讓我們在數字世界裏沉澱的所有數字資產,都是跟物理世界是一一對應的,而且能夠生產製造出來的。這個是是一個很重要的里程碑。
而美國它沒有這麼龐大的工業體系,我覺得全世界可能找不到第二個國家有這麼龐大的規模。然後這規模大到他靠人工去生產不行,而得靠無人工廠自動去生產。
以下是對談全文:
黃曉煌:
你可以看到就是這邊是模擬一個地震,你要訓練你的機器人在地震中不會摔跤,還能夠繼續工作。董倩:
為什麼要用這麼極端的場景訓練它呢?黃曉煌:
因為這個場景你是不太好在物理世界裏面模擬出來的,你又得確保這個機器人在地震的時候還能幹活或者不會出問題。你只能在這種數字世界裏面訓練,然後訓練完。畫外音:
浙江杭州,這個看似平凡的辦公空間,隱藏着另一個世界機器人的數字訓練場。這裏是羣核科技創業 14 年,因在空間智能領域積累了不容忽視的優勢,不僅躋身杭州六小龍之列,在國際上也有着舉足輕重的地位。黃曉煌:
我們覺得這只是這個新時代剛開始。董倩:
什麼新時代?黃曉煌:
就是物理 AI。物理 AI 新時代,剛剛開始
畫外音:
物理 AI 可以理解為懂物理規則的人工智能。只有懂了物理規則,自主機器如機器人、自動駕駛汽車等,才能在真實的物理世界中進行感知、理解和執行復雜操作。黃曉煌:
我説通俗一點,比如説你家裏面未來買了一個機器人替你幹活,他先要到你家裏面摔一個幾十跤,然後才能夠替你幹活。你怕不怕?你肯定很怕的那肯定是他需要在一個數字世界裏面先把該摔的跤,犯的錯誤都弄完了,然後再到你家去認真幹活。董倩:
你能做什麼?在這個過程中。黃曉煌:
第一我們得幫機器人做好訓練。我們就圍繞着這個未來世界在做提前佈局,讓人跟機器看到的是同樣一個東西。你現在看到的圖片是…… 人看到的對對,這下面的是機器人看到的,就是顏色比較深的地方是離你比較近的,顏色比較淺的是離你比較遠的地方。畫外音 :
黃曉煌作為羣核科技的聯合創始人兼董事長,解釋物理 AI 空間智能以及如何訓練機器人時,需要不斷通俗一點、舉例説明。在杭州六小龍爆火之前,他很少在媒體上露面,本質上他是一個技術痴迷者。黃曉煌:
通俗一點就是未來的世界,比如十年後、20 年後,你身邊的設備全是智能化,包括你家裏,你的辦公環境,你的工廠全是巨型機器人或者人形機器人,包括你的攝像機等等的,它是有一天都會智能化。董倩:
什麼叫攝像機的智能化?黃曉煌:
比如説今天攝像機後面還得坐了一個同事,過兩天他自己長了一個 “大腦”,自己在幹活,自己在拍、在對話。董倩:
你是要拆我的隊伍?黃曉煌:
那不會,他們可能一個人就管着十台相機,他有更高端的活要做了。你可以想象你周圍所有的設備現在可能都是死的,之後都是活的,他們在替你服務,每個機器人都需要訓練,他都需要感知這個環境。他們都需要在一個共同的數字化的物理世界裏面先做推演才能夠協作。不然你身邊有十個機器人天天 “亂幹” 你也不行。
董倩:
這個和你剛才描述的這個訓練有什麼關係?黃曉煌:
我們發佈的 Special LM 是用來幫設備去理解你的空間。畫外音 :
相比於理解訓練機器人這件事,理解羣核科技的創業過程要簡單很多。董倩:
為什麼?這三個詞是你們的公司文化,簡單、專注、開放。黃曉煌:
這也是當時提煉出來的,主要提的簡單,大家工作溝通上要簡單一些,就不要搞很多官僚。然後我可能提到專注,然後陳航可能覺得就是開放,後面大家都很認可,就這個公司的 DNA 後面就一直記下來了。畫外音 :
2007 年,黃曉煌從浙江大學竺可楨學院畢業,赴美國伊利諾伊大學厄巴納香檳分校攻讀博士學位,研究方向是用 GPU 圖形處理器做高性能計算。還沒完成學業,他就加入了英偉達,主要工作是給 GPU 芯片開發並行計算的編程框架以及生態的開發。但僅僅一年後,他做出了離開英偉達的決定。董倩:
這件事情你感興趣嗎?黃曉煌:
那很感興趣。董倩:
既然很感興趣,為什麼一年就離開了?黃曉煌:
因為當時英偉達它整個體系還是給台式機做的。你回到十年前,你可以想象當時所有媒體都在説未來是移動的時代,然後雲的時代。但是誰還會想着台式機可能筆記本都要消失了。然後我當時就跟組裏老闆説,為什麼不做雲計算,就是把 GPU 做到雲端去。為什麼還給台式機在做這些研究?那……
董倩:
為什麼這樣的一個想法英偉達沒有想到呢?黃曉煌:
我一開始也覺得很納悶,我覺得這個公司當時股價也很低。然後我當時覺得是不是有點老套了。董倩:
你覺得英偉達在當時是限制住了你的這個想法。對,在你決定離開的時候,你要做出多少準備你才能離開。黃曉煌:
我其實那時候年輕氣盛,也沒做太多準備。董倩:
你有什麼……黃曉煌:
當時啥都沒有,就是當時可能我覺得年輕人就是那樣子。有想法跟 Manager 聊完,他説公司暫時不打算往這方向做,這個雲計算也不做,Mobile 也不做,那還有未來嗎?那還是我自己做。先造錘子,再改變世界
畫外音:
2011 年,在主流觀點中英偉達仍是一家消費電子硬件公司。儘管當時傑弗裏・辛頓已經在用英偉達的 GPU 訓練深度神經網絡,但大多數人尚未意識到 GPU 的並行計算能力將成為未來人工智能爆發的算力基石。在這樣一個時間節點上,黃曉煌看到的是 GPU 的超級算力和雲端部署相結合的潛力。
他邀請一樣來自浙江大學的陳航,以及來自清華大學的朱浩共同創業。創業方向是用 GPU 做雲端的圖形圖像快速渲染。渲染指的是通過算法將三維模型或場景轉換為二維圖像或視頻的過程。
黃曉煌:
當時我把英偉達的股票也賣了,然後自己跟合夥人湊了幾十萬人民幣,夠嗎?那個年紀對錢不是特別有概念。董倩:
哪個年紀?黃曉煌:
我大概 25 歲。當時覺得幾十萬挺多的了,因為你看十多年前在國內幾十萬能買套房了。畫外音:
在很短的時間裏,年輕的創始團隊用低價顯卡集合成一個端雲協同的高性能 GPU 集羣,算力成本大幅降低,並實現了更快的計算速度。但那時投資圈熱門的概念仍是移動互聯網。黃曉煌在硅谷融資時,無一例外都遭到了拒絕。在最困難的時期,恰逢浙江省到硅谷招商引資,黃曉煌和夥伴們決定回國創業。黃曉煌:
然後這回國之後,我們就在了一個閣樓裏面創業。董倩:
怎麼回來還是閣樓?黃曉煌:
對,因為當年覺得比如説車庫創業,在閣樓裏創業很酷。後面覺得這環境完全不適合中國的這個生態。就是你員工來面試,你帶到一個卧室裏面是太奇怪了。畫外音:
2012 年,辛頓帶領學生在圖像識別大賽中用深度卷積神經網絡碾壓傳統算法,開啓了 AI 革命的新篇章,GPU 也因此一戰成名。通過與亞馬遜的合作,英偉達開始進入雲服務的戰場。彼時羣核科技的年輕團隊正奔跑在用錘子找釘子的路上,他們的錘子是利用 GPU 實現物理正確的渲染引擎。物理正確是指渲染出的圖在各種參數上與真實的物理世界相一致。黃曉煌:
我把他原來這種物理正確的渲染,從原來要半小時一小時才能出一張圖,變到 10 秒。董倩:
為什麼你堅持要物理正確這一點?黃曉煌:
因為物理正確它的通用性更強,穩定性更強。董倩:
對於你一個沉浸在技術中去研究的人,你有沒有想過這個技術和現實世界有什麼關聯?黃曉煌:
我當時其實沒想那麼多,也沒想那麼多,我其實在英偉達工作的時候,他整個公司的方法論都是先把很牛的技術做出來,然後花各種成本去找應用。所以我受的薰陶也是大概這種方法論,説白了就是拿着錘子找釘子。你先把錘子造出來。畫外音:
這把錘子可以用來做電影特效渲染,但收回成本的時間太長,也可以用於遊戲行業,但當時的手遊對畫質的要求並不高,最終他們的技術落垂在了家裝行業。黃曉煌:
我們得判斷這個賽道是有很多家,就是成千上萬家在做,還是就一兩家。董倩:
這有什麼區別?黃曉煌:
如果就給一兩個大客户服務的話,就變成做項目了。我們還是希望夢想還是做一個產品型公司,而不是項目型公司。董倩:
那為什麼家裝的企業他們需要你呢?而且他們成氣候呢?黃曉煌:
當時正好是中國房產的快速崛起的時候。所以他們簽單的時候,之前做一張效果圖可能要一星期,一星期可能早就被搶走了。所以但是快這個事情對他們來説就是時間,就是競爭力。董倩:
所以你們的出現恰好滿足了他們的需求。黃曉煌:
我記得我們第一次搞了一個線下活動,就拿着我們 Demo 去宣講,然後全場沸騰,然後就刷 POS 機,就燒壞了兩台機器。董倩:
刷 POS 機這件事兒聽起來都很美好,那就意味着日進斗金。你看重的是錢進來了,還是説市場出現了。黃曉煌:
市場出現了,有人真的為願意為此買單,説明這是真的需求,而不是嘴巴説説。畫外音:
然而隨着用户規模的擴大,對黃曉煌他們來説,技術挑戰也成指數級上升。黃曉煌:
我印象中最尷尬的是我去給客户現場演示,結果演示到一半服務器掛了,然後整個集羣掛了。然後只能説要上廁所,躲在廁所裏一直髮信息,修好了沒有,等修好了我再出來。董倩:
這個洋相出的背後是什麼問題呢?黃曉煌:
背後它其實還是要技術積累。我們遇到最典型的就是動不動温度會到 100 度以上,顯卡就開始罷工了。然後我們得想各種方案去幫他降温。作為這種探索者,確實有很多意料不到的問題,對於當時我們挑戰還是非常大的。畫外音:
2013 年,羣核科技推出了主打產品酷家樂,這款空間設計軟件憑藉其 10 秒快速渲染的能力一炮而紅,吸引了大量的設計師,成為大家居行業首選的設計軟件。董倩:
在這個過程中,你堅持物理正確的話,是不是也可以收集千家萬户的數據到你這兒來?黃曉煌:
我覺得我們更多的應該不叫收集,是沉澱。沉澱是他用我們的產品去做設計,然後他的工作就會在這邊不斷的累積下來。董倩:
它沉澱下來都是些什麼樣的數據?舉個例子。黃曉煌:
包括裏面的每一個零件,甚至哪裏要有一個釘子,就是哪裏要有一個鉸鏈,都是有這些數據的。畫外音:
家裝行業背後的產業鏈和數據規模的擴大,讓黃曉煌和團隊很自然的把技術優勢延伸到工業 4.0。物理正確的數據讓設計圖能直接對接工廠生產,而這一步又帶來更多的數據沉澱。黃曉煌:
我當時就隱隱約約覺得這東西一定有我們沒有發現的價值,我們就也一直組了一個科研團隊在裏面,一直在研究,也在發論文。董倩:
你在沉澱數據的同時,你也在對這些數據進行自己進行研究。黃曉煌:
研究看怎麼用。我們其實在 18 年之前內部也在討論,我明明躺着一個金礦是吧?但是就黃金提煉不出來,就是這個感覺。擁抱開放,才能跑贏時代
畫外音:
2018 年,基於自身業務海量的室內空間數據積累,羣核科技聯合國內外幾所高校共同推出 Interior Net 數據集。在此之前,國際上已經有不少知名數據集存在,但多數為靜態或不可交互數據。Interior Net 是少有的由可交互三維數據構成的數據集,也是全球最大的室內場景認知深度學習數據集,最重要的是它是免費開源的數據集。
黃曉煌:
就 18 年之前,我們完全不知道怎麼去訓練這個事情。那要不就把數據開放出來。董倩:
那你得到什麼?黃曉煌:
我們公司當時現金流是正的,就挺賺錢,也沒想那麼多賺錢的事情。然後第二,因為我們已經內部摸索了兩三年了,實在是沒有頭緒。與其爛在自己手裏,還不如大家一起來試試。也許某一刻就會有人腦子靈光一現,就把這事情發現。董倩:
為什麼你有這樣的想法?我寧願給別人用,也不願意爛在鍋裏。黃曉煌:
平心而論,我覺得就感興趣對我來説就是推動這個事情往前發展比賺多少錢更重要。我們相信有產生價值之後,未來一定賺得到錢。但是這個事情如果我們不去推動的話,全世界其他地方可能沒有這個資源,那永遠就卡在那邊了。董倩:
就是我自己做不到,那麼就匯聚全世界最優秀的大腦。從我這裏。黃曉煌:
得到是我覺得這些東西應該屬於全人類的一些財富。大家一起來把這事情突破了,然後後面誰能賺到錢,那就看你的命了,不然連機會都沒有。但是你如果藏着掖着,你自己也研究不出來,別人也沒有條件去研究,那不就是這個賽道就死了嗎?董倩:
有沒有可能你在藏着掖着的過程中,人家也開出礦來,甚至還比你大,你反而沒用了。黃曉煌:
是有可能,這風險也是存在的。你手裏至少還有礦,你知道別人能提煉出來,大不了合作,對吧?所以我們企業的價值觀一直都是開放,我們覺得特別是這種科技賽道里面,大家不是零和博弈的。是的,就是大家一起合作,可能這個蛋糕會突然 100 倍、1000 倍大。你這都不合作,大家可能啥都沒有。畫外音:
數據集開放後不久,羣核科技就收到了一封來自硅谷某科技巨頭的電子郵件,希望和他們進行合作。黃曉煌:
一開始以為是個騙子。董倩:
怎麼會有這種想法呢?黃曉煌:
因為根本就沒想過這種大個頭會找我們合作。董倩:
如果當時做一個對比的話,如果把它比大象,那你是什麼呢?黃曉煌:
可能螞蟻都算不上吧。董倩:
其實開源的作用馬上顯現。是的,當你貢獻了你自己的能力之後,人家就開始搭台階,你就可以一層一層就順着上去。黃曉煌:
是的,那肯定因為對於這種大個頭,他們的研究院那是比我們強大太多了。合作了之後他們發了論文,然後我們就看論文就知道,原來是可以這麼做的。這些實際上靠你自己的力量,就我們當時評估靠我們自己的力量是不可能實現的。畫外音:
當時該科技巨頭正苦於缺乏大量物理正確的合成數據做機器人訓練。這次合作讓羣核科技的數據集第一次應用在了空間智能訓練上。黃曉煌:
慢慢的大家也都發現這條路行得通。董倩:
嗯哪條路行得通。黃曉煌:
就空間訓練,就對於空間的理解,這條路是行得通的,而且對於合成數據是管用的。這個就意味着你未來所有的設備,它在物理世界裏面都產生智能。我不知道你十年前沒用過掃地機器人,原來他只能在家裏面按照某一個折線盲目的整個掃一遍。但是當時我看有一些學術裏的論文,就是説掃地機器人也可以像人一樣的,就是去理解你的環境。你叫他掃哪裏,他就知道去掃哪裏。比如説你讓他幫我那個桌子底下打掃一下,他總得知道哪是桌子。
那這時候他理解這個環境就很重要了當你周圍的設備能夠理解他眼前的世界之後,他可以有很多的新功能。我們首先得讓它變成一個蓬勃發展的一個巨大的生態,我們在裏面才能夠分到 “蛋糕”。
董倩:
所以你一己之力能把它變蓬勃,能把它變巨大嗎?黃曉煌:
我們不叫一己之力,我是為整個產業貢獻一己綿薄之力。不光是我們在做,應該整個產業都在做。就包括自動駕駛,其實也是這種機器智能的一部分,可能自動駕駛那個賽道的力量更大。畫外音:
在現實世界中,訓練機器人成本高昂,難以擴展,而使用數據訓練機器人則面臨高質量 3D 數據稀缺的瓶頸。合成數據因此是一種性價比更高且潛力無限的訓練數據來源。羣核科技推出的數據集被帝國理工學院、南加州大學、浙江大學等多所高校採用,成為室內 AI 視覺訓練中具有代表性的基礎設施之一。
董倩:
我有一個問題,為什麼你能夠找到沉澱下來這些物理正確的這些數據,而包括美國在內的一些公司他們沒有沉澱出來。黃曉煌:
這個是我們當時做到工業 4.0 時候實現的。所以這就讓我們在數字世界裏沉澱的所有數字資產,都是跟物理世界是一一對應的,而且能夠生產製造出來的。這個是是一個很重要的里程碑。而美國它沒有這麼龐大的工業體系,所以之前他們做的這種公司也沒什麼用。我覺得全世界可能找不到第二個國家有這麼龐大的規模。然後這規模大到他靠人工去生產不行,而得靠無人工廠自動去生產。
董倩:
所以説時代造就人,是有的時候你説你拿着這個錘子,你要沒趕上這個時代,可能就找不着這樣的一個釘子給你捶。黃曉煌:
是的,從某一方面來説也是比較幸運的。但是從另外一方面,我們就內心裏一直覺得這種技術是有價值的。畫外音:
2025 年 3 月,鈞和科技發佈並開源了自主研發的空間理解模型 Special LM。結合之前發佈的空間智能平台 Special Words,可以讓機器人完成從認知理解到行動交互的完整閉環訓練。隨着具身智能的爆發式增長,羣核科技有了新的可能,就是成為空間智能訓練的雲端基礎設施巨頭之一。董倩:
如果我們打一個比方,就是你的這個 Special LM 和 Special vers 加起來,它相當於我們現在大語言模型中的哪一個?黃曉煌:
Special verse 相當於説大語言模型的語料庫,Special LM 相當於説大語言模型的本身,目前應該還是比較初級的,我覺得差不多就屬於 GPT2.5—3.0 大概這個階段,我覺得。董倩:
但是你是獨一無二做這件事的對。黃曉煌:
所以我們後面會持續迭代下去。董倩:
那也就某種程度上,你就像 ChatGPT 這樣的公司。黃曉煌:
是的,但他們是封閉的,我們是開放的。董倩:
你的開放和他們的封閉會帶來什麼樣的不一樣黃曉煌:
我看中的是未來十年、20 年後我們的業務,我們先把基礎設施鋪好,然後我們真正的能力才能得到發揮。我覺得對於中國這一代的企業家來説,就是擁抱開源可能是能夠發揮更大價值的。董倩:
所以這又回到你創業的初衷是什麼?哪怕到現在你的驅動力是什麼?黃曉煌:
我們一直堅信你知道你的技術有價值,然後這個賽道蓬勃發展,你在裏面一定能夠分到一杯羹,而且做這東西你得感興趣,就即使失敗了,這個過程你也會很開心、很興奮,也很有成就感。最終即使沒賺到錢,那你也會覺得不枉此行。
