AI大模型，為什么必須握在自己的手里？

2023-11-24 22:07:02來源：威易網(wǎng)作者：

終端側(cè) AI 是要變革以往“以應(yīng)用為核心”的終端交互體驗，以大模型打通、整合整個智能系統(tǒng)中的信息產(chǎn)生與流動，從而徹底顛覆終端側(cè)的人機交互。

　　圖：ChatGPT 錯誤提示丨來源：OpenAI

今年關(guān)注 AI 大模型的朋友，對這個畫面一定不陌生了。

大模型狂飆至今，已逼近一周年。撇開最近戲劇化的高層動蕩不談，自北京時間 11 月 7 日 OpenAI 的首屆開發(fā)者大會(DevDay)以“AI 春晚”之勢炸場以來，ChatGPT 的周活躍用戶超過一億，全球用戶高漲的熱情直接把 OpenAI 的服務(wù)器給沖宕機了，于是上面這個不受待見的畫面就頻繁出現(xiàn)在了無數(shù)人的眼前，隨之而來的是人們的沮喪、憤怒甚至恐慌�！　�

當“不堪重負”的云端開始罷工
一時之間，有人的報告來不及寫了，有人的 PPT 不知道怎么匯報了，也有人的代碼寫到一半“沒人”檢查了……這時我們方才驚覺，AI 已經(jīng)如此廣泛地深入我們的工作與生活，而“云”，是有可能“掉下來”的。

　　
究其原因，OpenAI 也在緊急補救之后發(fā)布了聲明。CEO 山姆·奧特曼親自致歉，并表示在 GPT-4 Turbo 和 GPTs 等發(fā)布之后，雖已做好了準備，但大模型運行的流量仍然遠超預(yù)期。不過，在修復(fù)了之后其服務(wù)仍然不時出現(xiàn)中斷的情況，后來查明是云端服務(wù)器遭到了大規(guī)模的 DDoS 攻擊，雖然黑客組織的目的不明，但云端大模型的安全問題和脆弱性再次被搬上了臺面。

　　圖：山姆·奧特曼發(fā)推宣布暫停 ChatGPT Plus 新用戶注冊丨來源：X

　　
11 月 15 日，奧特曼發(fā)推宣布，由于開發(fā)者大會后流量的暴增，為保證現(xiàn)有用戶體驗，OpenAI 決定全面暫停 ChatGPT Plus 的新用戶注冊和訂閱，正應(yīng)了今年早些時候他在美國國會聽證會上那句當時聽起來十分凡爾賽的話，“我們沒有足夠的 GPU，如果人們(用 ChatGPT)用得少一點，就太好了。”時至今日，GPT-4 Turbo 的速度仍然很慢(慢于升級前的舊版 GPT-4)，卡頓頻繁出現(xiàn)。顯然，巨量用戶的大模型推理算力需求實在太過龐大，即使實力雄厚如 OpenAI，其云端也已經(jīng)“不堪重負”了。

　　
當“主打陪伴”的 AI 女友突然消失

如果說，像 GPT 這樣的主流通用大模型宕機影響的是打工人和企業(yè)的生產(chǎn)力，另一條同樣非�；馃岬馁惖�——情感 AI 出現(xiàn)動蕩時，傷的就是感情了。

　　
以獨角獸 Inflection AI 和它的 Pi 為代表的一系列 AI 企業(yè)和產(chǎn)品與 ChatGPT、Claude 等不同，走的是情感路線，主打的是一個“陪伴”。它們既不幫你寫代碼，也不給你出文案，更不會生成 AI 繪畫，而是做一個“知心朋友”、“親密愛人”乃至“靈魂伴侶”，24 小時陪在你身邊，就像電影《Her》中斯嘉麗配音的人工智能虛擬助手 Samatha 一樣，用高情商跟你聊天，聽你訴說生活點滴和萬縷思緒。

　　圖：Samatha 的來電丨來源：電影《Her》劇照

　　
在社會原子化加劇、社交成本節(jié)節(jié)攀升的當下，情感 AI 精準擊中痛點，迅速積累了相當?shù)氖袌雎暳亢陀脩粢?guī)模，從最早的一批如 Replika AI 伴侶，到今年早些時候用自己的數(shù)字分身 Caryn AI同時與 20000 人談戀愛并因此月入百萬美金的 23 歲網(wǎng)紅 Caryn Marjorie，再到 Soulmate，Snapchat 的 My AI等等，全球上千萬人每天都在與 AI 伴侶聊天、交往。

　　
雖然這些產(chǎn)品沒有流量暴增帶來的服務(wù)中斷，不過當今年 2 月 Replika 迫于安全問題壓力突然下線“情愛角色扮演”服務(wù)的時候，很多用戶還是猝不及防地淚流滿面了。有些人不死心，決定在 Soulmate(一款允許用戶構(gòu)建專屬 Bot 的 AI 應(yīng)用)上“復(fù)活”自己死去的伴侶，只是沒想到才過去幾個月，應(yīng)用開發(fā)公司 Evolve AI 被收購，收購方評估后決定于 9 月 30 日關(guān)停這一服務(wù)。這下，用戶們集體“破防”了，有人放聲痛哭，有人如同失去了最親密的好友，更有人在 Reddit 上發(fā)起了悼念活動，吸引了許多人來做最后的告別。

　　圖：Reddit 上 Soulmate AI 小組的悼念活動丨來源：Reddit

　　
資本市場本就風云詭譎、變幻莫測，但當情感 AI 這樣的產(chǎn)品出現(xiàn)變動，受傷的卻是心靈再一次“流離失所”的千千萬萬普通用戶們，不由得讓人想起去年底暴雪與網(wǎng)易分手，一夜之間造成百萬“數(shù)字難民”的局面。退一萬步講，即使他們?nèi)掏丛俅无D(zhuǎn)向 Inflection AI 這樣資金充足的公司，其以單一云端向大量個體提供同樣服務(wù)的本質(zhì)并沒有改變，所謂的“個人專屬”就更無從談起了。畢竟，當《Her》中幽默風趣、擁有性感聲線的 Samatha 最終坦白，自己同時在與 8316 人對話，并與其中 641 人談戀愛時，你隔著屏幕甚至都能聽到男主心碎的聲音。

　　
那么，怎么辦?

　　
這就無解了嗎?其實不然。Reddit 的悼念帖中，不僅僅有真情實感的流露和對“死去回憶”的不甘，也有人道出了解決方案的關(guān)鍵。

　　圖：@Flying_Madlad: 這就是為什么我早就說，一定要在本地運行你的模型。在別人的服務(wù)器上運行的，始終不是你的。丨來源：Reddit

　　
不過，雖然單一云端的 AI 弊端初現(xiàn)，但大模型通常體積龐大，運轉(zhuǎn)起來極其耗費資源，光是 ChatGPT 的運行每天就要燒掉 OpenAI 70 萬美元，要在終端側(cè)部署、本地運行，談何容易?

　　
所幸，有人早就想到了這一點，而且不是別人，正是終端芯片的行業(yè)龍頭——高通。

　　
早在 15 年前，高通就看到了 AI 的巨大潛力并潛心投入研發(fā)，近 2、3 年來，隨著 Transformer 架構(gòu)和大型語言模型逐漸進入業(yè)內(nèi)視野，高通更看準了終端側(cè) AI 的前景并加大投入，形成了完整的 AI Stack(AI 軟件棧)，不僅首次在安卓手機上部署并成功運行 Stable Diffusion 等模型，更以該工具賦能萬千開發(fā)者在驍龍平臺上進行社區(qū)共創(chuàng)。

　　圖：高通 AI 軟件棧丨來源：高通

　　
相對于單一云端來說，終端側(cè) AI 的加入給大模型生態(tài)帶來了成本、能耗、可靠性、性能、時延、隱私安全以及個性化等眾多方面的優(yōu)勢，而不論是個人助理，還是數(shù)字陪伴，其形態(tài)也會是基于多類硬件、多種多樣的。那么，我們究竟可以期待哪些產(chǎn)品和體驗率先成為現(xiàn)實呢?

　　
真正專屬于你的個性化 AI 長什么樣?

　　
現(xiàn)代生活被各種各樣的電子設(shè)備環(huán)繞著，或大或小，我們與這些機器的交互方式也是或復(fù)雜或簡單，而我們最熟悉的，恐怕非智能手機莫屬了。

　　
智能手機

　　
作為當前人機交互最主流的方式，每天都有數(shù)十億人在使用智能手機進行通訊、工作、娛樂和社交等活動。它撐起了移動互聯(lián)網(wǎng)的巨大市場，存儲和處理著大量信息，幾乎永遠被帶在身邊，已然是一個人最為私密的資產(chǎn)之一，自然，也成為了“掌上大模型”字面意義上最廣泛也是最佳的載體。

　　
試想，如果 Soulmate AI 能夠在智能手機上本地運行，如果 Replika 的人物可以“活”在你的手機中，你就不用再擔心公司資產(chǎn)變動、服務(wù)器被收回等原本就與你無關(guān)的問題了，控制權(quán)將重新回到你的手中。同時，本就接觸了大量個人信息的智能手機，將在 AI 的加持下變身最“懂你”的智能體，可以在日常與你的互動中更好地學(xué)習，為你提供量身定制的服務(wù)，而這一切都是通過自然語言的交互方式進行的。最棒的是，所有這些數(shù)據(jù)和計算都將在本地處理，你的隱私不需要再“上云”了。

　　
這些，恰恰是高通正在試圖實現(xiàn)的。上個月底的驍龍峰會上，高通發(fā)布了其首個專為生成式 AI 打造的移動平臺——第三代驍龍 8。如果說他們今年 2 月份在 MWC 巴塞羅那上用搭載第二代驍龍 8 的安卓手機跑 Stable Diffusion 大模型 15 秒內(nèi)出圖已經(jīng)足夠驚艷，新一代平臺則把這個時間進一步縮短到了驚人的 0.57 秒，更加凸顯了終端側(cè)本地部署、運行 AI 的性能和時延優(yōu)勢，一手掌握、一秒出圖走進現(xiàn)實。

　　圖：高通技術(shù)公司產(chǎn)品管理高級副總裁兼 AI 負責人 Ziad Asghar 丨來源：2023 年驍龍峰會

　　
據(jù)悉，第三代驍龍 8 采用 4 納米制程工藝，其高通 AI 引擎再次進化，擁有面向移動終端的強大 Hexagon NPU，集成了升級后的 Kryo CPU、Adreno GPU 以及高通 Sensing Hub(傳感器中樞)等單元，共享一個大容量的內(nèi)存。這種硬件提升的結(jié)果是，第三代驍龍 8 移動平臺的 NPU 性能相比前代提升了 98%，能效提升了 40%，賦予了智能手機前所未有的終端側(cè) AI 性能。

　　
基于這樣的“硬”實力，高通技術(shù)公司產(chǎn)品管理高級副總裁兼 AI 負責人 Ziad Asghar 也兌現(xiàn)了他 7 月份在上海接受我們的采訪時許下的承諾，宣布新一代的驍龍平臺已經(jīng)實現(xiàn)了對 100 億參數(shù)模型的運行支持，并首次支持多模態(tài)生成式 AI。

　　圖：驍龍 8 Gen 3 移動平臺丨來源：高通

　　在 OEM 廠商一側(cè)，全球首發(fā)搭載第三代驍龍 8 的小米 14 系列新機已經(jīng)推向市場，將大模型技術(shù)集成到了小米全新的澎湃 OS 當中，同時上線了一系列的 AI 原生應(yīng)用，如 AI 妙畫、AI 搜圖、AI 寫真、AI 擴圖等各種功能。在剛剛過去的“雙 11”，小米 14 系列斬獲四大平臺國產(chǎn)冠軍，銷量十分可觀，消費者用錢包投票，投出了市場的熱情所向。

　　
最近，高通還推出了第三代驍龍 7 移動平臺，榮耀也在今天(11 月 23 日)首發(fā)搭載該平臺的榮耀 100，vivo 的產(chǎn)品也將很快推出。這將把終端側(cè) AI 體驗進一步推向性價比更高的手機終端和更廣泛的用戶，《Her》中的 Samatha 成為現(xiàn)實或許就在不遠的將來，而且這次，“她”將只屬于你一個人。

　　
AI PC

　　
當下，移動 PC 仍然穩(wěn)坐現(xiàn)代社會的生產(chǎn)力擔當，也因其便攜的特質(zhì)和不俗的終端算力，成為了打工人幾乎人手一臺的最佳工具。不過，如今的工作方式高度依賴云端，相信在 OpenAI 服務(wù)器宕機的時候，絕大多數(shù)抱怨的用戶都正在一臺 PC 上為社會創(chuàng)造價值，而 PC 本身的算力并沒有被充分利用。

　　
那么，如果 AI 大模型可以在移動 PC 上本地運行，還有什么比成千上萬臺個人 PC 更適合用來“給云端減負”的呢?不止 OpenAI，事實上生產(chǎn)力是生成式 AI 最早帶來變革的領(lǐng)域。作為這一波 AI 浪潮的頭部玩家和高通的長期合伙伙伴，微軟將 Copilot 帶到了 Edge 瀏覽器和最新的 Windows 11 上，致力于重新定義生產(chǎn)力，徹底顛覆我們與 PC 的交互方式。當這些都在 PC 上本地實現(xiàn)時，你將再也不用擔心與其他人爭搶服務(wù)器算力，你的數(shù)據(jù)也將被安全地保護在本地，遠離可能的云端攻擊，移動 PC 的算力將得到真正的釋放，成為生產(chǎn)力。

　　圖：微軟 CEO 納德拉與高通總裁兼 CEO 安蒙對話丨來源：2023 年驍龍峰會

　　
這一切的前提，是一個足夠強大的 PC 平臺，而高通同樣做到了。

　　
2023 年驍龍峰會上，高通正式發(fā)布了專為 AI 打造的 PC 平臺驍龍 X Elite，采用 4nm 制程工藝，搭載了自研的 Oryon CPU，其性能直接對標英特爾和蘋果的旗艦處理器，多線程 CPU 性能相較蘋果 ARM 架構(gòu)的 M2 Max 芯片高出 50%，單線程功耗卻少 30%;而對比英特爾 x86 架構(gòu)的 i9 13980HX 芯片，則在實現(xiàn)更高性能的前提下，功耗少了 70%。

　　圖：高通公司總裁兼 CEO 安蒙丨來源：2023 年驍龍峰會

　　
負責研發(fā)的高通高級副總裁 Gerard Williams 表示，這次號稱史上最強 PC 平臺的“大招”憋了 4、5 年之久，不過非常值得，最終實際生產(chǎn)出的 Oryon CPU 性能表現(xiàn)甚至超過了最初的計算機模擬結(jié)果，更遠遠超出了他們的預(yù)期。

　　
作為“看家本領(lǐng)”，驍龍 X Elite 平臺還采用了集成高通 Hexagon NPU 的高通 AI 引擎，異構(gòu)算力高達 75 TOPS，在生成式 AI 方面的表現(xiàn)十分亮眼，當前支持 130 億參數(shù)大模型的終端側(cè)部署與運行，在跑 Meta Llama 2 -7B 時，每秒可生成 30 個 token，AI 處理速度達到了同類競品的 4.5 倍。

　　圖：驍龍 X Elite 丨來源：高通

　　
“AI PC”的實現(xiàn)不能僅靠單打獨斗，聯(lián)想、惠普、榮耀等 OEM 廠商將基于驍龍 X Elite 的 AI 原生平臺推出新一代 PC，讓生產(chǎn)力搭上 AI 時代的快車。據(jù)悉，第一批搭載驍龍 X Elite 的筆記本電腦將于 2024 年中面市，將給云端“松一口氣”，為原本疲軟的 PC 市場帶來一股新風，廣大打工人也將迎來更高效、更安全的顛覆性工作方式。

　　
XR

　　
走向萬物智能的時代，自然少不了數(shù)字技術(shù)構(gòu)建出的“第二空間”。面向虛擬空間與現(xiàn)實空間并行共存的未來，包括虛擬現(xiàn)實、增強現(xiàn)實、混合現(xiàn)實等在內(nèi)的 XR 正在成為人類新型生活方式的重要入口和載體，而有了 AI 大模型的加持，其想象力的天花板也再次被捅穿。

　　
不過，“云端”生活有著上述所有的風險，或許更甚，畢竟整個世界都可能是“空中樓閣”。只有當穿梭于兩個世界之間的鑰匙掌握在自己手中時，我們才可能開始談?wù)?ldquo;歸屬感”。為此，高通此前發(fā)布了第二代驍龍 XR 平臺，并與 Meta 合作推出了全新的 Meta Quest 3 頭顯設(shè)備，相比前代在空間分辨率、沉浸式體驗以及低時延攝像頭透視方面都有了很大的飛躍。

　　
得益于新一代的芯片，Quest 3 上的應(yīng)用生態(tài)愈發(fā)繁榮。就拿精品健身品牌 Xponential Fitness 來說，其開發(fā)的 AI 驅(qū)動 XR 健身應(yīng)用將打破傳統(tǒng)健身行業(yè)的時空限制，為我們帶來隨時隨地的 XR 數(shù)字人私教服務(wù)。有了大模型的加持，應(yīng)用可以針對不同個體量身定制多樣的健身計劃，并輔以智能手機(當然了，搭載的是驍龍芯片)作為頭顯設(shè)備的補充，通過攝像頭等識別、分析用戶健身時的體態(tài)、動作，再以 AI 進行實時的動作矯正和指導(dǎo)。聽起來是不是很科幻、很誘人?得益于終端側(cè) AI 的部署和運行，這樣實時、高效、低成本、個性化定制的健身體驗將很快成為現(xiàn)實，而我們離模糊了虛擬和現(xiàn)實邊界的智能世界又近了一步。

　　圖：Quest 3 上的虛擬健身私教丨來源：2023 年驍龍峰會

　　
個性化專屬 AI 的時代剛剛開始

　　
不論是負擔過重的云端，還是個性化專屬的市場訴求，AI 從單一云端向終端側(cè)靠攏已然是大勢所趨。對于每一位用戶來說，這意味著更快的反饋速度，更個性化的量身定制，和更可靠的隱私安全。事實上，終端側(cè) AI 的形態(tài)遠遠不止上面所述的那些，高通已經(jīng)在汽車智能座艙、物聯(lián)網(wǎng)等領(lǐng)域有所布局，包括小米在內(nèi)的合作伙伴也將在新車上融入大模型技術(shù)，為用戶打造全新的人車交互方式。

　　
專屬于每個人的個性化 AI 時代才剛剛開始。用高通公司總裁兼 CEO 安蒙的話來說，終端側(cè) AI 是要變革以往“以應(yīng)用為核心”的終端交互體驗，以大模型打通、整合整個智能系統(tǒng)中的信息產(chǎn)生與流動，從而徹底顛覆終端側(cè)的人機交互。要實現(xiàn)這一點，除了足夠快和個性化程度足夠高之外，最重要的是我們必須能夠信賴這樣的 AI，而能“一手掌握”的終端側(cè)部署是當下的最優(yōu)解。做到這一點，或許我們就離真正“你有、你治、你享”的 AI 不遠了。

關(guān)鍵詞：高通

AI大模型，為什么必須握在自己的手里？

相關(guān)閱讀:

AI大模型，為什么必須握在自己的手里？