|
||||||||||||||
任超|撥開ChatGPT迷霧 | ||||
![]() |
||||
發布時間: 23-04-27 11:46:07am 文章來源: 《企業家》 雜志 | ||||
文丨任超 2023年,ChatGPT頂替元宇宙的地位,從技術界成功破圈,站上C位。它驗證了AI算法是可落地的,給AI、互聯網等領域帶來新的故事,產生了新的想象空間。在這里,我將從價值和問題的角度出發,嘗試撥開ChatGPT的迷霧,盡力找出真相。
從發展上看,ChatGPT既重要也不重要。重要的是,它不僅是AIGC(Artificial Intelligence Generated Content,利用人工智能技術來生成內容)方向的重大突破,在應用層上的亮眼表現也成功做出AI領域To C方向的表率,消除了社會對AI應用和其商業化的疑慮;不重要的是,ChatGPT并不是嚴格意義上的AI革命,只是模型和場景應用的一次飛躍,底層三要素(算法、算力、數據)并沒有改變,且當前仍存在諸多問題。目前,ChatGPT僅覆蓋文字和圖片,無法適用于多模態信息和跨模態生成。
不可否認的是,ChatGPT已經帶來了極大的價值。它向一直找不到To C場景并逐漸對To C方向失望的AI從業者們證明了:奇點已到,AI已經可以和人類展開有效互動了。ChatGPT能夠理解的人類意圖,產生有效互動,依舊離不開數據、算力、算法、模型、場景這五個要素,其中主要在模型和場景方面做出了突破。在對話中,ChatGPT主動記憶對話內容信息,結合上下文理解,通過預測下一個詞語或短語的出現概率,基于在大型文本語料庫中學習到的語言模式,生成自然語言文本,并輔助假設性問題的回復,進而實現一問一答的交互對話。并且在過程中,將人類的反饋納入模型訓練過程,使得模型輸出與用戶意圖更好地保持一致。2月11日,斯坦福大學的計算機科學家米哈爾·科辛斯基(Michal Kosinski)在一篇名為《心智理論可能從大語言模型中自發涌現》的論文中,通過心智理論的驗證,證明ChatGPT已經有9歲孩子的心智,這標志著AI已經進入一個嶄新階段。
雖然ChatGPT發展迅速,但是,我們需要認識到尚且存在諸多根本問題。
第一,數據集的局限性導致AGI(Artificial General Intelligence,通用人工智能)僅僅走出關鍵一步,遠未成熟。模型數據集的來源是維基百科、書籍、期刊、Reddit鏈接、Common Crawl以及其他數據集(如論壇對話、視頻字幕等),只包括了人類創作的以文字為主的數據,尚未涉及其他模態數據,更不用說非人類創作的數據了。以此種數據集為基礎,結果大概率會出現偏見。
第二,ChatGPT答非所問、似是而非的回答層出不窮,目前更多作為娛樂使用,遠達不到工具層次,更不用說替代人類了。從生成結果看,ChatGPT得出的結論更多是基于一定邏輯的信息重組,并沒有實現知識創造,這必然會引發如知識產權等一系列問題。從產品角度看,用戶若因為嘗鮮而使用,使用黏性和使用生命周期有待商榷。很難想象,用戶出于完全信任ChatGPT給出的結論,進而做出決策。
ChatGPT帶來AIGC方向的重大突破,革新了數字文化創作的生產范式,也改變了用戶與人工智能的交互模式。目前,ChatGPT已經滲透到傳媒、電商、娛樂等各個行業
第三,將對社會穩定造成極大影響。對于處在“信息鴻溝”中的人群而言,ChatGPT的泛濫回答并不是什么好事情,安全隱私受到沖擊、謠言層出不窮、難以監管等現象大概率會出現。
第四,在新的商業模式尚未出現的時候,當前商業模式遭受沖擊。當前的商業模式建立在價值流的基礎上,即價值生產流向價值消費,其中價值生產的稀缺性提升了價值從生產到消費的勢能,推動了商業發展。但ChatGPT的出現,使價值生產尤其是信息的價值生產大眾化,降低了從價值生產到消費之間的勢能,導致價值流動形成新方式,從而影響原有商業模式。例如,當用戶在搜索頁面精準獲取結果時,搜索所建立的競價排名則無用武之地,如果廣告進入生成式AI系統,模型也需要進行相應調整,當進入的品牌達到一定規模,結果的精準性也將大打折扣。
第五,生成式AI的模型黑盒可能導致人類失去對AI的控制。相比之下,人類學習的路徑是清晰、可干預、可考核的,過程也是可控的。但是對于生成式AI,我們尚不清楚它們的學習機制和過程,相對難以把握其最終學習結果。
換個角度,如果放眼未來,ChatGPT極具潛力,生成式AI也必然會成為人類的有力工具?紤]到當前存在的技術問題,它們的發展方向可能有如下幾種。
第一,若AGI方向不變,必然會對底層數據集提出更高的要求。一是數據會延伸到更多模態;二是將囊括環境及機器產生的數據,以環境數據為基礎提供答案,或實現機器之間的交互;三是ChatGPT產生的數據進入數據集后形成自閉環,提升了知識創造能力和AI學習能力。
第二,以通用為目標,以垂直領域為切入口,先垂直再通用。先對垂直領域的各維度和各模態數據進行整合,針對垂直領域特征進行模型調教,在垂直領域中實現AI工具化,而后連接各垂直領域,逐漸實現通用化。
第三,通過工程化技術大幅降低成本,包括數據成本、算力成本、訓練成本等。
第四,以工具為起始點,逐漸形成新的商業模式。生成式AI將率先賦能生產型企業,提升客服、廣告行業的整體效率。而對于平臺型企業來講,需要打造生成式AI能力,從而賦予生產型企業更強的能力,降低企業成本,在平臺價值勢能降低的情況下,提升價值流動的動能,為平臺上的用戶提供更有效的價值消費。
那么,國內企業在LLM(大型語言模型)上是否存在彎道超車的可能?目前看比較困難。在追趕的道路上,資金反而不是最重要的因素。從云到LLM模型再到平臺層和應用層,國內企業還有漫長的路要走。
從時間上看,2015年成立的人工智慧研究公司OpenAI,于2018年推出GPT-1模型,2020年推出GPT-3模型,直至2022年ChatGPT上市,歷經近8年時間。即使AI三要素仍沒有得到突破,但是隨著規;瘧,訓練成本將大幅降低,加之算力仍是被“卡脖子”的技術,國內企業要實現短時間內在模型上追齊國外,困難程度較大。最重要的是,國內的內容數據集在規模上存在短板,質量參差不齊。
從規模上看,國內用戶主動生成的內容數據還無法與海外相比,原創知識類文字內容占比并不高。從質量上看,在優質內容、內容維度、內容標注等方面存在一定缺陷,導致模型使用效果不佳。場景應用只是表象,完備的數據集、超強算力、優秀的算法才是根本,要突破模型開發能力和調教能力。一旦夯實根基,經過長時間蟄伏,有突破欲望的企業才有可能與海外企業一較高下。
另外,企業對于LLM模型的定位和目標也是必要的影響因素之一。如果沒有明確的方向,很難形成有效規劃和風險規避手段。若僅希望短時間內產生商業價值,形成賣點,賺個吆喝,那么,所謂的彎道超車不過是一個市場營銷手段而已。
但是,ChatGPT通過在應用層包裝后實現商業化,這是中國企業比較擅長的領域。例如,ChatGPT與數字人結合,可以陪伴用戶或協助用戶解決問題,賦能更多有創作天分的用戶,生產更多內容等。盡管如此,衷心希望我國有更多企業能夠錨定根技術,形成自身技術壁壘,推動我國AI的發展,不斷提高AI生產力。
|
||||
【關閉窗口】 |
中國企業聯合會、中國企業家協會 地址:北京市海淀區紫竹院南路17號 郵編:100048 中國企業聯合會信息工作部 技術支持 京ICP證 13027772號 |