文/陳鋒
(資料圖片)
編輯/子夜
這幾天,金沙江創(chuàng)投董事總經(jīng)理朱嘯虎和獵豹移動(dòng)CEO傅盛關(guān)于大模型的討論備受關(guān)注。
杜克大學(xué)電子與計(jì)算機(jī)工程系教授陳怡然總結(jié)了他們的觀點(diǎn),朱嘯虎認(rèn)為看不到創(chuàng)業(yè)公司的機(jī)會(huì),因?yàn)榇竽P蛥?shù)多,所需算力大,而模型、算力、數(shù)據(jù)三大支柱都向大廠商集中,而傅盛認(rèn)為大模型催生了很多新的架構(gòu)在大模型之上的創(chuàng)業(yè)機(jī)會(huì),包括直接在大模型上搭建不同應(yīng)用,和由于數(shù)據(jù)隱私帶來的垂直領(lǐng)域的大模型等。
這場大討論的背景是,大模型爆火出圈半年,熱潮已經(jīng)席卷了整個(gè)市場,大廠和創(chuàng)業(yè)者跑步進(jìn)場,在這波大浪中尋找機(jī)會(huì)。
一方面是不斷涌現(xiàn)的大模型。中國科學(xué)技術(shù)信息研究院5月發(fā)布的《中國人工智能大模型地圖研究報(bào)告》顯示,截至5月28日,國內(nèi)10億級(jí)參數(shù)規(guī)模以上基礎(chǔ)大模型,至少已經(jīng)發(fā)布了79個(gè),“百模大戰(zhàn)”正徐徐展開。
另一方面,踏入大模型浪潮的玩家們也在思考,大模型將為世界帶來哪些改變、將在各行各業(yè)中產(chǎn)生怎樣的作用、這些作用將怎樣發(fā)生。
目前來看,作為最大的AI應(yīng)用場景,大模型對(duì)搜索行業(yè)的改造進(jìn)度最快、效果最明顯,也最具啟發(fā)意義。
自2月份微軟宣布推出新必應(yīng)、開啟ChatGPT+搜索模式以來,谷歌、百度、Opera等紛紛跟進(jìn)。
而且各大廠商均表示,將AI技術(shù)集成到搜索引擎只是第一步,未來將有更多的AI功能集成到瀏覽器中。比如百度在 5 月份開始內(nèi)測“AI伙伴”和“AI BOT”等功能,同時(shí)還有集成以上功能的NEW App。
值得注意的是,對(duì)搜索企業(yè)而言,接入大模型帶來的效果很顯著。
在當(dāng)前百度搜索每天已有的問答需求中,首條滿足的比例已達(dá)到70%,半年前這個(gè)比例只有40%,開年以來,百度搜索日均新增問答需求超過3000萬次。
在這背后,最先被改造的搜索行業(yè),已經(jīng)來到了代際變革的拐點(diǎn)時(shí)刻,而作為中國最大搜索公司、也是布局大模型最久最深的百度,已經(jīng)走在了這輪顛覆式變革的最前沿。
1、搜索與大模型,并非對(duì)立關(guān)系
2022年底,ChatGPT爆紅之后,其在編程、文本生成等NLP領(lǐng)域展現(xiàn)出的強(qiáng)大能力,在部分行業(yè)引發(fā)了擔(dān)憂。
搜索行業(yè)是其中之一。由于ChatGPT擁有基于對(duì)話形式接收指令并輸出結(jié)果的能力,與傳統(tǒng)的搜索引擎功能具有一定的重合性,關(guān)于“ChatGPT會(huì)不會(huì)影響搜索引擎”的討論,一度甚囂塵上。
谷歌積極擺出了防御姿態(tài),針對(duì)OpenAI的攻勢,谷歌管理層發(fā)布了“紅色代碼”警報(bào)。在硅谷,這意味著拉響了火警。
不過過去半年以來,大模型創(chuàng)業(yè)熱潮下,業(yè)界對(duì)大模型應(yīng)用場景的探索也在不斷加深,對(duì)大模型所能帶來的顛覆性變化,認(rèn)識(shí)也更加清晰,這同時(shí)幫助人們解開了一些疑惑。
比如生成式AI并不會(huì)搶走搜索的生意,反而,當(dāng)大語言模型應(yīng)用到搜索引擎,能夠帶來更大的想象力。
近日,在微博、新浪新聞聯(lián)合推出的“新智者首席Time”欄目上,百度集團(tuán)副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽指出,大語言模型跟搜索結(jié)合之后,能夠提升搜索效果,而且用戶是買單的。
“我覺得大模型+搜索是個(gè)飛輪,百度一手有搜索,一手有文心一言大模型,可以比喻為,倚天劍和屠龍刀雙劍合璧,會(huì)產(chǎn)生更大的價(jià)值?!毙り柸绱苏f道。
背后的邏輯在于,在大算力、大模型、大數(shù)據(jù)的技術(shù)支持下,會(huì)導(dǎo)致AI的“智能涌現(xiàn)”:
過去的人工智能是,我想讓機(jī)器學(xué)會(huì)什么技能,就教它什么技能,教過的有可能會(huì),沒教過的就不會(huì)。而在大模型出現(xiàn)“智能涌現(xiàn)”之后,以前沒有教過的技能,它也能掌握。
按百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏的說法,在這一過程中,人工智能的發(fā)展方向會(huì)從辨別式走向生成式。而搜索引擎就是典型的辨別式,也因此,搜索被普遍認(rèn)為是當(dāng)前AI最大規(guī)模的應(yīng)用場景。
也就是說,AI非但不是搜索引擎的對(duì)手,而且還是搜索引擎接下來新故事的起點(diǎn)。
搜索公司現(xiàn)在面臨的一個(gè)必要性的挑戰(zhàn)在于,如何讓大模型與搜索的飛輪轉(zhuǎn)得更快,如何通過大模型打造更前沿的搜索能力,賦予用戶更好的搜索體驗(yàn)。
尤其對(duì)百度、谷歌等頭部搜索玩家而言,他們有必要走在最前面,用AI思維重構(gòu)搜索,通過大模型的顛覆能力,引領(lǐng)搜索體驗(yàn)的代際變革,引領(lǐng)行業(yè)的顛覆式創(chuàng)新。
這也是他們現(xiàn)在正在做的事情。前段時(shí)間的萬象大會(huì)上,肖陽指出,在百度搜索多年深厚積累的基礎(chǔ)上,百度將語義檢索技術(shù)與大語言模型結(jié)合起來,搜索的理解、推理、組織甚至創(chuàng)作能力都釋放出了巨大的潛力。
在肖陽看來,語義檢索技術(shù)與大語言模型的融合,標(biāo)志著搜索的奇點(diǎn)時(shí)刻已經(jīng)來臨,搜索行業(yè),也將迎來新一輪代際變革。
2、推動(dòng)搜索代際變革
搜索代際變革,頭部搜索公司如何做,將成為行業(yè)的風(fēng)向標(biāo)。
因?yàn)樗阉魇恰榜R太效應(yīng)”十分明顯的行業(yè),擁有用戶、技術(shù)、數(shù)據(jù)、算力的公司將獲得最多用戶,并且很難被后來者趕超。
大模型也有類似的特征,其需要算力、算法、數(shù)據(jù)積累,資金與技術(shù)門檻都極高,具備資金規(guī)模、技術(shù)積累等多重要素的企業(yè),優(yōu)勢會(huì)進(jìn)一步凸顯,并持續(xù)擴(kuò)大。
就目前來看,在中國市場,最具有代表性的玩家是百度。
一方面,百度搜索引擎在國內(nèi)的市場份額長期保持第一且遙遙領(lǐng)先;另一方面,今年3月,基于文心大模型3.0打造的百度新一代知識(shí)增強(qiáng)大語言模型“文心一言”公開邀測,時(shí)隔三個(gè)多月,文心大模型3.5版本即取得了效果、功能和性能上的全面提升。
無論是市場份額的領(lǐng)先,還是在這波大模型浪潮中的率先前行及探索,根源上都來自于技術(shù)積累。
“百度是技術(shù)的信仰者,信仰技術(shù)的長期主義。只要你在技術(shù)這條路上一直往前走,總會(huì)有反饋。你讓用戶滿意了,用戶就會(huì)留下來。搜索引擎用戶遷移的成本是最低的,也正是因?yàn)檫w移成本低,而且這個(gè)事又很難、投入很大、數(shù)據(jù)壁壘高,才會(huì)產(chǎn)生馬太效應(yīng),用戶用腳投票,隨時(shí)可以走,但最強(qiáng)者會(huì)獲得最多的用戶。”肖陽說道。
他還表示,百度只要自己努力,利用好自身的條件,不斷拓展搜索邊界,被顛覆的可能性,就是自己對(duì)自己的顛覆。
而回顧百度搜索的變遷就不難發(fā)現(xiàn),過去多年,百度搜索一直在進(jìn)行邊界探索,始終走在行業(yè)搜索變革的最前沿。
從早期推出百度貼吧、百度知道、百度百科,以及上線圖片、新聞、flash、文檔等搜索入口,到后來提出“框計(jì)算”概念,到 2017 年以后開始重押AI,都推動(dòng)百度搜索從最初輸入文字匹配一個(gè)網(wǎng)頁結(jié)果的列表,逐漸進(jìn)化成一個(gè)智能搜索引擎,對(duì)問題的理解和包容力不斷提高、內(nèi)容和服務(wù)也更加準(zhǔn)確豐富。
再到如今,百度搜索積極探索與大模型的融合,成為推動(dòng)搜索行業(yè)代際變革的核心力量。
我們看到,目前,一些顛覆性的新變化已經(jīng)出現(xiàn)。
比如在文心一言的加持下,百度搜索引擎的思考能力大大提升,“極致滿足”的效果得到逐步提升。
舉兩個(gè)例子。如果你想找一部教小朋友畫畫的藝術(shù)動(dòng)畫片,過去你需要自己花時(shí)間搜索、瀏覽、篩選、判斷和總結(jié),現(xiàn)在百度搜索可以為用戶整理多個(gè)答案,并標(biāo)注每個(gè)答案被提到的次數(shù),減少用戶無謂的精力損耗。
如果你想查類似于“遼寧本溪往年十一月天氣”這樣冷門的問題,百度搜索引擎能夠提供數(shù)據(jù)趨勢圖,避免用戶分別搜索、比較和計(jì)算。
也就是說,相較以前,百度搜索理解用戶自然語言的能力變強(qiáng)了、理解內(nèi)容的能力變強(qiáng)了、回答能力也變強(qiáng)了。
正如肖陽所說,“我們希望搜索引擎就像一位勤奮的全能學(xué)者,通過閱讀、理解、推理和總結(jié)海量的知識(shí),充分理解用戶的需求,并對(duì)信息進(jìn)行整理和加工,讓更多、更復(fù)雜的問題在第一條搜索結(jié)果中得到全面滿足”,百度搜索正逐步朝著這一方向邁進(jìn)。
3、越強(qiáng)大,越簡單
更強(qiáng)大的搜索引擎應(yīng)該是怎樣的?業(yè)界過去半年的探索,在某種程度上已經(jīng)指明了方向:
搜索引擎需要比之前變得更加聰明,能夠更好地理解用戶的自然語言,讓用戶通過最短的操作流程得到最佳的結(jié)果。
同時(shí),AI時(shí)代的搜索引擎不應(yīng)該只是一款工具,它需要向用戶提供“搜索”之外的外延價(jià)值,提供除了搜索行為之外更多的可能性。
換言之,越強(qiáng)大的搜索引擎,能夠讓事情變得越發(fā)簡單。
正如肖陽所言,百度在推動(dòng)搜索變革時(shí)一直在思考,能不能讓用戶找到所求的全過程,再極致一些,再簡單一些,再高效一些,讓AI普惠到每一個(gè)人,幫助每一個(gè)人成長,讓復(fù)雜的世界變得更簡單。
基于這一思考,過去二十年至今,百度圍繞搜索進(jìn)行的探索,聚焦為三點(diǎn)。
一是不斷降低用戶表達(dá)需求的門檻,讓每個(gè)人都能以更自然的方式表達(dá)搜索需求;
二是降低用戶獲取內(nèi)容和服務(wù)的門檻,通過各種手段提供更極致便捷的滿足方式;
三是豐富搜索引擎的內(nèi)容供給,建立生態(tài)機(jī)制,使商家、機(jī)構(gòu)等參與者都能與用戶精準(zhǔn)匹配。
我們也看到,除了百度搜索引擎思考能力的提升,帶來的提供“極致滿足”能力的完善,百度還為搜索行業(yè)帶來了新的變革方向。
比如當(dāng)下正在內(nèi)測的“AI伙伴”,就是一個(gè)集低門檻、多能力于一體的AI產(chǎn)品。
連線Insight注意到,“AI伙伴”并非只是一個(gè)單純的人機(jī)交互的對(duì)話窗,從娛樂到職場、到學(xué)習(xí)、甚至到命理、情感,幾乎生活中任何領(lǐng)域,都有所涉及。
用戶一方面能夠通過這一入口與AI進(jìn)行語音互動(dòng),它能聽懂用戶的任何問題,據(jù)肖陽此前的介紹,其還能幫助用戶標(biāo)記答案中的重點(diǎn),同時(shí)提供權(quán)威來源;另一方面,基于豐富的應(yīng)用,用戶也可以根據(jù)自身意圖進(jìn)行圖片、文案等方方面面的內(nèi)容創(chuàng)作。
值得注意的是,目前這一平臺(tái)還支持普通用戶自己創(chuàng)建應(yīng)用,門檻極低且操作便捷。
不難發(fā)現(xiàn),無論是“極致滿足”功能,還是全能的“AI伙伴”,在大語言模型為搜索帶來的革命性變革中,用戶能直觀感受到體驗(yàn)上的代際進(jìn)步,對(duì)搜索行業(yè)而言,這才是變革最大的意義所在。
與此同時(shí),針對(duì)B端用戶,百度搜索還提出了新的解決方案——AI BOT,通過大語言模型和 AI技術(shù),為各行各業(yè)的內(nèi)容和服務(wù)提供者深度賦能,降低他們與搜索融合的門檻。
據(jù)悉,目前其已經(jīng)有創(chuàng)作者、商家、機(jī)構(gòu)、服務(wù)和品牌等多種類型的AI BOT。
“他們能夠利用自身優(yōu)質(zhì)、獨(dú)特的內(nèi)容、知識(shí)和服務(wù),直接回答用戶的問題,建立更高的信任度,促進(jìn)C端用戶和B端伙伴之間建立更緊密的聯(lián)系。而且,所有這一切變得前所未有的簡單?!毙り柸绱吮硎?。
綜上所述,作為當(dāng)前搜索行業(yè)代際變革的引領(lǐng)者,百度搜索的進(jìn)化,是我們觀察大模型如何賦能各行各業(yè)的一個(gè)視角。
近日,在出席“世界互聯(lián)網(wǎng)大會(huì)數(shù)字文明尼山對(duì)話”會(huì)議時(shí),李彥宏就指出,相比起大模型的數(shù)量,建立在大模型基礎(chǔ)上的AI原生應(yīng)用,將更加重要。
這也是當(dāng)前的業(yè)界共識(shí),即大模型成為了人工智能時(shí)代的操作系統(tǒng),所有應(yīng)用都將基于大模型開發(fā),模型之上是應(yīng)用層,包括各種各樣的AI原生應(yīng)用。
可以預(yù)見的是,接下來,大模型在不同行業(yè)所帶來的代際變革,將同時(shí)在C端和B端,都提供直觀的變革體驗(yàn)。
在C端,這種體驗(yàn)是比以往更優(yōu)質(zhì)的服務(wù),在B端,則是比以往更深程度的降本增效。
關(guān)鍵詞: