聊聊AI浏览器
提供AI咨詢+AI項目陪跑服務,有需要回復1
大模型一直有個難以解決的問題:系統的知識是過時的,他們難以跟進最新的信息。
基于這個原因,ChatGPT以及DeepSeek都提出了聯網功能,只不過效果嘛絕不可能太好(絕不會有用會從CSDN搜尋程序員要的答案):
AI應用團隊的話,一般會使用爬蟲到各個目標網站整理信息,提前存入到知識庫,以保證AI應用的先進性,只不過這在特定領域是適用的,如果是泛問題,知識庫沒有信息的話,模型依舊會胡說八道。
在這個基礎上,事實上各個AI應用團隊對AI瀏覽器是有訴求的,于是就有很多公司在做相關功能:
- 2023年:Opera推出Aria,內置AI助手,支持網頁內容摘要和實時回答;
- 2024年:微軟Edge推出Copilot,嵌入生成式AI,提升生產力;
- 2025年:Brave推出Leo,支持網頁自動摘要和多功能助手;
其實,RAG的本質和搜索引擎是很類似的,也可以將AI瀏覽器理解為一個MCP應用,提供給AI產品調用即可。
PS:拋開瀏覽器提供接口給我使用這個點,我其實已經想不到太多瀏覽器的生存空間了,
我只有在不想看AI回答的情況下,才會去用搜索,而且一定不是瀏覽器搜索...
以上是AI瀏覽器誕生的一些背景,以及我的一些認識,接下來我們來具體的了解其中一些表現不俗的AI瀏覽器。
從Arc到Dia
The Browser Company 成立于2019年,融資1個多億,估值5.5億美金。
其核心產品是Arc,一款被極客喜愛的瀏覽器,被認為遠超Chrome的用戶體驗。
而在24年完成5000萬美金融資后,其毅然決然的放棄了Arc的研發投入,開始轉向為全新的AI瀏覽器研發。
同年,Dia瀏覽器發布,這也是現在被認為非常優秀的AI瀏覽器:
AI不會以一個應用或者一個按鈕的形式存在,它將是一個全新的環境——建立在網頁瀏覽器之上的。
這句話透露出一種堅定的信念:AI將不再是我們如今所見的簡單工具,而是將徹底重塑我們與技術互動的方式,成為一個無處不在、深度融合的全新生態。
在使用之前,瀏覽器會搜集很多個人傾向性信息:
我猜測,他會根據用戶的喜好,返回最合適的信息。
只不過使用下來,不知道是不是錯覺,感覺跟Manus想要達到的體驗很類似...
這其實都還是在走OpenAI的L3路徑:
L1級別(聊天機器人)。AI系統能夠進行基本的對話和交流,顯示出對自然語言的基本理解能力,并能對各種提示和問題作出響應。
L2:推理者(Reasoners)。AI系統能夠以人類專家的熟練程度解決復雜問題,標志著其從單純模仿人類行為升級到展現真實的智能水平。這些AI不僅擅長對話,更具備了解決問題的能力,其推理和決策能力已接近人類水平。
L3:智能體(Agents)。AI系統能夠承擔復雜的任務、作出決策和適應不斷變化的環境,并在無須持續人類監督的情況下自主行動。這一階段的AI不僅具備推理能力,更能自主執行各類復雜的操作任務。
與其說他是瀏覽器,不如說他是智能體...
AI需要瀏覽器
事實上,AI需要的不是瀏覽器,AI需要的是最新的知識庫,并且真人使用的瀏覽器與AI想要的瀏覽器非常不一樣。
比如Manus團隊之前就想打造一款適應于AI的瀏覽器,以便AI產品的體驗更好,最終他們也確實這么做了,這里以我的理解來說的話,與其說做了一個AI瀏覽器,倒不如說做了一個適應于AI使用的知識庫。
綜上,事實上我們是不需要AI瀏覽器的,我們只需要AI Agent,是AI Agent需要一個適應于他的瀏覽器(更確切的說是知識庫),比如browser-use、Nova Act SDK。
只不過,瀏覽器是極其重要的關鍵詞,因為他是一個非常好的入口,入口代表著流量,流量意味著爭奪,所以很多公司都在開始布局AI瀏覽器,其本質其實在爭奪下一個Agent入口...
事實上,從The Browser Company宣布放棄旗艦產品Arc、轉投Dia研發時就是一個非常重要的信號:瀏覽器已不再是單純的網頁容器,而正在經歷從"工具"到"智能體"的躍遷。
當AI出現那一刻,就宣布了傳統瀏覽器的死亡,因為三大核心交互正在變化:
- 信息獲取方式:從"用戶主動搜索"轉向"Agent預判需求";
- 交互界面:從"URL+網頁"轉向"多模態對話空間";
- 底層架構:從"頁面渲染引擎"轉向"實時數據處理器";
微軟Edge Copilot的代碼自動補全功能已展示這種轉變:當開發者輸入注釋時,AI直接調用GitHub最新代碼庫生成解決方案,整個過程無需打開任何技術文檔網站...
入口之爭
隨著AI Agent的崛起,科技巨頭紛紛布局,爭奪下一代用戶“入口”。現在有兩類玩家:
傳統玩家
對于已有入口占領者,會發揮好本來優勢:
- 微軟:將Copilot深度植入Windows內核,實現系統級Agent調用;
- 谷歌:通過Gemini重構Chrome,搜索結果直接呈現動態生成的3D模型演示;
- 蘋果:Siri升級為Proactive Agent,可跨設備預測用戶行為軌跡;
新秀玩家
與此同時,各種新興勢力也在沖擊這一領域:
- Dia瀏覽器:通過實時屏幕語義分析,在用戶點擊前預加載所需信息;
- Manus智能體:首創"認知沙盒"技術,可并行運行多個Agent處理復雜任務;
- Nova Act SDK:提供跨平臺Agent運行時,打破瀏覽器與本地應用的界限;
這些公司通過不斷擴展AI Agent的能力,推動用戶體驗的提升,爭奪用戶的核心“入口”,這個行為不再局限于操作界面,而是進入了工作流、決策支持和深度集成的層面。
具體到行業應用,AI Agent在各領域中的應用正以驚人的速度改變傳統的用戶體驗。
例如,在醫療行業,AI Agent能夠分析患者的病史、癥狀,并根據最新的醫學研究提出精準的治療建議。
在教育領域,AI Agent通過個性化學習路徑幫助學生提高成績,在金融行業,AI Agent可以幫助金融顧問根據實時數據做出投資決策。
在這些應用中,AI Agent的存在不再是“工具”,而是用戶的“合伙人”。用戶不再只是被動接受信息,而是通過AI Agent主動獲取、分析和執行任務,這使得用戶體驗變得更加智能化、動態化。
盡管AI Agent的前景廣闊,但它的發展仍面臨諸多挑戰。其中包括如何解決隱私保護問題、如何確保數據安全、以及如何實現算法的透明性等...
總結
- 上一篇: debug与DOSBox安装&&
- 下一篇: codeup之C语言10.1+C语言10