新科技速遞|   首次超越閉源下載火爆     開源大模型迎Linux時刻

新科技速遞| 首次超越閉源下載火爆 開源大模型迎Linux時刻

Table Of Contents
Meta行政總裁朱克伯格
Meta行政總裁朱克伯格:Llama 3.1 405B 是Meta 至今最強大的開源人工智能模型,性能測試更直逼GPT-4o 和Claude 3.5。

[新科技速遞]

Meta開源了史上參數最多的Llama 3.1 405B,參數達4,050億,上下文長度128K,支援8種語言,性能上超越GPT-4o。Meta行政總裁朱克伯格宣佈推出Llama 3.1,與Linux相提並論。朱克伯格認為,Llama 3.1會成為未來創新的基礎技術。

Linux在開源是行業標準,Llama復刻Linux的豪言,含意非同小可。Llama 3.1是迄今Meta開發最大型模型,同時發佈較小的8B和70B,上下文同樣128K,足夠大部分AI應用之用。

開源首超越閉源

Llama 3.1出現,開源模型首次超越了閉源;包括GPT-4o、Gemini 1.5、Claude 3.5 Sonnet等,多個排行榜一致評價,Llama 3.1數學、推理、工具調用(回應中使用外部的工具)和常識,均毫不遜色。

Llama 3.1系列包括基礎模型,以至專門用於對話的Instruct,還有運算速率更快、可减少模型佔用記憶和和儲存的「壓縮量化8 Bit」(8bit Quantization)模型,針對有安全要求的商業應用,Llama 3.1也推出了Prompt Guard,可訓練以防止提示攻擊。Llama 3.1屬於開源,專業程度不遜商用產品,功能堪稱全面,支援實時和批量推理、監督微調(Supervised fine-tuning)、持續的預訓練、RAG、Function calling、生成合成數據(Synthetic data generation)。

為AI應用而生

Llama 3.1在15T量級的Token上訓練,知識截至2023年底,值得一提是後訓練利用了大量合成數據。AI訓練最大難點之一,數據預備和篩選困難,Llama 3.1監督微調利用合生數據,大大降低成本。

Llama 3.1最大意義不在類似Poe般的直接調用, Llama 3.1為AI應用而生,支援工具調用Function calling,結合外部API和第三方應用,打造AI智能體(Agent)和複雜流程。

即使在消費市場,據Meta首席AI科學家楊立昆(Yann LeCun)估計,美國Llama 3.1為基礎的Meta人工智能助手應用,用量在數個月就超越OpenAI的ChatGPT。OpenAI面對激烈競爭,宣佈推出SearchGPT。Google和Perplexity AI已結合了AI和搜尋引擎,Google又在瀏覽器和手機平台佔優勢,OpenAI不易突圍。

千億成本無償使用

Llama 3.1以16,000枚Nvidia頂級性能H100 GPU訓練,每枚H100取價介乎二萬五千至四萬美元,硬件以億美元計,共訓練54天,電力等成本估算約六千萬美元,卻可免費下載及商業應用,Huggingface和Ollama錄得極高下載量,單Ollama已逾40萬,奠定Meta在開源的影響力。

另一特色是Meta公開了長達92頁技術報告,巨細無遺解說了Llama 3.1訓練過程,從訓練數據細節;凖備、處理和收集過程;如何採用合成數據(Synthetic Data),以供二次開發研究人員和機構,外間可窺見整個過程,毫無保留讓外間參考Llama開發過程,或如何微調,有人估計,國內中文基於Llama大模型會有一次大升級。

業內人士估計,LLAMA 3.1出現, Meta完全開源,加上豐富生態支援,國內開發人員不作他想,正進一步鞏固影響力,國內廠商跟不上步伐,隨時有邊緣化的危機。

百度創辦人李彦宏曾指出,開源模型能力會被閉源遠遠甩在身後,開源也不適用於大多數應用場景,話音未落,LLAMA 3.1就橫空出世,一石激起千重浪,橫掃國內多個市場,百度亦迅速跟隨其後。

百度創辦人李彦宏在WAIC 2024上發言
百度創辦人李彦宏在WAIC 2024上發言,指感慨中國內出現百模大戰,指沒有應用的大模型一文不值。國外百模大戰更為慘烈,頂級模型雙手奉送,商業模式更翻天覆地。

生態強大無出其右

對AI發展受箝制的地區,開源生態意義尤大。Llama 生態系統強大,主流公有雲包括AWS、Azure、Google支持,國內騰訊、阿里、百度紛紛部署Llama 3.1,加上開源生態,開發幾乎沒門檻。

AI算力平台包括Groq和Modelbit,網上提供算力,直接跑Llama 3.1的AI應用和智能體。微調利用免費Google Colab,通過平台GPU訓練,直接下載和微調,算力又按量計費,只要加入本身數據集,就訓練出對應特定場景的模型;類似Unsloth更提供完整工具,訓練後直接輸出下載至個人電腦上運行,技術門檻極低。

中國AI應用爆發,Llama功能強大免費,開源發展蓬勃,Meta投入了大量資源,國內已無人望其項背,問題是Meta屬美國企業,受制政治風險,一旦無以為繼,再被「卡脖子」時,就要自求多福了。

數碼港WealthTech初創上升四成   創新推動大眾化財富管理

數碼港WealthTech初創上升四成 創新推動大眾化財富管理

(左至右)StashAway香港區董事總經理梁穎瑩、數碼港首席公眾使命官陳思源、AQUMON行政總裁兼聯合創辦人雷春然、LORA Technologies首席執行官張永經分享行業的最新發展。 金融創 …

了解更多
Web3嘉年華香港登場     共議創新與合規發展

Web3嘉年華香港登場     共議創新與合規發展

此次Web3嘉年華是香港舉辦的第三屆,活動期間將進行四十場主題演講。主會場將聚焦核心議題,包括去中心化基礎設施(Depin)、實體資產(RWA)、支付金融(Payfi)和加密金融等,並將探討Web3 …

了解更多
能聽能講聊天機械人大勢所趨  難分真人對話孰真孰假

能聽能講聊天機械人大勢所趨  難分真人對話孰真孰假

加上友善頭像,話音機械人與真人接待處無異。 眾創時代 早前IDC發表《全球AI支出指南》報告,指出今年AI人工智能支出以軟件與服務各佔超過整體三分之一,當中以零售業將AI,投放在聊天機械 …

了解更多