Llama 3.2 本地運行最簡單方法,用瀏覽器就能跑 3B 和 1B

正在找 Llama 3.2 本地運行 3B 或 1B 方法嗎?這篇要推薦的 WebLLM 應該是目前最簡單方法,架設在 Hugging Face 上,只要打開網址並選擇和下載你要用的模型版本,就能開始使用。

當然,也有公開原始程式碼,可以在本地架設,不知道怎麼架設的人,直接在 WebLLM 使用就好,下面就來教你一步步操作。

你可能感興趣

目錄

最容易 Llama 3.2 本地運行方法

這個工具名稱叫做「webllm-llama-3.2」,由 Caleb Fahlgren 開發,你可以直接點下方連結進到該工具,或是到 Hugging Face 網站下載原始碼本地架設。

按上方連結後,會看到這畫面,首先你需要下載模型,打開 Load Model 下方選單:

目前提供的模型有以下:

  • Llama-3.2-3B-Instruct-q4f16_1-MLC
  • Llama-3.2-3B-Instruct-q4f32_1-MLC
  • Llama-3.2-1B-Instruct-q0f16_1-MLC
  • Llama-3.2-1B-Instruct-q0f32_1-MLC
  • Llama-3.2-1B-Instruct-q4f16_1-MLC
  • Llama-3.2-1B-Instruct-q4f32_1-MLC

下載哪一個版本取決於你的電腦,3B 一定比 1B 還要好。後面的數字也是越高越高,但相對對效能要求也較高。

如果有 NVIDIA 獨顯的話,可以先從 3B q4f32 開始試。

沒有的人,建議從 3B q4f16 開始,太吃力就改成 1B。

另外,1B 的中文支援性比較差,你有可能會收到部分英文、部分中文的回覆。

選好之後,按旁邊的 Download 會開始下載:

下方會顯示下載進度:

左上角顯示模型名稱,就代表已完成,可以開始聊天:

Llama 3.2 3B 和 1B 可以做到哪些事

這款工具提供的功能就只有聊天,無法上傳檔案,因此就看你要跟它聊什麼,它都能回答你。

當然,支援中文,這邊也舉幾個例子提供給你參考。

1. 總結網頁文章

你可以把長篇的網頁文章內容,全部都貼給它,圖片部分它不能讀,只有文字。

記得要求總結內容,我測試它會記住之前說過的話:

雖然是 3B,總結的效果還是很不錯:

英文內容也沒問題,而且會用繁體中文回答:

2. 詢問生活上任何問題

生活中碰到任何問題時,也可以向它尋求建議,簡短一句話也沒問題。

不過如果你能夠描述的更詳細,像是你想要怎樣的建議,以「我最近有點累,你有什麼建議嗎」來說,如果我只是給這句,它會給比較廣泛的答案。

可以多放鬆、休息和睡眠、運動和伸展、充電和自我照顧等等。

如果我把內容補充成「我最近有點累,什麼事都提不不起勁,想要更有動力,能夠繼續提升自己實力,你有什麼建議嗎」

它就會針對要如何更有動力,來提供建議,回答的更加精準:

3. 寫文章或 E-mail

如果你有任何內容沒靈感,不知道怎麼開頭,都可以叫它生成,然後你再從裡面去改,這樣會更加容易。

而跟外國人聯繫,或一些比較重要的 E-mail,也可以請它幫忙給出建議,甚至是直接幫你寫好更好的回覆。

跟其他免費 AI 比,哪個比較好?

這工具只有提供 Llama 3.2 的 3B 和 1B 二種版本,因此如果是跟 ChatGPTCopilot 等免費 AI 工具相比,絕對是後者比較好。

Llama 3.2 的 3B 和 1B 只適合輕量工作,太複雜的就不推薦,甚至寫文這些,我還比較推薦用 ChatGPT、Copilot。

Picture of Rocky

Rocky

曾任職於各大科技網站編輯,目前也是電腦王阿達資深編輯,接觸科技已經長達 10 年,熱愛將一些新科技、知識、和經驗分享給所有人。目前居住在日本,老婆是日本人,偶爾也會分享一些日本生活內容。

全部文章

發佈留言