正在找 Llama 3.2 本地運行 3B 或 1B 方法嗎?這篇要推薦的 WebLLM 應該是目前最簡單方法,架設在 Hugging Face 上,只要打開網址並選擇和下載你要用的模型版本,就能開始使用。
當然,也有公開原始程式碼,可以在本地架設,不知道怎麼架設的人,直接在 WebLLM 使用就好,下面就來教你一步步操作。
你可能感興趣
- Copilot vs ChatGPT 比較,這二款 AI 工具有什麼不同?
目錄
最容易 Llama 3.2 本地運行方法
這個工具名稱叫做「webllm-llama-3.2」,由 Caleb Fahlgren 開發,你可以直接點下方連結進到該工具,或是到 Hugging Face 網站下載原始碼本地架設。
按上方連結後,會看到這畫面,首先你需要下載模型,打開 Load Model 下方選單:
目前提供的模型有以下:
- Llama-3.2-3B-Instruct-q4f16_1-MLC
- Llama-3.2-3B-Instruct-q4f32_1-MLC
- Llama-3.2-1B-Instruct-q0f16_1-MLC
- Llama-3.2-1B-Instruct-q0f32_1-MLC
- Llama-3.2-1B-Instruct-q4f16_1-MLC
- Llama-3.2-1B-Instruct-q4f32_1-MLC
下載哪一個版本取決於你的電腦,3B 一定比 1B 還要好。後面的數字也是越高越高,但相對對效能要求也較高。
如果有 NVIDIA 獨顯的話,可以先從 3B q4f32 開始試。
沒有的人,建議從 3B q4f16 開始,太吃力就改成 1B。
另外,1B 的中文支援性比較差,你有可能會收到部分英文、部分中文的回覆。
選好之後,按旁邊的 Download 會開始下載:
下方會顯示下載進度:
左上角顯示模型名稱,就代表已完成,可以開始聊天:
Llama 3.2 3B 和 1B 可以做到哪些事
這款工具提供的功能就只有聊天,無法上傳檔案,因此就看你要跟它聊什麼,它都能回答你。
當然,支援中文,這邊也舉幾個例子提供給你參考。
1. 總結網頁文章
你可以把長篇的網頁文章內容,全部都貼給它,圖片部分它不能讀,只有文字。
記得要求總結內容,我測試它會記住之前說過的話:
雖然是 3B,總結的效果還是很不錯:
英文內容也沒問題,而且會用繁體中文回答:
2. 詢問生活上任何問題
生活中碰到任何問題時,也可以向它尋求建議,簡短一句話也沒問題。
不過如果你能夠描述的更詳細,像是你想要怎樣的建議,以「我最近有點累,你有什麼建議嗎」來說,如果我只是給這句,它會給比較廣泛的答案。
可以多放鬆、休息和睡眠、運動和伸展、充電和自我照顧等等。
如果我把內容補充成「我最近有點累,什麼事都提不不起勁,想要更有動力,能夠繼續提升自己實力,你有什麼建議嗎」
它就會針對要如何更有動力,來提供建議,回答的更加精準:
3. 寫文章或 E-mail
如果你有任何內容沒靈感,不知道怎麼開頭,都可以叫它生成,然後你再從裡面去改,這樣會更加容易。
而跟外國人聯繫,或一些比較重要的 E-mail,也可以請它幫忙給出建議,甚至是直接幫你寫好更好的回覆。
Rocky
曾任職於各大科技網站編輯,目前也是電腦王阿達資深編輯,接觸科技已經長達 10 年,熱愛將一些新科技、知識、和經驗分享給所有人。目前居住在日本,老婆是日本人,偶爾也會分享一些日本生活內容。