雅虎香港 搜尋

搜尋結果

  1. 2024年2月20日 · 資料處理泛指的是在分析演算法之前,對資料進行處理跟調整,避免模型因為資料產生的瑕疵而誤判。 綜合上述幾個問題,我們可以把資料處理分成三個面向: 資料清理與型態調整. 資料探索與視覺化. 特徵工程. Data Engineer 工作內容是什麼? 從面試重點了解資料工程師. 立即領取. 免費點我下載數據技能路線指南. 資料清理:遺失值或錯誤資料處理. 清理資料的目的是將原始資料中的「缺失值」或「錯誤值」轉成適合模型可以存取的資料。 資料清理是資料處理環節中必須的工作之一,如果有未清理的資料會導致模型無法順利運行。 那什麼是「適合模型的資料」呢?

  2. 2024年2月1日 · 第1步:安裝Python和Git. 首先,您需要安裝Python 3.10.6,這是運行Stable Diffusion所必需的。 您可以從 Python官方網站 下載安裝。 若安裝過程中遇到困難,可以參考我們的 Python安裝教程 。 在命令提示符中輸入 python 並執行,以確認Python版本正確安裝。 若未顯示Python 3.10.6,請卸載電腦中的其他Python版本。 接著,安裝Git,這是一個代碼庫管理系統,用於版本控制和協作。 您可以通過 Git安裝教程 進行安裝,並可參考我們的 Git入門課程 以深入了解Git。 第2步:創建GitHub和Hugging Face帳戶. GitHub是一個代碼托管服務,用於軟件開發的版本控制和協作。

  3. 2024年1月10日 · 一、是否解決了真正的問題? 二、AI 是解決問題最好的辦法嗎? 三、結果不合預期怎麼辦? 四、如何管理 Prompt? 五、如何處理資料隱私權與安全性? 六、如何定價? 剩下的就不是 AI 的問題了. 大型語言模型(LLM)與圖像生成 AI,在數個月內快速發展。 如今我們可以簡單透過 API 串接,就做出一個 AI 應用。 這在幾年難以想像,也讓具備程式技能的開發者可以發揮所長,快速打造符合自己需求的小專案。 不過,要從實驗性質的 side project 發展成一項產品給更多人使用,還有許多要考量的部分。 如果你正在考慮讓一個 AI side project 產品化,本文提出了六個思考點,幫助你判斷與理清思路。

  4. 2024年3月7日 · 一、資料清理. 二、如何切割文本. 三、如何搜尋. 四、LLM 生成品質. 快速掌握 LLM 應用全局觀. 有了「長上下文 LLM」(Long-Context LLM),還需要 RAG 嗎? RAG(Retrieval-Augmented Generation,檢索增強生成)無疑是當今開發大型語言模型(LLM)產品時,不可或缺的技術。 由於可以確保 LLM 生成的真實性,在企業 AI 應用與搜尋場景相當受到重視。 為此,我也試著實作一個簡單的 RAG 應用。 多年累積下來,我的 Apple Notes 已經有 7000 多則筆記,搜尋愈來愈不準確,常在寫新筆記時想參考舊筆記,卻怎麼也找不到。

  5. 2024年2月26日 · 在我 一篇分享 OpenAI 研究員 Andrej Karpathy 介紹 LLMs 的文章 曾介紹到,通常 LLMs 的訓練會經過兩個階段:產出基本模型(base model)、曠日廢時且需要投入大量資源的「預訓練」階段,以及後續頻繁進行的「模型微調(fine-tuning)」階段。 在上述的訓練過程中,若希望 LLMs 理解特定領域的知識,就得從模型微調的階段下手,將特定領域的專業知識輸入基本模型進行訓練。 但模型的微調不僅得仰賴硬體的運算,且無法很快地將公司或組織的新資料納入模型之中,這都會對客製化 LLMs 的落地應用形成限制。 而 RAG 就能夠突破上述的限制。 RAG 概念是由自然語言處理科學家 Patrick Lewis 等學者在 2020 年發表的論文 2 中所提出。

  6. 2024年1月24日 · 本文將概覽 Hugging Face 對開發者的重要性,並在最後討論 Hugging Face 的商業模式與擁抱開放、傳遞知識的文化。 一家估值 45 億美元公司,主打開放原始碼 AI 模型平台,為什麼獲得大量 AI 應用開發者的熱愛與重視? 對開發者的重要性:多、省時、簡便且標準化. Hugging Face 被稱為「AI 界的 Github」,最大亮點是開源模型集散地,整合大量的模型、資料集。 然而 Hugging Face 不單純是把模型放在網站上讓人下載,更重要的是提供標準化的函式庫、API 與網頁介面,並建立起開源社群。 其主要服務包含: 模型與函式庫「Transformers Library」:標準化的函式庫,可透過統一的 API 完成下載、串接、微調模型。

  7. 2023年7月25日 · 選擇關注點:第一步就是最後一步. 關注你的位移 (A—>B) 為什麼要使用 A → B 結構? 刻意選擇 Growth mindset 視角. 培養你的後設認知. 不要浪費有效經驗. 狀態負面時去休息;狀態正面時做 reflection. 小結. Reference. 體驗用 ORID 強化全端網頁開發學習效果,3 分鐘小測驗找到你的學習起點. Reflection 與做中學. OBJECTIVE :具體的事實,做了哪些事情、看到與觀察哪些事情. REFLECTIVE :感受與反應,在當下直接的感受、反應與印象深刻的地方. INTERPRETIVE :事後詮釋與分析,試著解釋與分析事實與自己的感受. DECISIONAL :訂定目標與下一步,找出下一步可應用、執行與改善的地方.