雅虎香港 搜尋

搜尋結果

  1. 2024年4月17日 · 內容目錄. 快速掌握 LLM 應用全局觀. 台大電機系教授宏毅:台灣人工智慧專家,深入淺出講述 GenAI 基礎原理. AI Explained:不只介紹新技術與產品,更以宏觀視角討論 GenAI 發展. IBM Technology:給普羅大眾的科技名詞與概念的入門指南. Andrej Karpathy:業界與學術經驗 ...

  2. 2024年3月7日 · 一、資料清理. 二、如何切割文本. 三、如何搜尋. 四、LLM 生成品質. 快速掌握 LLM 應用全局觀. 有了「長上下文 LLM」(Long-Context LLM),還需要 RAG 嗎? RAG(Retrieval-Augmented Generation,檢索增強生成)無疑是當今開發大型語言模型(LLM)產品時,不可或缺的技術。 由於可以確保 LLM 生成的真實性,在企業 AI 應用與搜尋場景相當受到重視。 為此,我也試著實作一個簡單的 RAG 應用。 多年累積下來,我的 Apple Notes 已經有 7000 多則筆記,搜尋愈來愈不準確,常在寫新筆記時想參考舊筆記,卻怎麼也找不到。

    • Label Encoding
    • One-Hot Encoding / Dummy Variable
    • 資料前處理中必須要做的處理

    根據觀察資料,可以把字串的資料分成有序和無序的。最直覺的方法就是直接將「字串」轉換成一個對應的數字即可,這種方法我們稱為標籤編碼法(Label Encoding)。有序類別字串可以直接採用標籤編碼法,利用轉換後的大小關係維持資料間的順序。標籤編碼轉換後的大小會隱含資料間的順序關係。

    但原本的資料如果是無序的類別字串直接使用標籤編碼法會有點問題,以這個例子來說,會讓原本應該無序的水果間產隱含大小的關係出現。而我們在模型當中,很常會使用「大小」來表示資料間的關係。 因此,無序類別字串轉數值會採用另一種方法,稱為是獨熱編碼(One-Hot Encoding)或虛擬變量(Dummy Variable)的方法。這種方式會將原本欄位的資料轉換鍋的欄位,藉此來維持資料就的無序關係。

    我自己會把「資料清理」跟「型態調整」稱為是整個分析過程中一定要操作的部分,因為若沒有經由正確的處理方法會造成模型無法存取的狀況。另外根據 CrowdFlower Survey Results 調查的結果,在資料分析的階段 60% 的時間其實是在進行資料清理的。 CrowdFlower Survey Results 最後,你以為你是在做的是資料分析的工作,實際上其實是個資料黑手。 (本文轉載自資料工程師 WeiYuan 的文章 《資料前處理必須要做的事 – 資料清理與型態調整》) 想做數據分析或轉職數據分析師?你可以先準備好必備的「數據思維」

  3. ‍. 我大學是讀電子系的,雖然都是工科,但和程式完全無關,所以我本來也不會寫程式。 我擁有繪圖的專長,會畫藍圖、3D 模型等,但不喜歡待辦公室,所以我大學一畢業就去做工地。 第一年做雜工,也做品管,工作內容大概就是到處走,檢查哪裡做不好。 工作一年後,我考上工地主任執照。 從一塊平地到大樓,中間的各環節都是工地主任的工作,包含規劃工作進度、算物料(鋼筋、灌漿等)、鷹架安全、和不同工程組溝通協調…等,壓力蠻大的。 因為如果一個決定做不好,例如鋼筋的量沒算準、工地垃圾擋住機具進不來,只要工程拖了一天,就會害公司多花幾十萬的利息。 我一共在工地做了三年,其中兩年當工地主任,蓋了兩棟大樓。 工地的人力斷層真的很嚴重,我都看不到和我同年紀的年輕人,同事的年紀都是我的兩倍。

  4. 2024年1月17日 · 而他這支影片〈Intro to Large Language Models〉就聚焦在 LLMs 的三個面向:在第一段,他簡單介紹 LLMs 的運作與訓練方式;他在第二段,討論到 GPTs、多模態(Multi-Modal)等 LLMs 未來的發展方向;於最後一段,他探討了提示詞注入、越獄等 LLMs 的資安議題。. 本文將花較 ...

  5. 2024年4月3日 · 從程式設計到資料結構與演算法. 看懂題目背後的設計思維. 持續優化的思考過程. 什麼是 LeetCode? LeetCode 是一個程式語言的線上題庫平台,收集了大量科技、軟體公司面試時所出現的技術題(技術面試中俗稱的白板題)。 LeetCode 會被很多資訊產業的求職者視為「準備面試時」的題庫,而對題庫進行大量練習的行為稱為「刷題」。 官方網站: https://leetcode.com/ LeetCode 是一個線上解題系統. OJ(Online Judge)全名是線上解題系統,早期是用於演算法競賽(競技程式)的線上系統,即時評測參賽者所提交的。 在眾多的線上解題系統中,LeetCode 以「公司面試題目」為導向殺出一條血路,提供技術面試中常見的題目,作為平常的練習或是面試前的準備。

  6. 2024年3月29日 · 1. 提出假設的目標. 2. 提出假設的方法. 3. 提出假設的案例. 解決問題與數據分析職能地圖應用. 商業應用:問題解決的商業場景. Business model & logic. Use case. Domain & function. 理論與素養:問題解決的理論基礎. Stats & math. Data analysis & Data literacy. 技術與工具:問題解決的技術支持. Data source & architecture. Programming language & BI Tools. 影響力:問題解決的溝通與影響. Audience & Occasion. Communication strategy & Data communication. 結語.

  1. 其他人也搜尋了