雅虎香港 搜尋

搜尋結果

  1. 2024年4月17日 · 如果想要從零開始認識人工智慧,且希望能擁有完整架構的理解的話,就絕對不能錯過台大宏毅教授的頻道。 教授不遺餘力於人工智慧的知識分享,早在 2017 年就將他在台大的「機器學習」的授課內容上傳到 YouTube,而他在 2024 年也將最新的「生成 ...

  2. 2024年3月7日 · 本文會先簡單介紹 RAG 的原理與優勢,接著分享我的實作經驗(相關的教學文章連結我整理在文末),並討論 RAG 應用產品化過程中可能面臨的問題。 在文章最後,則會進一步探討:當 LLM 具備長文本理解能力,可以讓我們把資料全部塞進 prompt 裡,此時還需要 RAG 嗎? RAG 是什麼? RAG 解決了大型語言模型(LLM)實際應用時的兩大侷限:幻想(hallucination)與資料時限。 RAG 結合「資訊檢索(retrieval)」和「生成(generation)」:在文本生成之前,先從資料庫中檢索相關的資料放入上下文,以確保 LLM 可依照正確的最新資訊生成結果。 看似複雜,其實相當直覺——既然大型語言模型受限於缺乏最新資料,那我們就在生成時,提前準備好「小抄」,讓它照著回答。

    • Label Encoding
    • One-Hot Encoding / Dummy Variable
    • 資料前處理中必須要做的處理

    根據觀察資料,可以把字串的資料分成有序和無序的。最直覺的方法就是直接將「字串」轉換成一個對應的數字即可,這種方法我們稱為標籤編碼法(Label Encoding)。有序類別字串可以直接採用標籤編碼法,利用轉換後的大小關係維持資料間的順序。標籤編碼轉換後的大小會隱含資料間的順序關係。

    但原本的資料如果是無序的類別字串直接使用標籤編碼法會有點問題,以這個例子來說,會讓原本應該無序的水果間產隱含大小的關係出現。而我們在模型當中,很常會使用「大小」來表示資料間的關係。 因此,無序類別字串轉數值會採用另一種方法,稱為是獨熱編碼(One-Hot Encoding)或虛擬變量(Dummy Variable)的方法。這種方式會將原本欄位的資料轉換鍋的欄位,藉此來維持資料就的無序關係。

    我自己會把「資料清理」跟「型態調整」稱為是整個分析過程中一定要操作的部分,因為若沒有經由正確的處理方法會造成模型無法存取的狀況。另外根據 CrowdFlower Survey Results 調查的結果,在資料分析的階段 60% 的時間其實是在進行資料清理的。 CrowdFlower Survey Results 最後,你以為你是在做的是資料分析的工作,實際上其實是個資料黑手。 (本文轉載自資料工程師 WeiYuan 的文章 《資料前處理必須要做的事 – 資料清理與型態調整》) 想做數據分析或轉職數據分析師?你可以先準備好必備的「數據思維」

  3. 其他人也問了

  4. 2023年7月24日 · 本篇文章作者是 ALPHA Camp 資料工程師維元,在剛入行時把資料團隊根據技能分成資料科學家、資料分析師和資料工程師三種角色,講解資料專案團隊組成。 不過在工作幾年之後,發現實務上的資料分工其實更細而且更複雜,也隱含了更多的可能性。 這一篇文章將談談實務上的資料團隊分工。 不同的技能與分工. 首先我們先依照技能與工作簡單分成三種類型: 擅長 #分析應用 的: 資料分析師(Data Analyst) 擅長 #程式實作 的: 資料工程師(Data Engineer) 擅長 #模型理論 的: 資料科學家(Data Scientist) 換句話說,他們分別是「看資料」,「調資料」以及「玩資料」。 不過實際上的分工與職能其實會更加複雜一點,有幾種常見的狀況: 資料科學家與資料工程師中間的 GAP.

  5. 1. 策略 VS 執行. 2. 外在標籤 VS 內在價值. 3. 聘用團隊 VS 打造團隊. 每一天都比昨天更好,不斷追求成長. 在 ALPHA Camp,有一個傳說中的神力女超人,她是 Student Success 團隊的學習總教練,每星期都和團隊開會監測學習數據,為學生打造更有效的學習體驗而孜孜不倦;她是營運長,確保公司大大小小專案運作狀況良好,無所不在地 carry 整個 AC 團隊,讓公司規模和團隊戰鬥力都能快速成長! 在 ALPHA Camp 之前,Youchi 在全球頂尖的 BCG 波士頓顧問公司待了整整十年。 回顧過去閃亮的職涯,作為別人眼裡的「菁英」,究竟是甚麼讓她接近從零開始,成為了AC 團隊不可或缺的重要支柱,對於AC 的未來她又有甚麼樣的願景和期待?

  6. 2023年7月25日 · 發佈日期: 2020 年 10 月 19 日 作者: Ellen. 內容目錄. Reflection 與做中學. ORID 是什麼? 討論的思維框架. Objective 客觀、事實. Reflective 感受、反應. Interpretive 意義、價值、經驗. Decisional 決定、行動. 選擇關注點:第一步就是最後一步. 關注你的位移 (A—>B) 為什麼要使用 A → B 結構? 刻意選擇 Growth mindset 視角. 培養你的後設認知. 不要浪費有效經驗. 狀態負面時去休息;狀態正面時做 reflection. 小結. Reference. 體驗用 ORID 強化全端網頁開發學習效果,3 分鐘小測驗找到你的學習起點. Reflection 與做中學.

  7. 2023年8月8日 · 發佈日期: 2023 年 8 月 8 日 作者: ALPHA Camp. 內容目錄. 數據治理是什麼? 企業為什麼要做? 企業怎麼做數據治理? 沒做過的企業如何開始? 在醫療或金融等資料較敏感的產業,如何妥善管理數據,讓管理單位放心? AI 產生的「偏見」能被管理嗎? 從印尼最大電商 Tokopedia,有哪些數據治理經驗可以分享? 新加坡政府推動數據治理,經驗如何? ChatGPT 崛起後,數據治理有什麼轉變與新挑戰? 企業做數據治理,不同角色如何分工? 誰該對資料負責? 結語:企業如何推動數據治理? 關鍵字補充. 3 位在美國與新加坡、有豐富數據與 AI 領域經驗專家管其毅、Angus 與 Koo,帶大家瞭解「數據治理」是什麼? 對企業為什麼重要? 如何開始執行? 不同產業有什麼挑戰?

  1. 其他人也搜尋了