雅虎香港 搜尋

搜尋結果

  1. 2024年4月17日 · 李教授不遺餘力於人工智慧的知識分享,早在 2017 年就將他在台大的「機器學習」的授課內容上傳到 YouTube,而他在 2024 年也將最新的「生成式 AI 導論」 1 同步上傳,透過完整的架構來講述 GenAI 這項技術。

  2. 2023年8月8日 · 內容目錄. 數據治理是什麼? 企業為什麼要做? 企業怎麼做數據治理? 沒做過的企業如何開始? 在醫療或金融等資料較敏感的產業,如何妥善管理數據,讓管理單位放心? AI 產生的「偏見」能被管理嗎? 從印尼最大電商 Tokopedia,有哪些數據治理經驗可以分享? 新加坡政府推動數據治理,經驗如何? ChatGPT 崛起後,數據治理有什麼轉變與新挑戰? 企業做數據治理,不同角色如何分工? 誰該對資料負責? 結語:企業如何推動數據治理? 關鍵字補充. 3 位在美國與新加坡、有豐富數據與 AI 領域經驗專家管其毅、Angus 與 Koo,帶大家瞭解「數據治理」是什麼? 對企業為什麼重要? 如何開始執行? 不同產業有什麼挑戰? ChatGPT 問世後「數據治理」又有什麼轉變與新挑戰?

    • Label Encoding
    • One-Hot Encoding / Dummy Variable
    • 資料前處理中必須要做的處理

    根據觀察資料,可以把字串的資料分成有序和無序的。最直覺的方法就是直接將「字串」轉換成一個對應的數字即可,這種方法我們稱為標籤編碼法(Label Encoding)。有序類別字串可以直接採用標籤編碼法,利用轉換後的大小關係維持資料間的順序。標籤編碼轉換後的大小會隱含資料間的順序關係。

    但原本的資料如果是無序的類別字串直接使用標籤編碼法會有點問題,以這個例子來說,會讓原本應該無序的水果間產隱含大小的關係出現。而我們在模型當中,很常會使用「大小」來表示資料間的關係。 因此,無序類別字串轉數值會採用另一種方法,稱為是獨熱編碼(One-Hot Encoding)或虛擬變量(Dummy Variable)的方法。這種方式會將原本欄位的資料轉換鍋的欄位,藉此來維持資料就的無序關係。

    我自己會把「資料清理」跟「型態調整」稱為是整個分析過程中一定要操作的部分,因為若沒有經由正確的處理方法會造成模型無法存取的狀況。另外根據 CrowdFlower Survey Results 調查的結果,在資料分析的階段 60% 的時間其實是在進行資料清理的。 CrowdFlower Survey Results 最後,你以為你是在做的是資料分析的工作,實際上其實是個資料黑手。 (本文轉載自資料工程師 WeiYuan 的文章 《資料前處理必須要做的事 – 資料清理與型態調整》) 想做數據分析或轉職數據分析師?你可以先準備好必備的「數據思維」

  3. 2023年7月24日 · 不同的技能與分工. 首先我們先依照技能與工作簡單分成三種類型:. 擅長 #分析應用 的: 資料分析師(Data Analyst). 擅長 #程式實作 的: 資料工程師(Data Engineer). 擅長 #模型理論 的: 資料科學家(Data Scientist). 換句話說,他們分別是「看資料 ...

    • 李海仁1
    • 李海仁2
    • 李海仁3
    • 李海仁4
  4. 內容目錄. 一、找到自己工作/職涯的意義. 二、設定職涯目標:10 年後,我會在哪裡? 定期檢視自己的成長. 有了目標,更要有計劃! 三、透過導師/貴人 探索更寬廣的世界. 建立 Mentor 人脈. 四、得到他人幫助 自己也成為貴人. 結語:讓心中的「羅盤」帶你通向職涯目的地! 十年後的你,想在哪裡工作? 達到什麼成就? 現在的你,該如何投資自己、培養優勢? 為了幫助學程式的學員們找到理想職涯,ALPHA Camp 舉辦了線上職涯座談,邀請到 Jumpstart Global 共同創辦人 Rosa,傳授如何確立職涯目標、培養自己,預約未來理想職涯! 開啟新職涯! 3分鐘小測驗,找到你的程式自學入口. 「跨領域」是 Rosa 的職涯寫照。

  5. 2024年3月29日 · 內容目錄. 數據思維:解決問題的五個步驟. 定義問題:問題解決的起點. 定義問題的目標和方法. 2. 定義問題的方法. 3. 定義問題的案例. 獲得可用數據的下一步:提出假設. 1. 提出假設的目標. 2. 提出假設的方法. 3. 提出假設的案例. 解決問題與數據分析職能地圖應用. 商業應用:問題解決的商業場景. Business model & logic. Use case. Domain & function. 理論與素養:問題解決的理論基礎. Stats & math. Data analysis & Data literacy. 技術與工具:問題解決的技術支持. Data source & architecture. Programming language & BI Tools.

  6. 更明確地細分,我們可以將文本顆粒度拆分為三種輸出:字詞(Word)/ 句子(Sentence) / 文本(Document)。. 研究大多集中在字詞級別(Word-level alignment),近期發現在句子級別上( Sentence-level alignment)可以透過 sub-word 建立一個跨語言共享的詞表,達到讓冷門語料 ...

  1. 其他人也搜尋了