雅虎香港 搜尋

搜尋結果

  1. 2024年1月8日 · 內容目錄. 步驟一:最希望呈現資料裡的哪一個關係? 「比較大小」:長條圖. 「了解趨勢」:折線圖、堆疊長條圖. 「呈現整體組成」:圓餅圖、百分比堆疊長條圖、矩形樹狀圖. 「呈現分佈」:散佈圖、直方圖. 「比較大小+呈現分佈」:泡泡圖. 步驟二:選擇表達訊息能力最佳的圖表. 圓餅圖 vs 長條圖. 折線圖 vs 堆疊長條圖. 步驟三:挑選顏色. 以上都不符合你的需求嗎? 這裡有更多選擇圖表的指引. RE:LAB. Financial Times 的「視覺化辭典」 Andrew Abela 的 Chart Chooser. The Data Visualisation Catalogue. 結語.

  2. 2023年7月24日 · 統計到底哪裡可以用得到?. 又要怎麼開始呢?. 剛開始想了解資料與統計的同學們,常常聽到資料界的工程師說分析、模型都要用到統計的觀念,但統計的觀念是運用在哪,卻總是難以具體地感受到。. 找來一本統計課本,卻對一開始的基本知識感到疏遠而容易 ...

    • 大數據是什麼?
    • 什麼是「醫療」大數據?
    • 但實際上ai醫療數據為甚麼會失敗
    • 解決方法
    • 結論

    大數據(Big Data) 又被稱為巨量資料, 隨著儲存設備越來越便宜, 越來越大量的資料被儲存,不論企業或研究員都開始思考, 巨量資料對我們的幫助以及如何從中萃取知識。 目前大數據用資料特性可以定義為以下5V: 1. Volume(容量/大):資料量「大」。像是網頁資訊,在社群軟體內,每天可能會產生數億個文章以及按讚、回覆資訊,而日積月累下,將會存放非常巨量的資料。 2. Velocity(速度/快):資料產生和更新速度「快」。 3. Variety(多樣性/雜):資料來源多元、總類繁多,格式雜「亂」,儲存大量的非結構化資料(Unstructured data)。 4. Veracity(真實性/疑): 對於資料的質量與可信賴度存「疑」。 5. Value(價值/珍):資料量龐大,「珍」貴...

    在醫院,每天都會產生數以萬計的資料。 每個病人來到了醫院,會做各種不同檢查,像是量測病人的身體資訊(身高, 體重), 生命特徵(血壓, 心跳, 呼吸速度等等) 或是 放射影像 ( X-ray, CT 等等 )。 而這些檢查的結果都會被存放在醫院的資料庫內,並且隨著時間不斷的倍數增長,對於醫師和研究員來說,這些數據埋藏了許多寶藏在裡面,相對的,也埋藏了許多陷阱。 像是新生兒的名字,在一開始建檔的時候會寫成 “XXX之子”; 或是時態的資料,每個科別都會有自己的儲存方法 (ex: 年/月/日, 月/日/年, 年/月/日 時:分:秒) 等等,尤其是急診資料,在很多緊急情況下,醫師或是護理師時常會不小心輸入錯誤資訊。 但是當克服這些資料髒亂問題後,我認為「 AI + 醫療大數據」可以產生無限種可能。...

    「AI in Healthcare」 議題其實已經有許多大企業開始投入開發,但是 Watson 和 Google都陸續宣告失敗,原因是什麼呢? 我以個人觀點列出以下原因: 1. 醫療體系封閉 醫療資料因為隱私的問題,基本上是完全無法攜出各醫院的,導致資料和模型在各醫院無法做交流。當資料量不夠全面時,各醫院訓練出來的模型通常都會有資料偏差(Bias)問題,使得A醫院訓練出來的模型無法在B醫院使用。 當資料集的某些元素比其他元素具有更大的權重或大小時,我們稱之為有偏見的資料集,此類的資料集通常做不出通用模型,從而導致結果偏斜,準確性水平低和分析錯誤。舉例來說: 當資料集內都只有黃種人資料而訓練出來的模型,通常用在白種人的資料集內會導致結果與預期差距甚大。 1. 資料面的問題 我們從標籤(labe...

    以下我會針對上面提到的困難,介紹一些現有處理的方法 1. 當出現資料偏差(Data Bias)該怎麼做?: 在醫療資料內,會有很多原因造成資料偏差,包含病人的生理差異(男生/女生)、種族差異(黃種人/白種人)、甚至社會文化差異(閩南人/原住民)。訓練偏差的資料會產生偏差的模型,而導致錯誤的分類結果。而為了解決此問題,可以嘗試使用 Google 在2017年提出的新想法 — 聯邦式學習 (Federated learning) $^2$。在近幾年,AI LAB致力於推動台灣的聯邦學習醫療聯盟,期望能共同打造善用台灣醫療大數據的智慧醫療產品。 資料偏差議題可以參考的影片 : 推薦的聯邦學習Python Package: https://www.tensorflow.org/federated‍ ...

    如果把AI比喻成一艘行駛在水上的大船,而水就是我們的大數據。水亦能載舟,也能覆舟。在航行的時候,會遇到各種不同類型的水,要怎麼航行到達目的地,就要靠各個掌舵人大顯身手了。 「如果你懂海,海就會幫你」— 海龍王彼得

  3. 2024年2月17日 · 結語. 如果你正在尋找 Data Engineer 的工作,或是期待踏入相關領域,ALPHA Camp 蒐集並整理了大量的業界面試流程與常見的面試題庫 40 題, 用面試官的角度思考,找出他到底要什麼!. 並從中了解資料工程師的工作內容是什麼,以及雇主對 Data Engineer 關注的 ...

  4. 2023年9月5日 · 「數據分析職能地圖」是 AC 踏入數據分析領域與培育人才的觀點與方向,除了做為開發課程的藍圖,也在探索如何幫助有志往數據分析領域的人,建立有效與精準評估能力、規劃學習的工具。 AC 數據分析職能地圖四大象限與 12 個子項目 (update: 2023/09/1) 關於地圖的緣起、設計與第一層四象限的說明,請參考 〈解構數據分析職能地圖:ALPHA Camp 培育數據分析人才的下一步〉 這篇文章;而地圖第二層 12 個子項目的詳細內容,則請參考 〈應用數據分析職能地圖,迎戰市場需求與學習挑戰〉 這篇文章。 在 2023/8/19,AC 舉辦了 「數據分析職能地圖」對談會,邀請管其毅與胡筱薇兩位專家對談。 以下是兩位專家的介紹,與從他們的經驗和觀點,對談發展數據分析職涯與學習的挑戰。

  5. 2022年12月17日 · 有沒有覺得很像?. 仔細比較 Google Analytics 跟 FB Pixel Code 的 Tracking Code,你會發現基本上都分成三個部分 —— 讀取 Base Code、指定回傳的帳號(透過ID)、回傳一個初始 event,瞭解了 Tracking Code 的基本架構,接下來我們來看看常遇到的幾種追蹤。. ‍. 一般而言行銷 ...

  6. 2024年1月24日 · 內容目錄. 對開發者的重要性:多、省時、簡便且標準化. 「多」:大量且多樣的 AI 模型. 「省時」:直接在平台頁面預覽測試. 「簡便」:透過 API 遠端串接模型. 「標準化」:統一的程式碼介面. Hugging Face 的商業模式. Hugging Face 的使命:機器學習大眾化. Hugging Face 整合超過 47 萬個開源、預先訓練好的 AI 模型,供任何人下載使用。 由於訓練模型非常昂貴,這樣的平台可以大幅降低開發 AI 產品的時間與成本。 他們也積極推動開源社群,致力於打造更安全與開放的 AI 模型。

  1. 其他人也搜尋了