雅虎香港 搜尋

搜尋結果

  1. 2021年1月18日 · 為解決長尾問題,現有的演算法. 事實上,此前為了解決“不均衡”資料集,研究者們已經嘗試過多種方法。 僅僅是主流演算法,就分為七種: 重複採樣 (re-sampling):分為對少樣本的過採樣、及多樣本的欠採樣,但這2種方法,都有欠缺的地方。 其中,過採樣容易發生少樣本過擬合,無法學習更棒、易泛化的特徵,在不平衡資料上表現較差;欠採樣會造成多樣本嚴重資訊損失,導致發生欠擬合。 資料合成 (synthetic samples):生成和少樣本相似的新資料。 以SMOTE方法為例,對於任意選取的少類樣本,它用K近鄰選取相似樣本,並通過對樣本線性插值得到新樣本。 這裡與mixup方法相似,因此,也有非均衡的mixup版本出現。

    • 反事實因果推斷
    • 自舉法和基於模擬的推斷
    • 超參數化模型和正則化
    • 貝葉斯多級模型
    • 通用計算演算法
    • 自適應決策分析
    • 魯棒性推斷
    • 探索性數據分析
    • 這 8 大思想建構了後續的 Ai 發展

    在假設條件下,因果識別是可能的,而且可以嚴格地陳述這些假設,並透過設計和分析以各種方式解決它們。 不同領域發展了不同的因果推斷方法。在計量經濟學中,是結構模型及其對平均治療效果的影響,在流行病學中,是對觀察數據的推斷。 基於因果識別是認知的核心任務,因此應該是一個可以數學形式化的可計算問題。路徑分析和因果發現可以根據潛在結果來建構,反之亦然。

    統計學的一個趨勢是用計算來替代數學分析,甚至在 「大數據 」分析開始之前就已經開始了。 自舉法將估計視為數據的近似充分統計量,並將自舉分佈視為數據抽樣分佈的近似值。 同時,由於自舉法的普遍性和簡單的計算實現,讓它能夠應用在那些無法使用傳統解析近似的場景,從而獲得了極大的影響力。 在置換測試中,重採樣數據集是透過隨機打亂目標值來打破預測變數和目標之間的(可能的)依賴關係來生成的。 參數自舉、先驗和後驗預測檢查、基於模擬的校準都是從一個模型中建立複製的數據集,而不是直接從數據中重新取樣。 在分析複雜的模型或演算法時,從已知的數據生成機制中取樣通常被用來建立模擬實驗,以補充或取代數學理論。

    統計學一個主要的變化,是使用一些正則化程序來擬合具有大量參數的模型,從而獲得穩定的估計和良好的預測。 這是為了在獲得非參數或高度參數化方法的靈活性的同時,避免過度擬合問題。其中,正則化可以作為參數或預測曲線上的懲罰函數來實現。 模型的早期案例包括:馬爾可夫隨機場、樣條曲線和高斯過程、分類和迴歸樹 、神經網絡、小波收縮、最小二乘法的替代方案以及支持向量機。 貝葉斯非參數先驗在無限維機率模型族上也有了巨大的發展, 這些模型都有一個特點,就是隨著樣本量的擴大而擴大,而且參數並不總是有直接的解釋,而是一個更大的預測系統的一部分。

    多級或分層模型具有因組而異的參數,使模型能夠適應集群抽樣、縱向研究、時間序列橫截面數據、薈萃分析和其他結構化設置。 多級模型可以被視為貝葉斯模型,因為它們包括未知潛在特徵或變化參數的機率分佈。相反,貝葉斯模型有一個多層次結構,具有給定參數的數據和給定超參數的參數的分佈。 同樣,貝葉斯推斷不僅作為一種將先驗資訊與數據相結合的方式,而且也可以作為一種為推斷和決策考慮不確定性的方式。

    創新統計演算法是在統計問題結構的背景下發展的。EM 演算法、吉布斯採樣、粒子濾波器、變分推理和期望傳播以不同的方式利用統計模型的條件獨立結構。 梅特羅波利斯-黑斯廷斯演算法和哈密頓蒙特卡羅較少受到統計問題的直接影響,它們與早期採用優化演算法計算最小二乘和最大似然估計的方式相似。 被稱為近似貝葉斯計算的方法透過模擬生成模型,而不是評估似然函數來獲得後驗推斷,如果似然的分析形式難以解決或計算成本很高,那麼就可以使用這種方法。

    透過效用最大化、錯誤率控制和經驗貝葉斯分析,以及在貝葉斯決策理論和錯誤發現率分析中,可以看出適應性決策分析的發展。 統計決策分析的一些重要發展涉及貝葉斯優化和強化學習,它們與 A/B 測試實驗設計的復興有關。 算力的發展,使得用高斯過程和神經網絡等參數豐富模型作為函數先驗,並執行大規模強化學習成為可能。例如建立 AI 來控制機器人,生成文本,並玩圍棋等遊戲。 這項工作大部分都是在統計之外完成的,使用的方法包括非負矩陣分解、非線性降維、生成對抗網絡以及自編碼器,而這些都是用於查找結構和分解的無監督學習方法。

    魯棒性的概念是現代統計學的核心,它的意義在於即使模型的假設不正確,也依然可以被使用。 統計理論的一個重要部分就是開發在違反這些假設的情況下運行良好的模型。 一般而言,魯棒性在統計研究中的主要影響不在於特定方法的開發,而在於統計程序的評估,其中數據-生成過程不屬於擬合概率模型的類別。 研究人員對魯棒性的擔憂與作為現代統計數據特徵的密集參數化模型相關,這將對更普遍的模型評估產生影響。

    探索性數據分析強調漸近理論的侷限性,以及開放式探索和交流的相應好處。這符合統計建模的觀點,也就是更側重於發現而不是固定假設的檢驗。 計算的進步使從業者能夠快速構建大型複雜模型,從而導致統計圖形的思想有助於理解數據、擬合模型和預測之間的關係。

    由於建模的需求不可避免地隨著計算能力的增長而增長,因此分析性的總結和近似的價值也是如此。 同時,統計理論可以幫助理解統計方法的工作原理,數學邏輯可以激發數據分析的新模型和方法。 作者認為這些方法開啟了對統計的新思考方式和數據分析的新方法。 反事實框架將因果推斷置於統計或預測框架內,在該框架中,可以根據統計模型中未觀察到的數據精確定義和表達因果估計,並與調查抽樣和缺失數據插補中的思想聯繫起來。 自舉法打開了一種隱式非參數建模形式的大門。可用於複雜調查、實驗設計和其他無法進行分析計算的數據結構的偏差校正和方差估計。 過參數化模型和正則化基於從數據中估計其參數的能力來形式化和概括了現有的限制模型大小的做法,這與交叉驗證和信息標準有關。其中,正則化允許用戶在模型中包含更多的預測變數,而不必擔心過度擬...

  2. 2024年4月8日 · 2024-04-08. 分享本文. 自從 OpenAI 推出 ChatGPT 以來,每個人或多或少在個人或工作中,會談論起生成式 AI ,甚至親自嘗試這項新技術,藉此節省工作時間、實現目標。 有些人會使用生成式 AI 來製作行銷素材、撰寫文章摘要,或協助擬定減肥計畫、做作業、假期規劃,甚至有些人已經開始透過 AI 賺錢! 你是否好奇,推動這波 AI 浪潮、最有影響力的科技領袖,自己又是怎麼用 AI 的呢? 以下帶你快速掌握,Meta、Google、微軟和其他科技巨頭的企業領袖, 他們親自使用 AI 的方式,或許能為讓你對 AI 的使用方法帶來更多靈感: NVIDIA 黃仁勳:幾乎每天使用 Perplexity AI.

  3. 2020年1月17日 · 「認知扭曲」是由知名的心理學家 Aaron Temkin Beck 所提出,它就像個自動化的濾鏡,決定你所看見的是令人沮喪的黑白色調,還是令人喜悅的彩色。 它是一種根深蒂固的思考習慣,自然到你很難發現它的存在,卻危害著你的情緒健康和人際關係。 以下是最常見的六種認知扭曲: 1.非黑即白. 非黑即白就是「二分法」思考,看待任何人事物不是壞的就是好的,就像小孩子一樣,會把熟悉的爸媽視為好人,陌生人都視為壞人一樣。 世界上最成熟的顏色是「灰色」。 沒有什麼事是絕對的壞事,也沒有什麼人是絕對的壞人,發生在你身上的衰事,也藏有值得學習的寶貴經驗。 2.選擇性摘要. 俗稱斷章取義,一張白紙上如果有個黑點,我們往往只注意那個黑點,而忽略其他白的地方。

  4. 2017年12月12日 · 皮克斯最新動畫電影可可夜總會描述一位家裡從事製鞋業的小男孩米高對吉他懷抱夢想但家族卻因為過往不好的經驗而唾棄音樂並有不得接觸音樂的家訓。 就在「亡靈節」這天,米高意外進入亡靈的世界,他必須在亡靈節結束前找到在夜總會的祖先家人,才能回到活人的世界。 在這過程中米高也發現了過往家族和音樂的心結,並試圖讓它們和解。 (責任編輯:李恬芳) 文/Abby. 記得第一次去電影院看的皮克斯電影是《玩具總動員2》,那時候我才五歲,當時看電影看的不是劇情,只要畫面鮮豔都能吸引小朋友目光。 隨著年紀的增長,看動畫片或卡通的次數並沒有減少,在動畫的世界裡,所有發生的事情都是合理並且保有童真的,這讓我能將自己沈浸在動畫的世界彷彿一切現實生活中的事情都不重要了。

  5. 2022年4月25日 · 20 年前就脫胎為數位國家的愛沙尼亞,為什麼值得台灣發展數位政府時借鏡?. 為落實台灣數位轉型,台灣數位發展部整合目前分散在各部會數位相關的業務:通訊、資訊、資通安全、網路及傳播等 5 大領域,今年將掛牌。. 台灣政府的數位轉型不算快,因為 ...

  6. 2018年3月16日 · 2018-03-16. 分享本文. 【我們為什麼挑選這篇文章】霍金,許多人覺得他並沒有這麼偉大,無法跟牛頓等著名科學家齊名。 不過,我想霍金本身的存在,對於這個世界就是一種勇氣,給予這個世界更多往前進的力量,找尋更好的生活、更好的自己。 (責任編輯:陳君毅) 2006 年,史蒂芬霍金 (Stephen William Hawking) 訪問香港科技大學。 一位名叫鄭邵斌的癱瘓患者向霍金提問,對安樂死合法化怎樣看,像他們這樣的人,是否應該享有安靜無痛苦地結束自己生命的權利。 提問者和回答者同在現場,坐在各自的輪椅上。 鄭邵斌大學畢業那年摔傷,致頸椎斷裂,頸部以下癱瘓,無法說話。 霍金罹患肌萎縮性脊髓側索硬化症,也即俗稱的「漸凍人症」 (ALS)。