如何訓練機器學習系統? – Machine Learning 教學系列(三)

機器學習系統是如何被訓練的?(三)

在了解 AI、Machine Learning、深度學習的差異以及如何選擇正確且合適的資料後,我們來看看機器學習系統是如何被訓練的吧!

監督式學習

Machine learning program 提供了帶有標籤的訓練數據,它可以告訴系統如何對示例數據進行分類,舉例來說:

顏色 重量 標籤
紅色 200g 蘋果
橘色 300g 橘子
綠色 150g 蘋果

這裡的每一列數據,都是由我們告訴系統:在給定兩個輸入(顏色和重量)的條件下,預期的輸出標籤應該是什麼(是蘋果?還是橘子?)。接下來,機器學習系統會依據給定的資料進行預測,以決定新的輸入(顏色和重量)代表的是蘋果或是橘子。較多研究集中在這個領域。

非監督式學習

機器必須從一個未標記的數據集中學習。

想像一下,一個圖表上有一堆點分別代表三個不同的東西,機器必須替3個不同的集群完成分類。這是非常棘手的,因為事前並不知道集群的數量,所以必須做出最好的猜測。另外,有時這些叢集不像這裡顯示的那樣清楚。

強化學習

透過獎勵或懲罰的機制來反復學習。該程序透過數百萬次的遊戲來學習,當它做出一個很好的舉措時,我們獎勵它的行為,這使它強化了對此舉動的連接。當它失敗時,我們則不給予獎勵 (或是負面的獎勵) 。

隨著時間的推移,它會學習如何在沒有人明確地告訴它規則的情況下將報酬最大化。當它做出以前從來沒有人想過的動作時,它可以比人的表現更好。

它們是怎麼運行的?

ML 系統可以嘗試多種學習模式來提交數據給它來進行分類,我們將通過接下來幾個非常簡單的例子 (真正的 ML 系統經常使用兩個以上的維度) 帶您了解一些系統背後的概念與見解。

事實上,在頂尖的研究成果背後所使用的數學方法和理論會比這些簡單的例子還要複雜,(有時甚至會同時結合數個複雜的數學方法以達到更好的成果,不過這部分已經超過本文所探討的內容),但是透過數學來找到模型的基本原則仍是相同的。

範例一

記得在高中時,你必須繪製一個X,Y圖上的點,然後繪製一條最切合的線? 這就像一個非常簡單的ML系統。在這個例子中,用你繪製的那一條線,你可以預測給定的X,可能會有什麼Y值 – 即使是未知的值,這是一種 “迴歸分析” 的形式。

ML程序靠自己來計算這些線

範例二

在這個例子中,我們可以透過使用一條線來劃分兩個集群,以此來預測未來的例子。通過線上的任何東西很有可能是紅色的類別,線以下的任何東西都是藍色的類別。正如你所看到的那樣,雖然可能會有一些異常值,但是大部分它都會預測正確。我們在這裡使用了一條直線作為分隔線,但實際上這條分隔線也有可能更複雜,它也有可能是一條拋物線。

範例三

在這個例子當中,並不是以線條的方式呈現,我們可以看到ML被用來學習如何透過抽樣X來知道點附近的分類有兩個點集群,顏色背景顯示它將如何預測在沒有現有點的地區之前從未見過的未來點。例如我們在右下角創建了一個觀察點,它會將其歸類為藍色數據,因為最接近的3個點大部分是藍色的,分類的類型被稱為最近鄰居法

神經網絡

我們的大腦由86億左右的 “神經元” 相互聯繫組成,每個神經元對某些刺激作出反應,並將輸出傳遞給另一個神經元。例如,可能是一個專用於識別貓一群神經元 (一些用於毛皮,眼睛,鬍鬚等) ,每個都有一個不同的權重 (根據該特徵的重要性)對整體貢獻。 如果所有條件都成立,你的大腦將告訴你看到一隻貓。在ML當中,人造神經網絡 (鬆散地模擬大腦) 被用來計算他們所訓練特徵的概率。

深度神經網路

深度神經網路 (DNN) 只是由輸入和輸出之間的許多 “隱藏層” 組成。 每一層都可以從中學到更高層次的學習。 這些隱藏層通常具有較低的維度,因此它們可以更好地概括,而不會過度地適應輸入數據。系統中的這些中間層可以學習功能的特徵。例如一連串的“邊緣”特徵可能會導致辨識出 “部分面容” ,最後系統可以識別出 “臉”。

ML的輸出類型

常見的ML輸出類型

1. 迴歸分析 – 預測數值 (e.g. 房價)
2. 分類 – n個標籤之一 (e.g. 貓、狗、人)
3. 分群 – 與其他例子最為相似 (e.g. Amazon上的相關產品)
4. 序列預測 – 接下來是什麼?  例如給定一段文字,根據上下文填空”

連續輸出

這意味著ML系統的輸出是十進位制數,例如 8.3984。
因此給了一些輸入,你將得到一些數字的輸出。 舉例來說,假設一個橘子重200克,其半徑是4.2英寸,這裡將得到的輸出是4.2,這是ML系統嘗試預測出來的。 線性回歸試圖擬合一條直線到數據,以便您可以給定輸入 (x) 來預測某個值 (y)

分類

所有數據的類別 (或標記) 是由一組輸入所決定,而輸出為離散的。舉例來說:
輸入:頭髮,爪子,鬍鬚
輸出:貓
輸出的會是一個標籤,而不是像迴歸分析或概率估計那樣是個數字。

概率估計

這意味著ML系統的輸出是介於0到1之間的十進位制數,表示我們認為給定輸入是某個期望輸出的機率 (0.751 == 75.1%) 。舉例來說:ML系統可以預測瓶子裡有多少個白色磚塊,如果它以54.3%的概率輸出 “9”,那麼我們就可以根據這個資訊和信心指數做一些很有用的事情。

輸出的使用

一旦你以迴歸分析、概率估計、或分類的形式輸出,那麼程式設計師就可以做一些有用的事以獲取資訊。假設我們80%確定我們看到的是一隻貓,也許我們會想要餵牠。 但如果我們只有75%的把握,也許我們會等待直到我們更確定。

延伸閱讀

1. 人工智慧、機器學習、深度學習是什麼? – Machine Learning 教學系列 (一)
2. 該怎麼選擇資料,來訓練機器學習系統? – Machine Learning 教學系列(二)

 


iKala - GCP 專門家

GCP 專門家,Google Cloud 首席合作夥伴暨代理商,協助逾 200 家企業使用 Google Cloud,客戶廣布遊戲、媒體、數據廣告、電商、金融等多種產業。我們擁有超過 30 位技術人員,更通過 Google 原廠雲端架構師及資料工程師認證,具備第一手 GCP 產品開發及導入經驗,能提供您紮實的客製化技術服務。

我們提供了多項的 GCP 加值服務:

了解更多: https://gcp.expert/
加入我們: https://goo.gl/rg9D3Q
Facebook Fan Page: https://www.facebook.com/gcp.expert/
聯絡我們:+886 2 87681110 或請來信 gcp@ikala.tv