機器學習該選誰?Google vs Amazon vs Microsoft AI 比較大全 (一)

GCP vs AWS vs Azure:Machine Learning 介紹 (一)

對於大多數企業來說,機器學習看似與火箭科學一樣需要大量資金和人才,而事實上也的確如此。「一切皆服務」的趨勢正逐步影響這個複雜的領域,你可以在沒有太多投資的情況下快速啟動機器學習計劃。如果你是數據科學的新手,想先做初步的嘗試,這的確是正確的做法。

其中一個令人印象深刻的機器學習應用,是關於一個日本農民利用機器學習自動分類黃瓜,協助父母經營農園的故事。這不同於其他大型的企業,這個人既沒有機器學習的專業知識和預算,但他設法了解 TensorFlow,並深度去辨別不同類別的黃瓜。

通過使用機器學習雲服務,您可以開始構建您的第一個工作模型,從相對小組的預測中獲得有價值的見解。我們已經討論過機器學習策略。 現在讓我們來看看市場上最大的幾個機器學習平台:Google Cloud / AWS /Azure,並考慮一些基礎設施決策。

什麼是機器學習即服務?

機器學習即服務(MLaaS)是自動化和半自動化雲平台的總括性定義,它涵蓋大多數基礎設施議題(如數據預處理、模型訓練和模型評估以及預測)。預測結果可以通過 REST APIs 與您的內部 IT 基礎架構連接。

Google Cloud AI、Azure Machine Learning 和 Amazon Machine Learning 是市場上領先的雲端 MLaaS 服務,可以在少量或沒有數據科學專業知識的情況下進行快速模型培訓和部署。

在這篇文章中,我們將首先簡單介紹 Google、 Amazon 和 Microsoft 主要的機器學習即服務平台,並比較這些供應商的機器學習 APIs。

定制預測分析任務的機器學習服務


Azure ML studio 擁有最全面的服務;但如果您需要使用深度神經網絡,我們建議您查看Google ML Engine 和 Amazon SageMaker。

現在聯繫 GCP專門家,瞭解更多 GCP 加值服務!

Amazon ML 的預測分析

Amazon Machine Learning services 有兩個層面:Amazon ML 預測分析、為數據科學家而設的 SageMaker。

Amazon Machine Learning 預測分析是市場上其一個最具自動化的解決方案,適合用於交付時限非常緊迫的工作。該服務可以載入多種數據來源,包括 Amazon RDS、Amazon Redshift、CSV 等。所有數據預處理操作都是自動執行的:標識哪些字段是分類的;哪些是數字的。並且不要求用戶選擇進一步數據預處理的方法(降維和白化)。

Amazon ML 的預測能力只限於三種選擇:二元分類、多類分類、迴歸分析。 也就是說,Amazon ML 服務不支持任何無監督的學習方法,用戶必須選擇一個目標變量來標記訓練集。 而且,用戶不需要知道任何機器學習方法,因為 Amazon 會查看數據後自動選擇方法。

高度自動化既是 Amazon ML 的優勢,同時也是壞處。 如果您需要一個完全自動化但有限的解決方案,該服務可以符合您的期望。 如果沒有,你可以選擇 SageMaker。

Amazon SageMaker 和 frameworks-based services

SageMaker 是一個機器學習環境,透過提供快速建模和部署工具來簡化數據科學家的工作。 例如,它提供 Jupyter,一個可以簡化數據瀏覽和分析的創作筆記本,可避免管理伺服器的麻煩。Amazon 也有內建演算法,針對分佈式系統中的大型數據集和計算進行最佳化。其中包括:

•  Linear learner,是一種具監督性,用於分類和迴歸分析的方法
•  具有分類和迴歸分析的分解機器,用於稀疏數據集
•  XGBoost是一個具有監督性的增強樹算法,通過結合簡單演算法來提高分類、迴歸分析和排序的預測準確性
•  基於ResNet的圖像分類,它也可以應用於轉移學習
•  Seq2seq是用於預測序列的監督式算法(例如:翻譯句子或將字符串轉換成更短的詞彙等)
•  K-means是一種用於聚類分析的無監督學習方法
•  用於降維的主成分分析(PCA)
•  Latent Dirichlet分配是用於文件尋找分類的無監督式方法
•  神經主題模型(NTM)是一種無監督的方法,用於探索文件並展示排名靠前的詞語,並定義主題(用戶不能預先定義主題,但可以設置主題的預期數量)

SageMaker 的內置方法與 Amazon 建議的 ML API 很大程度相交,但允許數據科學家使用它們並使用自己的數據集。

如果您不想使用這些功能,您可以添加自己的方法,通過 SageMaker 的部署功能運行模型。 或者,您可以把 SageMaker 與 TensorFlow 和 MXNet 結合在一起。

一般來說,Amazon 機器學習服務是為有經驗的數據科學家和無需深入準備數據集和建模的使用者提供了足夠的自由度。 對於已經在使用亞馬遜環境,並且不打算轉移到其他雲端供應商的公司來說,這將是一個堅實的選擇。

延伸閱讀

延伸閱讀:

介紹完機器學習即服務和 AWS 預測分析,下一篇我們將介紹 Google Machine Learning Engine, Azure Machine Learning Studio。更多雲端服務資訊,歡迎聯繫 iKala – GCP 專門家

機器學習該選誰?Google vs Amazon vs Microsoft AI 比較大全 (二)
機器學習文字分析/翻譯 API – Google vs Amazon vs Microsoft AI 比較大全 (三)
機器學習圖片影片辨識 API – Google vs Amazon vs Microsoft AI 比較大全 (四)
IBM Watson 及其他 AI 解決方案 – Google vs Amazon vs Microsoft AI 比較大全 (五)

(原文來自合作部落格 altexsoft,GCP 專門家授權翻譯轉載。)

 


連絡「GCP 專門家」