機器學習圖片影片辨識 API – Google vs Amazon vs Microsoft AI 比較大全 (四)

Google, Microsoft 和 Amazon 機器學習圖片/影片辨識 API 的比較 (四)

上一篇帶您了解 Google, Amazon, Microsoft 在文字分析和翻譯 API 上的差異後,這一篇將帶您了解在圖片和影片辨識的領域中,這三間大廠 API 的特性與優劣。

圖像與影像處理 APIs: Amazon Rekognition

Rekognition API 用於圖像以及最近的影像識別任務。 這其中包括了:
•  
物件偵測和分類(查找和偵測圖像中的不同物件並定義它們是什麼)
•  
可以增測出影像中像是“跳舞”或是“撲滅火”等複雜動作
•  
臉部識別(用於偵測人臉並找到匹配的面孔)和情緒分析(這個分析相當有趣,因為它可以偵測到笑臉,分析眼睛,甚至在影像中定義情感情緒)
•  
檢測不適當的影像
•  
辨識出圖片和影像中的名人(無論目標是什麼)

圖像與影像處理 APIs:Microsoft Azure 認知服務

來自 Microsoft 的 Vision 套件結合了六個 APIs,主要在於分析不同類型的圖像,影像和文本。
•  
電腦視覺,識別物件、動作(如行走),並在圖像中定義主色
•  內容過濾,在圖片、文字和視頻中偵測不適當的內容
•  
臉部 API 偵測臉部,將其分組,並定義年齡,情緒,性別,姿勢,笑容和鬍子
•  
情緒 API 是另一種用來描述臉部表情的識別工具
•  
Custom Vision Service 支持您使用自己的數據構建來定義圖像識別模型
•  
影像索引器是一種在影像中查找人物的工具,定義語音情感並標記關鍵字

圖像與影像處理 APIs:Google Cloud Services

Cloud vision API – 該工具是為了圖像的識別而建立的,對於找尋特定的圖像屬性非常有用:
•  
標記物件
•  
偵測人臉並分析表情
•  
尋找地標和描述現場(例如假期,婚禮等)
•  
在圖像中找尋文字並識別語言
•  
主色調

Cloud Video Intelligence – Google 的影像識別 API 在開發初期就比 Amazon Rekognition 和 Microsoft Cognitive Services 提供的功能較為缺乏。 目前的 API 提供了以下工具集:
•  
標記並定義動作
•  
識別明確的內容
•  
錄製語音

在功能列表級別上,Google AI 服務可能缺乏一些功能,但 Google API 所具有的強大功能就在於 Google 可以將取得的大量數據集中。

特定的 API 和工具

我們將在這裡討論來自 Microsoft 和 Google 的特定 API 產品和工具,並沒有包括 Amazon 是因為它們的 APIs 僅僅與文字分析和圖像 + 影像分析的上述類別相匹配。 但是,這些特定的 APIs 的一些功能也存在於 Amazon 的產品中。
Azure Service Bot framework – 微軟已經致力於為用戶提供靈活的機器人開發工具集。 基本上,該服務包含用於使用不同編程語言構建,測試和部署機器人的完整環境。
值得一提的是 Bot Service 並不一定需要使用機器學習的方式,由於微軟提供了五個模板(基本,形式,語言理解,主動和問答),其中只有語言理解類型需要高級的 AI 技術。
目前來說,您可以在 Azure 上使用 .NET 和 Node.js 的技術構建機器人,並將其部署到以下平台和服務上:
•  Bing
•  Cortana
•  SkypeWeb Chat
•  
Office 365 email
•  
GroupMe
•  
Facebook Messenger
•  
Slack
•  
Kik
•  
Telegram
•  
Twilio

Bing Search from Microsoft 微軟提出了七個與核心 Bing 搜索功能連接的 API,包括自動建議,新聞,圖片和影片搜索。
Knowledge from Microsoft 這個 APIs 將文本分析與廣泛的獨特任務相結合:
•  
Recommendations API 允許構建購買個性化的推薦系統
•  
Knowledge Exploration Service 允許您輸入自然查詢以從數據庫檢索數據,視覺化數據和自動完成查詢
•  
Entity Linking Intelligence API 被設計為突顯適當實體的名稱和詞組(例如年代搜索),並確保消除歧義
•  
Academic Knowledge API 會自動完成詞彙,在文字與構思上找到文件中的相似性,並搜索圖形模式
•  
QnA Maker API 可用於將問題的變化與答案進行匹配,以構建服務客戶的聊天機器人和應用程序
•  
Custom Decision Service 是一種強化學習工具,可根據用戶的喜好對不同類型的內容(例如連結、廣告等)進行個性化和排名

Google Cloud Job Discovery API 仍然屬於早期發展的階段,但很快就可能重新定義我們今天的求職能力搜尋。 與依賴精確關鍵字匹配的傳統求職引擎不同的是 Google 採用機器學習的方式來找出高度變異性的職位描述之間的相關聯繫,以避免模棱兩可。例如,它努力減少不相關或太廣泛的回報,例如查詢“銷售助理”將關鍵字 “assistant” 回傳。API 的主要特點是什麼?
•  
修正在工作搜索查詢中的拼寫錯誤
•  
配對所需的資歷水準
•  
查找可能具有不同表現形式和行業術語的相關工作(例如,將“server”查詢回傳為“咖啡師”而不是“網絡專家”;或者將”biz dev”的查詢回傳”業務人員”)
•  
處理縮略詞(例如,為“HR”查詢回傳為“人力資源助理”)
•  
配對不同的崗位的描述

延伸閱讀:

機器學習該選誰?Google vs Amazon vs Microsoft AI 比較大全 (一)
機器學習該選誰?Google vs Amazon vs Microsoft AI 比較大全 (二)
機器學習文字分析/翻譯 API – Google vs Amazon vs Microsoft AI 比較大全 (三)
IBM Watson 及其他 AI 解決方案 – Google vs Amazon vs Microsoft AI 比較大全 (五)

(原文來自合作部落格 altexsoft,GCP 專門家授權翻譯轉載。)

 


連絡「GCP 專門家」