人工智慧物聯網AIOT文章分享


人工智慧物聯網AIOT-034

先知科技總經理 高季安

October 10, 2024

在前一篇文章中,我們透過語音辨識與人臉辨識這兩個生活中常見的應用案例,深入了解了人工智慧(AI)技術是如何運作的。你或許會發現,這些技術的核心都圍繞著如何從大量數據中學習,進而達到高效的辨識與判斷能力。而在AI的世界中,選擇正確的演算法對於解決不同問題至關重要,就像烹飪一頓美味佳餚需要選擇合適的食材一樣。那麼,我們應該如何挑選演算法?有哪些因素會影響我們的選擇?在這篇文章中,我們將以數據AI為例,探討演算法的選擇因素與使用時機,讓你更深入理解AI如何選擇適合的工具來解決現實中的問題。準備好開始這趟旅程了嗎?讓我們一起來看看吧!

一、數據人工智慧演算法選擇

在人工智慧(AI)與數據分析的領域中,選擇合適的演算法是非常重要的,因為每一個演算法都有不同的特性和適用範疇。在選擇演算法時,我們需要考慮數據的類型、需求的優先級(如速度與精準度),以及問題的具體特徵(如圖1)。接下來,我們將以輕鬆詼諧的筆觸,帶您一步步了解如何選擇合適的演算法,以及各種演算法的應用場景。

圖1.數據人工智慧演算法選擇

  • 1 數據的性質:

    有無明確的 Y 值 => 選擇演算法的第一步,是看你的數據集有無明確的「Y 值」(即目標變數)。有明確的 Y 值,表示這是一個監督式學習的問題,否則便屬於非監督式學習。

    • 1.1 有 Y 值的情況:

      這時我們會根據問題的特性來選擇演算法。如果目標變數(Y)是數值型(例如預測房價),我們通常會使用迴歸演算法;若目標變數是分類型(如區分貓狗照片),則適用分類演算法。

    • 1.2 無 Y 值的情況:

      如果數據集中沒有明確的目標變數,我們要使用非監督式學習。這類演算法主要用於分群和關聯性分析,例如使用 K-means 進行分群分析,或使用主成分分析(PCA)來降低數據的維度。

  • 2 速度與精準度的權衡:

    在選擇演算法時,速度和精準度之間的權衡也是一個重要考量。下圖展示了常見的演算法及其應用場景:

    • 2.1 速度優先:

      如果你的應用場景對速度要求很高,像是即時的預測或快速反應的應用,SVM(支持向量機)和決策樹是很好的選擇。這些演算法能在短時間內提供相對準確的結果,適合處理非線性問題。

    • 2.2 精準度優先:

      如果你的應用對精度要求更高,那麼 K-最近鄰演算法(K-NN)、隨機森林或類神經網路是更好的選擇。這些演算法能通過大量數據學習,提供更準確的預測,適合中、大樣本的應用。

  • 3 常見演算法介紹:
    • 3.1 SVM(支持向量機):

      適合處理高維數據,並且擅長處理非線性問題。SVM 通過「kernel trick」來找到一個最優的分類邊界,這個特性使得它在許多分類問題中都表現得非常好。

    • 3.2 決策樹:

      一種基於樹形結構的演算法,用來進行分類和迴歸。它可以直接處理非線性問題,而且結果容易解釋。決策樹的速度較快,適合處理速度優先的場景。

    • 3.3 K-最近鄰演算法(K-NN):

      這是一個簡單且直觀的演算法,基於「距離」來進行分類。當你有一個新的數據點時,K-NN 會找到與它最接近的幾個鄰居,並根據鄰居的標籤來做出預測。這在某些場景下可能速度較慢,但它在需要高精準度的應用中非常有效。

    • 3.4 隨機森林:

      這是由多個決策樹組成的集成學習演算法。通過訓練多個決策樹並投票決定最終結果,隨機森林可以提高預測的準確度,並減少過擬合的風險,適合中、大樣本數據集。

    • 3.5 類神經網路:

      適合大樣本數據,並且能夠處理複雜的非線性問題。這類演算法擅長圖像識別、語音辨識等應用,但它的計算量較大,且需要大量的計算資源。

  • 4 強化學習:

    強化學習是另一個非常重要的學習模式,特別適用於尋求最佳解的場景。例如,在遊戲中的最佳路徑選擇問題,或者在機器人的路徑規劃中,強化學習能夠通過不斷試錯來學習最優策略。強化學習並不像監督式學習那樣依賴於大量已標註的數據,而是通過「獎勵與懲罰」來逐步優化策略。它的目標是在特定情境下找到最佳的行為方案。

選擇適合的演算法是一門藝術,需要考慮數據的性質、問題的特性以及應用場景的需求。無論你是需要速度還是精準度,本文為你提供了選擇演算法的基礎框架。在實際應用中,還需要根據數據的具體情況來調整和優化演算法,才能發揮其最大的效用。

Ref to: Ng, A., & Soo, K. (2023). Numsense! Data Science for the Layman: No Math Added (文科生也看得懂的資料科學). Packt Publishing.

作者已盡力查證相關資料來源,若是讀者對此系列文章有任何資料來源的指正或其他意見,歡迎提供正確資料來源與建議,請投書: fs-tech@fs-technology.com。

由於篇幅限制,若讀者針對數位轉型(例如人工智慧或物聯網) 相關議題有興趣或想共同進行合作,皆可與先知科技聯絡 (fs-tech@fs-technology.com 或http://www.fs-technology.com/)。

  • E-mail: fs-tech@fs-technology.com

  • Link: http://www.fs-technology.com/