人工智慧物聯網AIOT文章分享


人工智慧物聯網AIOT-050

先知科技總經理 高季安

February 06, 2025

在上一篇文章中,我們深入了解了工業人工智慧(Industrial AI)與一般人工智慧(General AI)的差異,就像是比較工業級電腦與家用電腦一樣,前者要求高準確性與穩定性,而後者更注重靈活性與創意應用。然而,不論是哪一種類型的AI,能否成功發揮效能的關鍵都在於一件事:資料!如果把人工智慧比作一位大廚,那麼大數據資料就像是他的食材,資料的品質和準備過程會直接影響這位大廚的最終菜餚。

那麼,問題來了,這些「食材」究竟是怎麼來的?大數據資料並不是天上掉下來的,而是需要透過精心的搜集、分類和處理來準備妥當。舉例來說,我們要訓練一個辨識貓咪的AI模型,第一步得先找到足夠多的貓咪照片,這就像是到超市選擇最新鮮的番茄;接著,我們需要給每張照片標註,告訴AI哪張是貓咪,哪張是狗,這步驟就像是準備番茄的去皮、切塊;最後,還得過濾掉一些「奇怪」的照片,比如被塗鴉的貓圖,這相當於挑掉不好的食材。

接下來的文章,我們將帶你探索如何進行大數據的搜集、分類與處理,揭開人工智慧運作的幕後祕密。準備好了嗎?讓我們開始吧!

一、大數據資料搜集與處理:AI成功的幕後功臣:

說到人工智慧(AI)的成功,台積電曾經說過一句名言:「No data,No AI。」沒有資料,人工智慧根本無從發揮。所以,資料搜集與處理就像是人工智慧的地基,建得不穩,所有的努力都可能付諸東流。在這篇文章中,我們將深入探討資料的型態分類,以及如何一步步地進行資料清理、整合、轉換和前置處理,讓AI模型能以最佳狀態運作(如圖1)。

圖1.大數據運作機制

數位孿生的三大核心應用場景:

  • 資料型態-AI的原材料: 資料的型態多種多樣,可能是結構化的數據(像是資料庫表格中的行與列)、非結構化的數據(如圖片、影片、音訊)或是半結構化的數據(像是JSON或XML檔案)。在智慧製造中,資料型態的選擇尤為重要。例如,生產線上的感測器會生成時間序列數據,而監控攝影機則提供影像資料。正確選擇資料型態,才能確保後續分析的準確性。
  • 資料處理-清理、整合、轉換和前置處理: 資料處理是人工智慧建模前的核心步驟,以下是各個處理階段的詳細介紹:
    • 資料清理 (Data Cleansing): 清理的目的是去無存菁,過濾掉不完整或不準確的資料。例如,製造業中的感測器數據可能包含異常值或噪音,這些問題需要透過統計方法進行修正。就像警方追蹤嫌犯的攝影機畫面,清理過程中要去除模糊的影像或無關的物件,確保資料純淨。
    • 資料整合 (Data Integration): 整合是將來自不同來源的資料合併為一個統一的格式。例如,一家工廠可能有多個生產線,每條生產線的感測器資料格式不一致。透過資料整合,可以將不同格式的資料匯總在一起,建立一個完整的全貌。
    • 資料轉換 (Data Transformation): 當資料來源的解析度或單位不一致時,轉換就派上用場。例如,一台攝影機的影像解析度是800x600,而另一台是1024x768,透過轉換,這些不同的影像資料可以標準化,以便進行統一分析。
    • 資料前置處理 (Data Preparation): 前置處理就像是為資料「梳妝打扮」。它針對資料的特定應用進行調整。例如,警方追蹤嫌犯時,需要根據拍攝條件調整影像亮度和對比度,確保AI能準確辨識不同光線條件下的人臉特徵。
  • 資料處理應用案例如下:舉個實際的案例來說,智慧城市中使用的攝影機系統,可能會捕捉到不同時間點、不同角度的路況影像。假設一名嫌疑犯從台南逃竄到高雄,這一路上可能經過不同解析度的攝影機,甚至光線條件也有所不同。資料清理的第一步是過濾掉無用的影像;整合階段將來自台南、高雄的資料統整成可分析的格式;接著透過轉換,統一解析度與影像比例;最後在前置處理中,根據嫌犯的特徵進一步調整圖像,讓AI能精準辨識。

  • 大數據資料搜集的挑戰: 大數據資料搜集絕非易事。以工業AI為例,資料的來源分散且樣本有限,與一般AI依靠大規模公開數據集訓練相比,挑戰更大。此外,工業資料需要極高的準確性,任何一點誤差都可能導致重大生產損失或安全問題。

AI的運作離不開資料,而資料搜集與處理則是這一切的基石。從清理到前置處理,每個步驟都關乎資料的準確性與適用性。無論是工業生產中的智慧製造,還是智慧城市中的公共安全,這些技術都依賴於高質量的大數據支援。在下一篇文章中,我們將探討資料分析與模型訓練如何進一步提升AI的效能,敬請期待!

Ref to: 圖1參考自科學月刊

作者已盡力查證相關資料來源,若是讀者對此系列文章有任何資料來源的指正或其他意見,歡迎提供正確資料來源與建議,請投書: fs-tech@fs-technology.com。

由於篇幅限制,若讀者針對數位轉型(例如人工智慧或物聯網) 相關議題有興趣或想共同進行合作,皆可與先知科技聯絡 (fs-tech@fs-technology.com 或http://www.fs-technology.com/)。

  • E-mail: fs-tech@fs-technology.com

  • Link: http://www.fs-technology.com/