在進行AI數據分析前,資料前處理是重要的工作,沒有處理好的資料,就難顯示其資料的價值。主因 “ Garbage
In Garbage Out”。而現實是資料不可能是乾淨的,他夾雜的主要影響因子,也包含了因為量測誤差與隨機性,環境噪訊等問題。因此資料前處理階段決定了後續執行AI演算法的結果好壞。因此,異質資料彙整與前處理是AI數據分析重要的一環。有時需要整合不同資料庫來快速確認特定參數在AI演算法的貢獻度,可以快速找到主要輸入變數對目標的影響,已決定專案開發的目標方向。
本研討會主要介紹運用Low code/No code的PolyAnalyst大數據分析工具來進行異質資料前處理,包含資料庫合併,欄位名稱變更合併,資料內容抽取等功能,以快速搜尋那些AI演算法找出輸入參數對目標貢獻度,再找出相關參數對應目標後,再決定查詢論文中合適AI演算法來開發專案,以加快專案開發期程。