目前工業界遇到最大的問題莫過於文本分析,文本資料大量存在公司的信件資料,例如:網頁客戶問題留言、Facebook的訊息、留言與分享、網站銷售的產品評價、產品維修紀錄、機台log紀錄等資訊,這些大量資料分析不易,卻是大量知識存在的地方,透過大數據的文本分析可以用來處理這大量的非結構化的文字資料。
透過自然語言分析的方法,把非結構化、沒有固定的欄位的文字資料進行量化,透過量化後,再將其轉成特定意義來加以統計與分析。
皮托科技執行長簡榮富表示,業界目前文本分析,大多數都還是採用Python來進行撰寫,往往都要花上好幾個月的時間。許多公司在皮托技術團隊的輔導下,透過大數據分析軟體中英文本分析模組,使用流程圖示化建模方式,可以快速建立各種問題的流程模型,可載入廣泛的資料來源,進行爬文, log檔案、word及pdf等資訊載入系統中來進行分析。軟體內建字典資料庫,內建的字典來進行關鍵字摘擷和表格方式,以顯示語詞的出現頻率,與出現的次數。
經關鍵字提取後,可以顯示常見的詞雲,語詞關聯分析,以及詞語議題的關聯現象。系統可設定依照出現的字組合來進行關鍵字提取,後續再匯入自訂辭典。
皮托科技成立於1992年,更早在20年前就將資料探勘的技術(即現今Big Data大數據分析技術)導入業界的技術顧問公司,成功輔導過國內半導體展業、汽車製造業、電信業、軍事單位、政府單位、軌道業…等,主要業務為Big Data大數據分析技術、系統自動化模擬服務、CAE有限元素多重物理耦合模擬計算及工業4.0解決方案等顧問諮詢輔導,公司更通過了經濟部工業局技術服務能量的肯定認證。