人工智能視覺,就像用人工智能進行圖像處理一樣,是一個高度討論的話題。然而,這種復雜的新技術的潛力還沒有在某些領域找到應用,如工業(yè)應用;因此,長期的經(jīng)驗值是有限的。
圖片來源:IDS Imaging Development Systems GmbH
盡管市場上有許多允許在工業(yè)環(huán)境中使用人工智能的嵌入式視覺系統(tǒng),但許多設施運營商仍在猶豫是否要投資這些平臺之一并更新其應用。然而,人工智能已經(jīng)展示了創(chuàng)新的可能性,在基于規(guī)則的圖像處理已經(jīng)沒有選擇,缺乏解決方案的地方。因此,問題是,是什么阻礙了這項新技術的廣泛采用。
阻礙技術的主要因素之一是被稱為 "用戶友好性 "的障礙。任何人都應該能夠創(chuàng)建自己的基于人工智能的圖像處理應用程序,即使他們?nèi)狈θ斯ぶ悄芎蛻贸绦蚓幊谭矫娴膶I(yè)知識。雖然人工智能可以加快各種工作流程并減少錯誤來源,但邊緣計算可以消除昂貴的工業(yè)計算機和高速圖像數(shù)據(jù)傳輸所需的復雜基礎設施。
新的和不同的
然而,人工智能或機器學習(ML)的運作方式與傳統(tǒng)的、基于規(guī)則的圖像處理相當不同。這對如何接近和處理圖像處理任務有影響。
結果的質量不再像以前那樣由圖像處理專家手動生成的程序代碼控制,而是由采用足夠圖像數(shù)據(jù)的神經(jīng)網(wǎng)絡的學習過程控制。
換句話說,必須檢查的物體特征不再由指令預先定義,而是必須通過訓練過程教給人工智能。此外,訓練數(shù)據(jù)越多樣化,人工智能/ML算法就越有可能識別出以后操作中特別相關的品質。
有了足夠的知識和經(jīng)驗,看似簡單的事情也能達到預期的目標。如果用戶對相關的圖像數(shù)據(jù)沒有經(jīng)過訓練的眼睛,這個應用就會出現(xiàn)錯誤。這意味著使用機器學習方法所需的能力與基于規(guī)則的圖像處理所需的能力不同。
此外,不是每個人都有時間或資源來從底層潛入這個主題,并發(fā)展一套新的基本技能來處理機器學習方法。新技術的最大問題是透明度。如果它們能以較低的努力提供出色的結果,但卻不能輕易檢查,例如通過審查代碼,那么就很難相信和信任這樣的系統(tǒng)。
復雜且被誤解
邏輯思維表明,人們可能有興趣了解這種 AI 視覺是如何工作的。然而,如果沒有明確理解的可靠解釋,評估結果是困難的。獲得對新技術的信心通常建立在必須隨著時間的推移積累的技能和經(jīng)驗之上,然后才能了解技術可以實現(xiàn)的全部潛力、它如何工作、如何應用它以及如何適當?shù)毓芾硭?/p>
讓事情變得更具挑戰(zhàn)性的是人工智能愿景正在與一個既定系統(tǒng)競爭的概念,近年來通過知識、培訓、文檔、軟件、硬件和開發(fā)環(huán)境的實施,已經(jīng)為此創(chuàng)造了必要的環(huán)境條件。
缺乏對算法內(nèi)部工作原理的清晰洞察,以及難以理解的結果,是阻礙其擴展的另一面。
(不是)黑匣子
神經(jīng)網(wǎng)絡有時會被誤解為一個無法理解判斷的黑匣子。
盡管 DL 模型無疑是復雜的,但它們并不是黑匣子。其實,叫它們玻璃盒子更準確,因為我們可以從字面上看里面,看看每個部件在做什么。
機器學習中的黑匣子隱喻
神經(jīng)網(wǎng)絡推理決策不是基于一套傳統(tǒng)的規(guī)則,它們的人工神經(jīng)元之間的動態(tài)相互作用起初可能對人類來說具有挑戰(zhàn)性,但它們?nèi)匀皇菙?shù)學系統(tǒng)的明確結果,因此可重現(xiàn)且易于解釋。
目前缺乏的是促進適當評估的必要工具。人工智能的這個領域有很多進步的機會。這也顯示了市場上可用的不同人工智能系統(tǒng)如何幫助用戶實現(xiàn)他們的目標。
軟件讓人工智能變得可解釋
IDS Imaging Development GmbH 專注于開發(fā)這一領域。IDS NXT 推理相機系統(tǒng)就是這樣的成果之一。使用所謂的混淆矩陣進行統(tǒng)計調查可以構建和解釋經(jīng)過訓練的神經(jīng)網(wǎng)絡的整體質量。
在訓練過程之后,可以使用先前確定的一組具有已知結果的圖像來驗證網(wǎng)絡。在表格中,比較了預期結果和通過推理獲得的實際結果。這解釋了測試對象被成功或錯誤識別為每個訓練對象類別的頻率。隨后可以根據(jù)生成的命中率提供經(jīng)過訓練的算法的一般質量。
此外,該矩陣清楚地說明了識別精度在哪些方面可能仍不足以滿足生產(chǎn)應用。但是,它沒有對這一結果提供詳細的解釋。
圖 1.分類螺絲的混淆矩陣顯示了可以通過使用更多圖像進行再訓練來提高識別質量的地方。圖片來源:IDS Imaging Development Systems GmbH
在這種情況下,注意力圖很有用,因為它顯示了一種熱圖,指示神經(jīng)網(wǎng)絡關注并用于指導決策的區(qū)域或圖像內(nèi)容。
這種可視化形式貫穿于 AI Vision Studio IDS NXT 燈塔的整個培訓過程,與整個培訓過程中建立的決策路徑相關;這使網(wǎng)絡能夠在分析仍在進行的同時從每個圖像構建熱圖。
這表明人工智能的基本或無法解釋的行為更容易掌握,從而促進工業(yè)環(huán)境中對神經(jīng)網(wǎng)絡的更大接受度。
它還可用于識別和消除數(shù)據(jù)偏差,這些偏差會導致神經(jīng)網(wǎng)絡在推理過程中做出錯誤的決定(見圖“注意力圖”)。
糟糕的輸入導致糟糕的輸出。人工智能系統(tǒng)識別模式和估計結果的能力取決于獲取相關數(shù)據(jù),從中可以學習“正確的行為”。
如果 AI 在實驗室中設計時使用的數(shù)據(jù)不是未來應用的典型數(shù)據(jù),或者更糟的是,如果數(shù)據(jù)中的模式暗示存在偏差,則系統(tǒng)將獲取并應用這些先入之見。
圖 2.此熱圖顯示了典型的數(shù)據(jù)偏差。熱圖顯示了對香蕉的 Chiquita 標簽的高度關注,因此是數(shù)據(jù)偏差的一個很好的例子。通過香蕉的虛假或代表性不足的訓練圖像,所使用的 CNN 顯然了解到這個 Chiquita 標簽總是暗示香蕉。圖片來源:IDS Imaging Development Systems GmbH
軟件工具允許用戶追蹤 AI 視覺的行為和結果,并將其直接關聯(lián)回訓練數(shù)據(jù)集中的弱點,并根據(jù)需要以有針對性的方式進行調整。這使得每個人都更容易理解和解釋人工智能,因為它本質上只是統(tǒng)計和數(shù)學。
理解數(shù)學并在算法中理解它并不總是那么簡單,但是像混淆矩陣和熱圖這樣的工具可以使決策和對決策的解釋可見并因此易于理解。
這只是開始
人工智能視覺在有效使用時能夠增強各種視覺過程。然而,僅靠硬件和軟件不足以讓行業(yè)擁抱人工智能。制造商經(jīng)常被要求以用戶友好的軟件和指導個人的內(nèi)置程序的形式分享他們的知識。
人工智能要趕上基于規(guī)則的成像應用領域的最佳實踐還有很長的路要走,這是多年努力和應用的結果,通過廣泛的文檔、知識轉移和多種軟件建立忠實的客戶群工具。好消息是,此類人工智能系統(tǒng)和支持工具已經(jīng)在開發(fā)中。
目前還正在建立標準和認證,以提高可接受性并使理解 AI 變得足夠簡單以呈現(xiàn)在大桌子上。IDS 正在為此提供協(xié)助。
借助 IDS NXT,任何用戶組都可以快速有效地將集成 AI 系統(tǒng)用作工業(yè)工具——即使沒有廣泛了解圖像處理、機器學習或應用程序編程。
2024-08-23 09:38
2024-08-23 09:28
2024-08-23 09:16
2024-08-23 09:11
2024-08-23 09:07
2024-08-23 09:05
2024-08-22 09:24
2024-08-22 09:07
2024-08-22 09:01
2024-08-22 08:59