您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

人工智能算法指南

2023-02-20 14:29 性質:原創(chuàng) 作者:Hu yangbo 來源:AGV網(wǎng)
免責聲明:中叉網(wǎng)(m.htyl001.com)尊重合法版權,反對侵權盜版。(凡是我網(wǎng)所轉載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權均系原作者和機構所有。文章內(nèi)容觀點,與本網(wǎng)無關。如有需要刪除,敬請來電商榷?。?/div>
算法定義了人工智能在處理和分析數(shù)據(jù)時將使用的規(guī)則、條件和方法。如果你以任何身份使用互聯(lián)網(wǎng),你將不可避免地遇到算法。從谷歌的搜索引擎到Facebook的時間軸算法,再到幫助金融機構處理交易的系...

算法定義了人工智能在處理和分析數(shù)據(jù)時將使用的規(guī)則、條件和方法。

如果你以任何身份使用互聯(lián)網(wǎng),你將不可避免地遇到算法。從谷歌的搜索引擎到Facebook的時間軸算法,再到幫助金融機構處理交易的系統(tǒng),算法是人工智能的基礎。

盡管算法是我們數(shù)字生活的核心,但除了創(chuàng)造它們的人之外,其他人往往不理解。臭名昭著的是,盡管其平臺支持近40萬名全職創(chuàng)作者,但Youtube的算法--它推薦視頻并關注與用戶興趣相關的頻道--因其是一個模糊的黑匣子而聞名,創(chuàng)作者們通過這個黑匣子來獲得財富和饑荒。

本文將照亮科技行業(yè)的這一基本方面。

什么是算法?

在基本術語中,算法是一組堅實定義的步驟,需要采取這些步驟以達到計劃的結果。特別是,它被用來解決數(shù)學方程。它可以被分解成三個廣泛的組成部分。

輸入:在問題開始時你已經(jīng)知道的信息。

算法:需要按部就班地實現(xiàn)的序列。

輸出:如果順序中的所有步驟都被完全遵循,那么預期的結果。

科技界以外的一個類似算法的系統(tǒng)的例子是烹飪食譜。你有你的輸入(原料),你有你的算法(需要或多或少準確遵循的食譜步驟),你有你的輸出(希望可以食用的菜肴)。

當我們說算法是我們數(shù)字生活的原子結構的一部分時,我們也不是在開玩笑。你所使用的任何計算機程序都在運行多種算法來執(zhí)行其功能。從你的網(wǎng)絡瀏覽器到你的文字處理器,再到自3.0版本以來一直包含在Windows中的微軟紙牌游戲,它們中的每一個都是依靠算法運行的。

算法在人工智能中是如何工作的?

從根本上說,人工智能(AI)是一個計算機程序。這意味著,像火狐瀏覽器或微軟Word或Zoom或Slack一樣,你遇到的任何人工智能或機器學習(ML)解決方案將從頭開始用算法構建。

算法在人工智能以及機器學習中的作用是可變的。廣義上講,它們定義了人工智能在處理和分析數(shù)據(jù)時將使用的規(guī)則、條件和方法。這可以簡單到定義人工智能處理一張發(fā)票所需的步驟,到讓人工智能在包含數(shù)十萬張圖片的數(shù)據(jù)集中過濾掉有狗的圖片。

機器學習中的算法有助于預測輸出,即使給定的是未知的輸入。人工智能算法通過解決不同類別的問題發(fā)揮類似的功能。人工智能算法解決的問題類型可以分為三大類。

分類。機器學習的一種類型,用于預測一個項目屬于哪一類,或哪一個類別。一個例子是通過編程讓人工智能區(qū)分垃圾信息和你真正需要的信息。

回歸。機器學習的一種類型,用于根據(jù)一個物體的功能來預測數(shù)字標簽。一個例子是使用歷史數(shù)據(jù)來預測股票市場的價格和預測。

聚類。機器學習的一種類型,用于根據(jù)物體功能的相似性將其分為不同的組。一個例子是使用一種算法對一組金融交易進行分類,并挑選出潛在的欺詐行為的實例。

另見。人工智能是如何通過人工智能增強改變軟件開發(fā)的

人工智能算法的類型

分類算法

下面是一些用于人工智能和機器學習的分類算法的例子。

二元邏輯回歸

二元邏輯回歸可以預測一個二元結果,如是/否或通過/失敗。其他形式的邏輯回歸,如多項式回歸,可以預測三種或更多的可能結果。邏輯回歸經(jīng)??梢栽诩膊☆A測、欺詐檢測和流失預測等用例中發(fā)現(xiàn),其數(shù)據(jù)集可以被用來評估風險。

奈何貝葉斯(Naive Bayes)

奈何貝葉斯是一種概率算法,它將獨立假設納入模型,這意味著它的操作假設是數(shù)據(jù)集中沒有兩個測量值是相互關聯(lián)或以任何方式相互影響的。這就是它們被稱為 "天真 "的原因。它通常用于文本分析和分類模型,它可以將單詞和短語分類到指定的類別。

K 最近鄰 (k-NN)

雖然有時也用于解決回歸問題,但k-NN最常用于解決分類問題。在解決分類問題時,它將數(shù)據(jù)點分成多個類別到一個平面上,以預測新數(shù)據(jù)點的類別標簽。新數(shù)據(jù)點根據(jù)平面上最常出現(xiàn)在其周圍的類別標簽進行新分類。k-NN 也被稱為“惰性學習”算法,這意味著它不經(jīng)過完整的訓練步驟,而只是保存訓練數(shù)據(jù)集。

決策樹

作為一種監(jiān)督學習算法,決策樹也可用于分類問題或回歸問題。之所以稱為“樹”,是因為它具有層次結構。從根節(jié)點開始,它分支成更小的內(nèi)部節(jié)點或決策節(jié)點,在這些節(jié)點中進行評估以生成子集,這些子集由終端節(jié)點或葉節(jié)點表示。

一個例子是從武術的根節(jié)點開始,然后將其分為具有引人注目的重點的武術和具有格斗重點的武術的內(nèi)部節(jié)點。然后,這些內(nèi)部節(jié)點可以拆分為特定武術的終端節(jié)點,例如拳擊、柔術和泰拳。這些算法非常適合數(shù)據(jù)挖掘和知識發(fā)現(xiàn)任務,因為它們易于解釋并且只需要很少的數(shù)據(jù)準備就可以部署。

隨機森林

隨機森林利用多個決策樹的輸出來產(chǎn)生預測。與決策樹一樣,隨機森林可用于解決分類和回歸問題。每棵樹都由從訓練數(shù)據(jù)集中抽取的數(shù)據(jù)樣本組成,該數(shù)據(jù)樣本使用放回抽樣。這為決策樹增加了隨機化,即使它們來自完全相同的數(shù)據(jù)集。

在分類問題中,多數(shù)票是由這些隨機決策樹的輸出決定的。例如,假設有 10 個決策樹專門用于確定裙子的顏色。三套說是藍色,兩套說是黑色,四套說是粉色,一套說是紅色。這件衣服將被歸類為粉紅色。

隨機森林是金融機器學習模型的首選算法,因為它可以減少預處理和數(shù)據(jù)管理任務所需的時間。欺詐檢測、期權定價和客戶信用風險評估都是其在金融領域的應用實例。隨機森林算法是Leo Breiman 和 Adele Cutler 的商標。

回歸算法

以下是人工智能和機器學習中使用的回歸算法的一些示例。

線性回歸

線性回歸是一種在統(tǒng)計學和社會科學中都使用的算法,用于定義因變量和自變量之間的線性關系。這種算法的目標是用給定的數(shù)據(jù)點確定一條可能的趨勢線。在確定廣告支出如何影響收入時,企業(yè)通常會使用線性回歸。

泊松回歸

泊松回歸是一種回歸,其中始終假設預測變量服從泊松分布。泊松分布是一種概率函數(shù),可以幫助確定給定數(shù)量的事件在特定的固定時間段內(nèi)發(fā)生的概率。

例如,您可以使用泊松回歸來確定一個高中生班級在 24 小時內(nèi)解決魔方的可能性有多大?;蛘撸梢愿鶕?jù)餐廳一周內(nèi)服務的平均用餐人數(shù)來預測餐廳在特定日期接待更多顧客的可能性。

普通最小二乘 (OLS) 回歸

OLS 回歸是最流行的回歸算法之一,它以序數(shù)值作為輸入來確定多個變量之間的線性關系。該算法在預測某項事物在任意范圍內(nèi)排名的可能性時最有用,例如在 1-10 范圍內(nèi),一款游戲被評為 7 的可能性有多大。它經(jīng)常用于社會科學,因為該領域的調(diào)查經(jīng)常要求參與者按比例評估某些事物。OLS 回歸也稱為排序學習。

套索(最小絕對選擇和收縮算子)回歸

套索回歸采用 OLS 回歸并在方程中添加一個懲罰項。這可以幫助您創(chuàng)建比簡單 OLS 更復雜的數(shù)據(jù)表示。它還可以使表示更準確。套索回歸也稱為 L1 正則化。

神經(jīng)網(wǎng)絡回歸

神經(jīng)網(wǎng)絡是目前最流行的 AI 和 ML 訓練方法之一。顧名思義,它們受到人腦的啟發(fā),并且擅長處理對于更常見的機器學習方法來說太大而無法持續(xù)處理的數(shù)據(jù)集。

神經(jīng)網(wǎng)絡是一種多功能工具,只要提供適當數(shù)量的先驗數(shù)據(jù)來預測未來事件,就可以執(zhí)行回歸分析。例如,您可以向神經(jīng)網(wǎng)絡提供客戶的網(wǎng)絡活動數(shù)據(jù)和元數(shù)據(jù),以確定客戶不買任何東西就離開您的網(wǎng)站的可能性有多大。

聚類算法

以下是人工智能和機器學習中使用的聚類算法的一些示例。

K-均值聚類

k 均值聚類是一種無監(jiān)督學習算法,它采用具有某些特征和與這些特征相關的值的數(shù)據(jù)集,并將數(shù)據(jù)點分組到多個集群中。“K”代表您嘗試將數(shù)據(jù)點分類到的簇數(shù)。K-means 聚類擁有許多可行的用例,包括文檔分類、保險欺詐檢測和通話詳細記錄分析。

均值偏移聚類

均值偏移聚類是一種簡單、靈活的聚類技術,通過將點移向數(shù)據(jù)點密度最高的區(qū)域(稱為模式),將數(shù)據(jù)點分配到聚類中。在此設置中如何定義集群取決于多種因素,例如距離、密度和分布。它也被稱為“模式搜索算法”。均值漂移聚類在圖像處理、計算機視覺、客戶細分和欺詐檢測等領域都有用例。

基于密度的噪聲應用空間聚類 (DBSCAN)

DBSCAN 在數(shù)據(jù)點密度較低的點將高密度簇彼此分開。Netflix 的電影推薦算法使用類似的聚類方法來確定接下來向您推薦什么。

例如,如果你觀看了最近的 Netflix 電影“Do Revenge”,該算法會查看其他也觀看過“Do Revenge”的用戶,并根據(jù)這些用戶接下來觀看的內(nèi)容推薦電影和節(jié)目。DBSCAN 擅長處理數(shù)據(jù)集中的異常值。DBSCAN 的可行用例包括客戶細分、市場研究和數(shù)據(jù)分析。

使用層次結構的平衡迭代減少和聚類(BIRCH)

BIRCH 是一種常用于處理大型數(shù)據(jù)集的聚類技術。它可以一次掃描整個數(shù)據(jù)庫,并專注于數(shù)據(jù)庫中數(shù)據(jù)點密度高的空間,并提供精確的數(shù)據(jù)摘要。

實現(xiàn) BIRCH 的一種常見方法是與其他無法處理大型數(shù)據(jù)集的聚類方法一起使用。在 BIRCH 生成其摘要后,其他聚類方法將運行摘要并對其進行聚類。因此,BIRCH 的最佳用例是用于普通聚類方法無法有效處理的大型數(shù)據(jù)集。

高斯混合模型 (GMM)

與泊松回歸利用泊松分布的概念非常相似,GMM 將數(shù)據(jù)集建模為多個高斯分布模型的混合體。高斯分布也稱為“正態(tài)分布”,因此,可以直觀地假設數(shù)據(jù)集的聚類將沿著高斯分布的線分布。

GMM 可用于處理大型數(shù)據(jù)集,因為它保留了奇異高斯模型的許多優(yōu)點。GMM 已在語音識別系統(tǒng)、異常檢測和股票價格預測中得到應用。

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關資訊

關注官方微信

手機掃碼看新聞