神經網絡和深度學習簡介:結構、類型和限制

已發表: 2022-06-25

既然您正在閱讀本文,那麼您很有可能對基本的機器學習有所了解——如果不是技術方面的知識,那麼至少是機器學習的理論方面。

深度學習是繼機器學習之後的下一個合乎邏輯的步驟。 在傳統的機器學習中,機器是基於監督或強化來學習的。 然而,深度學習旨在復制人類學習的過程,並允許系統自行學習。

使用神經網絡可以做到這一點。 想想你大腦中的神經元以及它們是如何工作的。 現在想像一下,如果它們被轉換成人工網絡——這就是人工神經網絡。

深度學習和神經網絡將徹底改變我們所知道的世界,而且在這項技術方面還有很多東西需要解開。

在這篇介紹性文章中,我們將簡要介紹深度學習以及神經網絡的工作原理、它們的不同類型以及神經網絡的一些限制。

目錄

深度學習——簡要概述

深度學習可以被認為是機器學習的一個子領域。 然而,與任何傳統的機器學習算法或系統不同,深度學習系統使用多個層從它們輸入的原始輸入中提取高階特徵。 層數越多,網絡越“深”,特徵提取和整體學習就越好。

深度學習這個詞自 1950 年代就已經存在,但當時的方法相當不受歡迎。 隨著該領域的研究越來越多,深度學習不斷發展,今天我們擁有由神經網絡驅動的複雜深度學習方法。

神經網絡在深度學習中的一些更流行的應用涉及人臉檢測、對象檢測、圖像識別、文本到語音檢測和轉錄等。 但我們只是觸及了表面——還有很多東西等著我們去發現!

因此,在深入了解深度學習之前,我們必須首先了解什麼是 AI 中的人工神經網絡。

加入來自世界頂級大學的在線人工智能課程——碩士、高級管理人員研究生課程和 ML 和 AI 高級證書課程,以加快您的職業生涯。

人工神經網絡

人工神經網絡受到人類大腦實際運作方式的啟發,它們構成了深度學習的基礎。 這些系統接收數據,訓練自己在數據中尋找模式,並為一組新的相似數據找到輸出。

這就是深度學習的動力——神經網絡自行學習並在自動尋找模式方面變得更強大,無需任何人工干預。 因此,神經網絡可以充當數據的排序和標記系統。

讓我們通過首先了解感知器來深入了解 ANN。

探索我們的機器學習和人工智能課程

IITM 機器學習和雲高級認證 LJMU 機器學習與人工智能理學碩士 來自 IITB 的機器學習和人工智能高級研究生課程
IIITB 機器學習和自然語言處理高級證書課程 IIITB 機器學習和深度學習高級證書課程 來自 IITR 的管理人員人工智能高級證書課程

感知器

人工神經網絡由較小的單元組成,就像我們大腦中的神經網絡由稱為神經元的較小單元組成。 較小的 ANN 單元稱為感知器。 本質上,感知器包含一個或多個輸入層、一個偏差、一個激活函數和一個最終輸出。

感知器的工作原理是接收輸入,將它們乘以權重,然後通過激活函數傳遞它們以產生輸出。 添加偏差很重要,這樣即使所有輸入都為零,也不會出現問題。 它適用於以下公式:

Y = ∑(權重 * 輸入)+ 偏差

因此,首先發生的是單個感知器內的計算。 在這裡,計算加權和並將其傳遞給激活函數。 同樣,可以有不同類型的激活函數,如三角函數、階躍函數、激活函數等。

人工神經網絡的結構

要開發神經網絡,第一步是將不同的感知器層組合在一起。 這樣,我們就得到了一個多層感知器模型。

在這些多層中,第一層是輸入層。 該層直接接受輸入。 而最後一層稱為輸出層,負責創建所需的輸出。

輸入層和輸出層之間的所有層都稱為隱藏層。 這些層不直接與特徵輸入或最終輸出通信。 相反,來自一層的隱藏層神經元使用不同的通道連接到另一層。

激活函數的輸出決定了神經元是否被激活。 一旦神經元被激活,它就可以使用通信通道將數據傳輸到下一層。 因此,所有數據點都在整個網絡中傳播。

最後,在輸出層中,具有最高值的神經元通過觸發確定最終輸出。 神經元在所有傳播之後收到的值是概率。 這意味著網絡根據其接收到的輸入,通過最高概率值估計輸出。

一旦我們得到最終輸出,我們可以將其與已知標籤進行比較,並相應地進行權重調整。 重複這個過程,直到我們達到最大允許迭代或可接受的錯誤率。

現在,讓我們談談可用的不同類型的神經網絡。

閱讀我們與機器學習和人工智能相關的熱門文章

物聯網:歷史、現在和未來 機器學習教程:學習機器學習 什麼是算法? 簡單易行
印度機器人工程師的薪水:所有角色 機器學習工程師的一天:他們在做什麼? 什麼是物聯網(物聯網)
排列與組合:排列與組合之間的區別 人工智能和機器學習的 7 大趨勢 使用 R 進行機器學習:您需要知道的一切

不同類型的神經網絡

今天,我們將看看用於深度學習的兩種最流行的神經網絡類型,即 CNN 和 RNN。

CNN——卷積神經網絡

CNN 不是使用簡單的 2-D 陣列,而是使用 3-D 排列的神經元。 第一層稱為卷積層。 這個卷積層中的每個神經元只負責處理一小部分輸入信息。 因此,網絡以小部分理解整個圖片並多次計算它們以成功完成整個圖片。

因此,CNN 對於圖像識別、物體檢測和其他類似任務非常有價值。 CNN 成功的其他應用包括語音識別、計算機視覺任務和機器翻譯。

RNN——循環神經網絡

RNN 在 1980 年代左右成為眾人矚目的焦點,它們使用時間序列數據或序列數據進行預測。 因此,它們適用於語音識別、自然語言處理、翻譯等時間或順序解決方案。

與 CNN 一樣,RNN 也需要訓練數據來學習然後進行預測。 然而,RNN 與 CNN 的不同之處在於,RNN 能夠記住一層的輸出並將其反饋給其他層的神經元。 因此,這可以被認為是一個不斷重新處理信息的反饋網絡,而不是像人工神經網絡那樣僅僅將信息向前饋送。

使用神經網絡的局限性

神經網絡是一個正在進行研究和修改的領域。 因此,通常有一些缺點正在得到解決和糾正,以對技術進行複雜的修改。 讓我們看看神經網絡的一些限制:

需要大量數據

神經網絡處理大量訓練數據才能正常運行。 如果你沒有大量的數據,網絡將很難自我訓練。 此外,神經網絡有幾個參數——比如學習率、每層神經元的數量、隱藏層的數量等,需要適當地調整這些參數,以最大限度地減少預測誤差,同時最大限度地提高預測效率和速度。 目標是允許神經網絡複製人腦功能,為此它需要大量數據。

主要用作黑匣子

由於通常很難找出隱藏層的工作原理和組織方式,因此神經網絡通常被視為黑盒環境。 因此,如果發生錯誤,查找錯誤原因並修復它變得非常具有挑戰性和耗時。 不要忘記,它也變得相當昂貴。 這是銀行和金融機構尚未使用神經網絡進行預測的主要原因之一。

開發通常很耗時

由於神經網絡是自己學習的,因此與傳統的機器學習方法相比,整個過程通常非常耗時,而且成本高昂。 神經網絡在計算和財務上也很昂貴,因為它們需要大量的訓練數據和計算能力才能進行學習。

綜上所述

更重要的是,這個世界在飛速發展,每一周都在流逝。 如果您熱衷於了解有關深度學習以及如何使神經網絡發揮作用的更多信息,我們建議您查看我們與 IIIT-B 合作提供的機器學習和深度學習高級證書課程這個為期 8 個月的課程為您提供啟動職業所需的一切——從一對一的指導到行業支持再到就業指導。 今天就讓自己報名吧!

1. 沒有神經網絡可以進行深度學習嗎?

不,人工神經網絡對於完成深度學習很重要。

2. ANN 有哪些類型?

有多種類型的人工神經網絡。 但應用最多的 2 個是循環神經網絡和卷積神經網絡。

3. 人工神經網絡最基本的單元是什麼?

感知器是 ANN 最基本的單元。