什麼是深度學習?
人腦透過數百萬個神經元連結來產生智慧,機器是否也能模仿人類大腦的結構,來產生自己的智慧進行學習與運作呢?
相信深度學習這個詞對很多人來講,會覺得看起來很困難,但其實大多數人在生活中都曾接觸過深度學習,只是我們並未意識到而已,舉例來說常應用在客服上的聊天機器人、近年最有話題熱度的自動駕駛系統、動口不動手超級方便的語音助理,以及臉部辨識等等...,這些都是深度學習實際應用在生活中的例子,以上提到的工具雖然都沒有真人進行操控,但卻都能擁有人類靈敏的反應能力;今天這篇文章就是帶你來探討深度學習的奧妙,機器是如何透過自身的方法,去模仿人類的行為並且去下判斷和決策的,透過5分鐘來了解一下這個即將改變人類生活型態的力量吧!
深度學習是甚麼?
深度學習其實就是一個函數公式,我們丟一堆資料給他,他再透過神經網路中的層層結構進行分析,得出各種答案,並且從中找出離標準答案最近的最佳解。
深度學習的基本概念
深度學習是由類似於人腦結構的多層神經網路組成的,深度代表模型中的隱藏層很多,而其中每一個隱藏層都能執行複雜的操作。人工神經網路由:輸入層、隱藏層、輸出層,三種類別層級所組成,因為模型在識別物體的時候,需要經過很多階段和層級才能進行判斷。
- 輸入層:神經網路的第一層,負責將資料傳輸到其他層,資料在這層不會進行任何運算。
- 隱藏層:每個模型根據難易度擁有不同數量的隱藏層,隱藏層越多代表計算上越複雜、需要花費的時間也越多,一個隱藏層由數個神經元所組成,從這裡開始進行學習。模型主要透過一層層的隱藏層來判斷資料,再根據每一層不同的權重配置得出解答。
- 輸出層:接收來自最後一個隱藏層的資料,藉由它我們能得到理想的答案。
深度學習的運作模式?
深度學習的運作模式分成三個步驟:正向傳播、計算中間的loss、反向傳播。
- 正向傳播:資料輸入到深度學習的模型中,並經過層層判斷後,會得出一個數值答案。
- 計算中間的loss:將模型得出的答案與標準答案做比較,得到中間的落差(loss)有多少。
- 反向傳播:為了要減少模型預測的答案與正確答案之間的差異,會將預測出的答案回推到模型中,透過這個過程調整、優化各個隱藏層判斷答案的權重比例。
該如何建立一個準確率高的模型架構?
如果以我們本篇文章所提到的,藉由模仿神經系統而建構出的DNN/MLP模型架構來說,想要解決的問題複雜度、難度越高,則可以透過增加隱藏層數來解決,因為可以使模型更加擬合資料,那看到這裡相信很多人就會開始有疑問,是不是只要神經網路中的層數越多,模型在判斷上就會變得更加精準?是不是每個模型都盡可能地增加其中的隱藏層會最好?以下就來為你解答。
- 神經網路只要越多層就絕對會越精準嗎?
不一定,有可能會遇到梯度消失問題(Vanishing gradient problem)。
- 什麼是梯度?
神經網路中權重的更新值和誤差值應該成比例,我們將這種現象稱作梯度,在模型中梯度是用來優化模型裡各層的權重比例,通常發生在反向傳播的訓練過程中。
- 為甚麼會發生梯度消失的狀況?
在某些情況下,梯度值會幾乎消失,通常是在神經網路層數越多的時候,並且搭配某些激活函數時,例如:sigmoid、 tanh ,會發生梯度消失的問題。 (*激活函數:每一層的運算後都會加上一個激活函數,激活函數的存在能讓神經網路理解非常複雜和非線性的函數;如果沒有激活函數的話,就只能做最原始的線性計算,這樣的話神經網路能學習到的東西就非常有限,會影響模型的精準度!)
- 梯度消失會發生甚麼狀況?
模型是透過梯度去更新權重才能讓預測越來越精準,但當模型經過越多層的判斷時,梯度就會變得越來越小、甚至消失,導致模型無法有效根據梯度去針對每一層進行權重的更新。如果沒辦法再根據梯度去更新權重時,會導致模型所預測出的數值跟正確答案之間會有很大的落差。
- 該如何去決定模型的最佳層數?
總而言之,通常隱藏層數越多,在預測訓練資料上正確率確實會越高;但層數過多也會造成我們所訓練的資料正確率很高,但實際預測的資料正確率很低的情況,所以一般在訂定模型層數時,會先大量嘗試各種不同的層數,最後使用在測試資料時正確率最高的層數。
實際應用案例?
深度學習最常應用於語音辨識、圖像辨識上,因為語音、圖像在辨識判斷上面較繁雜的關係,以下以深度學習如何判斷圖像中的物品為例,來說明他的實際運作過程。
如果以判斷圖像中的物品來說,深度學習會針對圖片中的像素(pixels)進行判讀,將圖片上的像素透過濾波器來轉換為有意義的資訊,最終就能輸出成我們想要得到的答案,如果這樣的說法太過抽象,那就簡單來說,深度學習其實就像在模仿人類大腦的運作模式,當人腦在讀一張圖的時候我們會先從最外圍的線開始判斷起,緊接著再去處理圖形的形狀,最後便能得出這個圖形的意義;以判斷貓跟狗的圖片為例子來說,透過濾波器將影像中的圖形做數據處理,並從中擷取出物體的邊緣線條、物件輪廓、突出部分,模型根據這些種種萃取出的特徵,就能合理判斷這個物體到底是狗的機率比較高還是貓的機率較高。
塔圖又是如何應用深度學習呢?
查看提升商品銷售量的秘訣👉AI、機器學習、深度學習有什麼關聯或差異? (tagtoo.com)
參考連結:
https://www.simplilearn.com/tutorials/deep-learning-tutorial/what-is-deep-learning
https://www.techtarget.com/searchenterpriseai/definition/deep-learning-deep-neural-network