complete guide artificial neural network machine learning
Този урок обяснява какво е изкуствена невронна мрежа, как работи ANN, структура и типове архитектура на ANN и невронна мрежа:
В това Обучение за машинно обучение за всички , разгледахме всичко Видове машинно обучение в предишния ни урок.
Тук, в този урок, обсъдете различните алгоритми в невронните мрежи, заедно със сравнението между машинното обучение и ANN. Преди да научим как ANN допринася за машинното обучение, трябва да знаем какво е изкуствена невронна мрежа и кратки познания за машинното обучение.
Нека изследваме повече за машинното обучение и изкуствената невронна мрежа !!
=> Прочетете пълната серия за обучение по машинно обучение
Какво ще научите:
- Какво е машинно обучение?
- Какво е изкуствена невронна мрежа?
- Структура на биологична невронна мрежа
- Сравнение на биологичен неврон и изкуствен неврон
- Характеристики на ANN
- Структура на ANN
- Функция за активиране
- Какво е изкуствен неврон?
- Как действа изкуственият неврон?
- Основни модели на ANN
- Архитектура на невронната мрежа
- Пример за изкуствена невронна мрежа
- Сравнение между машинно обучение и ANN
- Невронни мрежи и задълбочено обучение
- Приложения за изкуствена невронна мрежа
- Ограничения на невронните мрежи
- Заключение
- Препоръчително четене
Какво е машинно обучение?
Машинното обучение е научна област, която позволява на компютрите да учат и да действат, без да са програмирани изрично. Това е подполе на изкуствения интелект.
Какво е изкуствена невронна мрежа?
ANN е нелинеен модел, който се използва широко в машинното обучение и има обещаващо бъдеще в областта на изкуствения интелект.
Изкуствената невронна мрежа е аналог на биологичната невронна мрежа. Биологичната невронна мрежа е структура от милиарди взаимосвързани неврони в човешкия мозък. Човешкият мозък се състои от неврони, които изпращат информация до различни части на тялото в отговор на извършено действие.
Подобно на това, изкуствената невронна мрежа (ANN) е изчислителна мрежа в науката, която прилича на характеристиките на човешкия мозък. ANN може да моделира като оригинални неврони на човешкия мозък, поради което частите за обработка на ANN се наричат изкуствени неврони.
безплатен софтуер за копиране на DVD в mp4
ANN се състои от голям брой взаимосвързани неврони, които са вдъхновени от работата на мозъка. Тези неврони имат способността да учат, обобщават данните за обучение и да извличат резултати от сложни данни.
Тези мрежи се използват в областите на класификация и прогнозиране, идентифициране на модели и тенденции, проблеми с оптимизацията и др.
Научената невронна мрежа се нарича експертна система с възможност за анализ на информация и отговаряне на въпросите на конкретна област.
Официалната дефиниция на ANN, дадена от д-р Робърт Хехт-Нилсън, изобретател на един първи неврокомпютър, е:
„... изчислителна система, съставена от редица прости, силно взаимосвързани обработващи елементи, които обработват информацията чрез динамичния си отговор на състоянието на външни входове“.
Структура на биологична невронна мрежа
Биологичната невронна мрежа се състои от:
- Сома: Това се нарича още клетъчно тяло. Там се намира клетъчното ядро.
- Дендрити: Това са дървоподобни мрежи, които са свързани с тялото на клетката. Той е направен от нервното влакно.
- Axon: Axon пренася сигнала от клетъчното тяло. Той се разделя на нишки и всяка нишка завършва в структура, подобна на крушка, наречена синапс. Електрическите сигнали се предават между синапса и дендритите.
(изображение източник )
Сравнение на биологичен неврон и изкуствен неврон
Биологичен неврон | Изкуствен неврон |
---|---|
ML се прилага в електронната търговия, здравеопазването, препоръките за продукти и др. | ANN се прилага във финансова област, машинно обучение и изкуствен интелект. |
Той е направен от клетки. | Клетките съответстват на невроните. |
Той има дендрити, които са взаимовръзки между клетъчното тяло. | Теглото на връзката съответства на дендритите. |
Сома получава входа. | Soma е подобна на нетно входящо тегло. |
Аксонът приема сигнала. | Изходът на ANN съответства на аксон. |
Характеристики на ANN
- Нелинейност: Механизмът, следван в ANN за генериране на входния сигнал, е нелинеен.
- Контролирано обучение: Входът и изходът се картографират и ANN се обучава с набора от данни за обучение.
- Учене без надзор: Целевият изход не е даден, така че ANN ще се научи сам, като открие функциите във входните модели.
- Адаптивна природа: Тежестите на връзките във възлите на ANN са в състояние да се адаптират, за да дадат желания изход.
- Биологична аналогия на невроните: ANN има вдъхновена от човешкия мозък структура и функционалност.
- Толерантност към повреди: Тези мрежи са силно толерантни, тъй като информацията се разпределя на слоеве и изчисленията се извършват в реално време.
Структура на ANN
Изкуствените невронни мрежи са обработващи елементи под формата на алгоритми или хардуерни устройства, моделирани по невроналната структура на мозъчната кора на човешкия мозък.
Тези мрежи също се наричат просто невронни мрежи. NN се формира от много слоеве. Многобройните слоеве, които са взаимосвързани, често се наричат „Многослоен перцептрон“. Невроните в един слой се наричат „възли“. Тези възли имат „функция за активиране“.
ANN има 3 основни слоя:
- Входен слой: Входните модели се подават към входните слоеве. Има един входен слой.
- Скрити слоеве: Може да има един или повече скрити слоя. Обработката, която се извършва във вътрешните слоеве, се нарича „скрити слоеве“. Скритите слоеве изчисляват резултата въз основа на „тежестите“, което е „сумата от претеглените връзки на синапса“. Скритите слоеве прецизират входа, като премахват излишната информация и изпращат информацията до следващия скрит слой за по-нататъшна обработка.
- Изходен слой: Този скрит слой се свързва с „изходния слой“, където се показва изходът.
Функция за активиране
Активиращата функция е вътрешно състояние на неврон. Това е функция на входа, който невронът получава. Функцията за активиране се използва за преобразуване на входния сигнал на възела на ANN в изходен сигнал.
Какво е изкуствен неврон?
Изкуствената невронна мрежа се състои от силно взаимосвързани обработващи елементи, наречени възли или неврони.
Тези неврони работят паралелно и са организирани в архитектура. Възлите са свързани помежду си чрез връзки за връзка. Всеки неврон носи тежест, която съдържа информация за входния сигнал.
Как действа изкуственият неврон?
Изкуствен неврон получава вход. Тези входове имат тежест, наречена „синапс“. Тези неврони (наричани още възли) имат „активираща функция“. Тази функция за активиране работи върху входа и го обработва, за да даде изход.
Претеглената сума на входовете се превръща във входен сигнал към функцията за активиране, за да даде един изход. Тези входни тегла са регулируеми, така че невронната мрежа може да регулира параметрите си, за да даде желания изход.
Малко често срещани активиращи функции, които се използват в изкуствената невронна мрежа са:
# 1) Функция за идентичност
Може да се определи като f (x) = x за всички стойности на x. Това е линейна функция, при която изходът е същият като входа.
# 2) Функция на двоична стъпка
Тази функция се използва в еднослойни мрежи за преобразуване на нетния вход в изход. Изходът е двоичен, т.е. 0 или 1. T представлява праговата стойност.
(изображение източник )
# 3) Функция на биполярна стъпка
Функцията биполярна стъпка има биполярни изходи (+1 или -1) за нетния вход. T представлява праговата стойност.
# 4) Сигмоидална функция
Използва се в мрежи за обратно разпространение.
Той е от два вида:
- Двоична сигмоидна функция: Тя се нарича също като еднополюсна сигмоидна функция или логистична сигмоидна функция. Диапазонът на сигмоидалния функционал е 0 до 1.
- Биполярен сигмоид: Биполярната сигмоидална функция варира от -1 до +1. Подобна е на хиперболичната тангенсна функция.
(изображение източник )
# 5) RampFunction
The претеглена сума от входове означава „произведението от теглото на входа и стойността на входа“, сумирано за всички входове.
Нека I = {I1, I2, I3 ... In} е моделът за въвеждане на неврон.
Нека W = {W1, W2, W3… Wn} е теглото, свързано с всеки вход към възела.
Претеглена сума на входовете = Y = (? Wi * Ii) за i = 1 до n
Основни модели на ANN
Моделите на изкуствената невронна мрежа се състоят от 3 обекта:
- Тежести или синаптични връзки
- Правилото за обучение, използвано за регулиране на тежестите
- Активиращи функции на неврона
Архитектура на невронната мрежа
В ANN невроните са свързани помежду си и изходът на всеки неврон е свързан със следващия неврон чрез тежести. Архитектурата на тези взаимовръзки е важна в ANN. Тази подредба е под формата на слоеве и връзката между слоевете и вътре в слоя е архитектурата на невронната мрежа.
Най-известните мрежови архитектури са:
- Еднослойна мрежа за пренасочване
- Многослойна мрежа за пренасочване
- Единичен възел със собствена обратна връзка
- Еднослойна повтаряща се мрежа
- Многослойна повтаряща се мрежа
Нека разгледаме всеки от тях в детайли.
# 1) Еднослойна мрежа за пренасочване
Слоят е мрежа, образувана от неврони. Тези неврони са свързани с останалите неврони от следващия слой. За един слой има само входни и изходни слоеве. Входният слой е свързан към възлите на изходния слой с тегла.
Всички входни възли са свързани към всеки от изходните възли. Терминът обратна връзка показва, че няма обратна връзка, изпратена от изходния слой към входния слой. Това формира еднослойна мрежа за пренасочване.
(изображение източник )
# 2) Многослойна мрежа за пренасочване
Многослойната мрежа се състои от един или повече слоя между входа и изхода. Входният слой просто получава сигнал и го буферира, докато изходният слой показва изхода. Слоевете между входа и изхода се наричат скрити слоеве.
Скритите слоеве не са в контакт с външната среда. С повече на брой скрити слоеве, изходният отговор е по-ефективен. Възлите в предишния слой са свързани към всеки възел в следващия слой.
Тъй като няма изходен слой, свързан с входния или скритите слоеве, той образува многослойна мрежа за пренасочване.
# 3) Единичен възел със собствена обратна връзка
Мрежите, в които изходният слой се изпраща обратно като вход към входния слой или другите скрити слоеве, се наричат мрежи за обратна връзка. В системите за обратна връзка с един възел има един входен слой, където изходът се пренасочва обратно като обратна връзка.
# 4) Еднослойна повтаряща се мрежа
В еднослойна повтаряща се мрежа мрежата за обратна връзка образува затворен цикъл. В този модел единичен неврон получава обратна връзка към себе си или другите неврони в мрежата или и двете.
# 5) Многослойна повтаряща се мрежа
В многослойната повтаряща се мрежа съществуват множество скрити слоеве и изходът се пренасочва обратно към невроните на предишните слоеве и други неврони в същите слоеве или самия неврон.
Пример за изкуствена невронна мрежа
Да вземем мрежата по-долу с дадения вход и да изчислим нетния входен неврон и да получим изхода на неврона Y с активираща функция като двоичен сигмоидален.
Входът има 3 неврона X1, X2 и X3 и единичен изход Y.
Теглото, свързано с входовете, е: {0,2, 0,1, -0,3}
Входове = {0,3, 0,5, 0,6}
Нетно въвеждане = {x1 * w1 + x2 * w2 + x3 * w3}
Нетно въвеждане = (0,3 * 0,2) + (0,5 * 0,1) + (0,6 * -0,3)
Нетно въвеждане = -0.07
Изход за двоичен сигмоидален:
X е -0,07
Изходът е 0,517
Сравнение между машинно обучение и ANN
Машинно обучение | Изкуствена невронна мрежа |
---|---|
Машинното обучение се учи от входни данни и открива модели на изходни данни, които представляват интерес. | ANN се използват в алгоритмите за машинно обучение за обучение на системата, използвайки синапси, възли и връзки за връзка. |
ML е подмножество от областта на изкуствения интелект. | ANN също е част от научната област на изкуствения интелект и подмножество на машинното обучение. |
ML алгоритмите се учат от данни, подадени към алгоритъма за целите на вземане на решение. Някои от тези алгоритми са класификация. Клъстериране, извличане на данни за асоцииране. | ANN е наука за дълбоко обучение, която анализира данните с логически структури, както правят хората. Някои от схемите за обучение на ANN са Hebbian, Perceptron, Back propagation и др. |
ML алгоритмите имат възможности за самообучение, но ще изискват човешка намеса, ако резултатът е неточен. | ANN алгоритмите имат възможности да се коригират, като използват тежести на връзките, ако резултатът се окаже грешен. |
ML алгоритмите изискват умения за програмиране, структура на данни и знания за база данни с големи данни. | ANN също изисква силни умения по математика, вероятност, структури от данни и т.н. |
ML програмите могат да предскажат резултата за научен набор от данни и да се адаптират за нови данни. | ANN може да се учи и да взема интелигентни решения самостоятелно за нови данни, но това е по-дълбоко от машинното обучение. |
Наблюдаваното и ненаблюдаваното обучение попадат в машинното обучение. | Ученето като Кохенен, радиално пристрастие, невронна мрежа с обратна връзка попада под ANN. |
Някои примери за ML са резултатите от търсенето с Google и т.н. | Някои примери за ANN са разпознаване на лица, разпознаване на изображения и т.н. |
Невронни мрежи и задълбочено обучение
Мрежите за дълбоко обучение съдържат няколко скрити слоя между входа и изхода. Тези мрежи се отличават с дълбочината на скритите слоеве в тях. Входните данни преминават през няколко стъпки, преди изходът да бъде показан.
Тези мрежи се различават от по-ранните NN като персептрон, който е имал един скрит слой и се е наричал плитки мрежи. Всеки скрит слой в мрежата за дълбоко обучение обучава данните с определени функции въз основа на изхода на предишния слой.
Данните преминават през много слоеве нелинейна функция на възела. Колкото повече е броят на слоевете, толкова по-сложни характеристики могат да бъдат разпознати, тъй като следващият слой ще извърши агрегиране на характеристики от предишните слоеве.
Множество скрити слоеве в мрежата увеличават сложността и абстракцията. Тази дълбочина също се нарича йерархия на характеристиките. Поради това мрежите за дълбоко обучение са способни да обработват данни с големи размери.
Някои примери за мрежи за дълбоко обучение включват клъстериране на милиони изображения въз основа на неговите характеристики и прилики, филтриране на имейл съобщения, прилагане на филтри към съобщения в CRM, идентифициране на реч и т.н.
Мрежите за дълбоко обучение могат да се обучават както на етикетиран, така и на немаркиран набор от данни. За немаркиран набор от данни мрежите като машини за избор на Boltzmann извършват автоматично извличане на характеристики.
Мрежата се учи автоматично, като анализира входа чрез вземане на проби и минимизира разликата в изхода и разпределението на входа. Невронната мрежа тук намира корелация между характеристиките и резултатите.
Мрежите за дълбоко обучение, обучени върху етикетирани данни, могат да бъдат приложени към неструктурирани данни. Колкото повече данни за обучение се подават в мрежата, толкова по-точни ще станат те.
Способността на мрежата да се учи от немаркирани данни е предимство пред другите алгоритми за обучение.
Приложения за изкуствена невронна мрежа
Невронните мрежи са успешно използвани в различни решения, както е показано по-долу.
# 1) Разпознаване на образец: ANN се използва при разпознаване на образци, разпознаване на изображения, визуализация на изображения, почерк, реч и други подобни задачи.
# 2) Проблеми с оптимизацията: Проблеми като намиране на най-краткия маршрут, планиране и производство, при които трябва да бъдат изпълнени ограниченията на проблема и трябва да се постигнат оптимални решения, са използването на NN.
# 3) Прогнозиране: NN може да прогнозира резултата за ситуации, като анализира минали тенденции. Приложения като банкиране, фондов пазар, прогнозиране на времето използват Neural Networks.
# 4) Системи за управление: Системите за контрол като компютърни продукти, химически продукти и роботика използват невронни мрежи.
Ограничения на невронните мрежи
По-долу са изброени някои от недостатъците на невронните мрежи.
- Тези мрежи са черни кутии за потребителя, тъй като потребителят няма никакви роли, освен подаване на входа и наблюдение на изхода. Потребителят не знае за обучението, което се случва в алгоритъма.
- Тези алгоритми са доста бавни и изискват много повторения (наричани още епохи), за да дадат точни резултати. Това е така, защото процесорът изчислява теглата, функцията за активиране на всеки възел поотделно, като по този начин го консумира време, както и ресурси. Това също причинява проблем с голямо количество данни.
Заключение
В този урок научихме за изкуствената невронна мрежа, нейната аналогия с биологичния неврон и видовете невронна мрежа.
ANN попада под машинно обучение. Това е изчислителен модел, съставен от множество невронни възли. Тези възли получават вход, обработват входа, използвайки функция за активиране и предават изхода на следващите слоеве.
Входовете са свързани с тежести на връзката на връзката, наречена синапс. Основният ANN се състои от входен слой, тегла, активираща функция, скрит слой и изходен слой.
Функциите за активиране се използват за преобразуване на входа в изхода. Някои от тях са бинарни, биполярни, сигмоидални и рампови. Съществуват различни видове ANN като еднослойно подаване напред, многослойно подаване напред, повтарящи се мрежи и др. Въз основа на броя на скритите слоеве и механизмите за обратна връзка.
ANN с много скрити слоеве между входа и изхода от мрежата за дълбоко обучение. Мрежите за дълбоко обучение имат висока сложност и ниво на абстракция, което ги прави способни да изчисляват данни с големи размери с хиляди параметри.
ANN се използва в областта на прогнозирането, обработката на изображения, системите за управление и др. Те са успешно приложени като решение на редица проблеми в науката.
Надяваме се този урок да обясни всичко, което трябва да знаете за изкуствените невронни мрежи !!
=> Посетете тук за ексклузивната серия за машинно обучение
Препоръчително четене
- Извличане на данни срещу машинно обучение срещу изкуствен интелект срещу дълбоко обучение
- Тестване на мрежовата сигурност и най-добрите инструменти за мрежова сигурност
- Видове машинно обучение: Контролирано срещу ненаблюдавано обучение
- 11 Най-популярни софтуерни инструменти за машинно обучение през 2021 г.
- Урок за машинно обучение: Въведение в ML и неговите приложения
- Ръководство за маска на подмрежата (подмрежа) и калкулатор на подмрежи IP
- Ръководство за оценка и уязвимост на мрежата
- 15 най-добри инструменти за мрежово сканиране (мрежови и IP скенери) от 2021 г.