types machine learning
Този урок обяснява видовете машинно обучение, т.е. контролирано, ненаблюдавано, подсилващо и полу-контролирано обучение с прости примери. Също така ще научите разликите между контролираното срещу ненаблюдаваното обучение:
В Предишен урок , научихме за машинното обучение, неговата работа и приложения. Видяхме и сравнение на машинното обучение срещу изкуствения интелект.
Машинното обучение е научна област, която се занимава с компютърни програми за обучение чрез опит и прогнозиране на резултата.
Основната характеристика на ML е ученето от опит. Обучението се случва, когато системата, захранена с входни данни за обучение, променя параметрите си и се настройва, за да даде желания изход. Резултатът е целевата стойност, определена в данните за обучение.
=> Прочетете пълната серия за обучение по машинно обучение
Какво ще научите:
- Видове машинно обучение
- Пример от реалния живот на контролирано и ненаблюдавано обучение
- Разлика между контролираното срещу ненаблюдаваното обучение
- Полууправлявано обучение
- Заключение
Видове машинно обучение
Програмите за машинно обучение са класифицирани в 3 вида, както е показано по-долу.
- Надзор
- Без надзор
- Подсилващо обучение
Нека разберем всеки от тях подробно !!
# 1) Контролирано обучение
Ученото под наблюдение се случва в присъствието на ръководител, точно както ученето, изпълнявано от малко дете с помощта на неговия учител. Тъй като детето е обучено да разпознава плодове, цветове, цифри под наблюдението на учител, този метод е контролирано обучение.
При този метод всяка стъпка на детето се проверява от учителя и детето се учи от резултата, който трябва да произведе.
Как работи контролираното обучение?
В контролирания ML алгоритъм изходът вече е известен. Има картографиране на входа с изхода. Следователно, за да се създаде модел, машината се захранва с много учебни входни данни (с известни входни и съответни изходни данни).
Данните за обучение помагат за постигане на ниво на точност за създадения модел на данни. Вграденият модел вече е готов за захранване с нови входни данни и прогнозиране на резултатите.
Какво е етикетиран набор от данни?
Наборът от данни с изходи, известни за даден вход, се нарича етикетиран набор от данни. Например, изображение на плод заедно с името на плода е известно. Така че, когато се показва нов образ на плодове, той се сравнява с тренировъчния набор за предсказване на отговора.
Контролираното обучение е механизъм за бързо обучение с висока точност. Проблемите с контролираното обучение включват проблеми с регресията и класификацията.
Някои от контролираните алгоритми за обучение са:
- Дървета за вземане на решения,
- K-Най-близкият съсед,
- Линейна регресия,
- Поддръжка на Vector Machine и
- Невронни мрежи.
Пример за контролирано обучение
- В първата стъпка набор от данни за обучение се подава към алгоритъма за машинно обучение.
- С набора от данни за обучение машината се приспособява, като прави промени в параметрите, за да изгради логически модел.
- След това вграденият модел се използва за нов набор от данни за прогнозиране на резултата.
Видове алгоритми на контролирано обучение
- Класификация: При този тип проблеми предсказваме отговора като специфични класове, като например „да“ или „не“. Когато присъстват само 2 класа, това се нарича двоична класификация. За повече от 2 стойности на класа се нарича класификация на няколко класа. Прогнозираните стойности на отговора са дискретни стойности. Например, Това ли е образът на слънцето или луната? Класификационният алгоритъм разделя данните на класове.
- Регресия: Проблемите с регресията предсказват отговора като непрекъснати стойности, като например предсказване на стойност, която варира от-безкрайност до безкрайност. Може да отнеме много стойности. Например, алгоритъмът за линейна регресия, който се прилага, прогнозира цената на къщата въз основа на много параметри като местоположение, близко летище, размер на къщата и т.н.
# 2) Неуправлявано обучение
Ученето без надзор се случва без помощта на ръководител, точно както рибата се научава да плува сама. Това е независим процес на обучение.
В този модел, тъй като няма изход, картографиран с входа, целевите стойности са неизвестни / немаркирани. Системата трябва да се учи сама от въведените към нея данни и да открива скритите модели.
Какво е немаркиран набор от данни?
Набор от данни с неизвестни изходни стойности за всички входни стойности се нарича немаркиран набор от данни.
Как функционира ученето без надзор?
Тъй като няма известни изходни стойности, които могат да се използват за изграждане на логически модел между входа и изхода, някои техники се използват за добиване на правила за данни, модели и групи данни с подобни типове. Тези групи помагат на крайните потребители да разберат данните по-добре, както и да намерят смислен резултат.
Захранваните входове не са под формата на правилна структура, точно както са данните за обучение (при контролирано обучение). Може да съдържа отклонения, шумни данни и др. Тези входове се подават заедно към системата. Докато обучаваме модела, входните данни са организирани, за да формират клъстери.
Алгоритмите за учене без надзор включват алгоритми за клъстериране и асоцииране като:
- Априори,
- K-означава клъстериране и други алгоритми за копаене на правила за асоцииране.
Когато към модела се подават нови данни, той ще предскаже резултата като етикет на клас, към който принадлежи входът. Ако етикетът на класа не присъства, ще се генерира нов клас.
Докато преминава през процеса на откриване на модели в данните, моделът сам коригира параметрите си, поради което се нарича още самоорганизиращ се. Клъстерите ще се формират чрез откриване на приликите между входните данни.
Например, докато купувате продукти онлайн, ако маслото е поставено в количката, тогава се предлага закупуване на хляб, сирене и др. Мониторът без надзор разглежда точките с данни и прогнозира другите атрибути, свързани с продукта.
Пример за учене без надзор
Видове ненаблюдавани алгоритми
- Алгоритъм на клъстериране : Методите за намиране на приликите между елементите от данни като една и съща форма, размер, цвят, цена и т.н. и групирането им, за да се образува клъстер, е клъстерен анализ.
- Откриване на извънземни : В този метод наборът от данни е търсене на всякакъв вид различия и аномалии в данните. Например, транзакция с висока стойност на кредитна карта се открива от системата за откриване на измами.
- Асоциация Правило за копаене : При този тип копаене той открива най-често срещаните набори от елементи или асоциации между елементи. Асоциации като „продукти, често купувани заедно“ и др.
- Автокодери: Входът се компресира в кодирана форма и се пресъздава за премахване на шумни данни. Тази техника се използва за подобряване на качеството на изображението и видеото.
# 3) Укрепване на обучение
При този тип обучение алгоритъмът се учи чрез механизъм за обратна връзка и минали преживявания. Винаги се желае всяка стъпка в алгоритъма да се предприеме, за да се постигне цел.
Така че, когато трябва да се предприеме следващата стъпка, той получава обратната връзка от предишната стъпка, заедно с обучението от опита, за да предскаже коя може да бъде следващата най-добра стъпка. Този процес се нарича още процес на проба и грешка за постигане на целта.
Усилващото обучение е дългосрочен итеративен процес. Колкото повече са броя на обратните връзки, толкова по-точна става системата. Основното укрепващо обучение се нарича още процес на вземане на решения по Марков.
Пример за укрепващо обучение
Пример за засилване на обучението са видео игрите, където играчите завършват определени нива на играта и печелят точки за награда. Играта предоставя обратна връзка на играча чрез бонус ходове за подобряване на неговото / нейното представяне.
как да играя .swf файлове
Усилващото обучение се използва при обучение на роботи, самоуправляващи се автомобили, автоматично управление на инвентара и др.
Някои популярни алгоритми на Reinforcement Learning включват:
- Q-обучение,
- Дълбоки състезателни мрежи
- Времева разлика
Фигурата по-долу описва механизма за обратна връзка при подкрепящо обучение.
- Входът се наблюдава от агента, който е AI елемент.
- Този агент за изкуствен интелект действа върху околната среда според взетото решение.
- Отговорът на околната среда се изпраща на AI под формата на награда обратно като обратна връзка.
- Състоянието и действията, извършени върху околната среда, също се запазват.
(изображение източник )
Пример от реалния живот на контролирано и неподдържано обучение
За контролирано обучение:
# 1) Нека вземем пример за кошница зеленчуци с лук, морков, репички, домати и т.н., и можем да ги подредим под формата на групи.
# две) Създаваме таблица с данни за обучение, за да разберем контролираното обучение.
Таблицата с данни за обучение характеризира зеленчуците въз основа на:
- Форма
- Цвят
- Размер
Форма | Цвят | Размер | Зеленчукови |
---|---|---|---|
То е по-точно от ученето без надзор, тъй като входните данни и съответният изход са добре известни и машината трябва само да дава прогнози. | Той има по-малка точност, тъй като входните данни не са етикетирани. По този начин машината трябва първо да разбере и маркира данните и след това да даде прогнози. | ||
Кръгъл | Кафяво | Голям | Лук |
Кръгъл | Нето | Среден | Домат |
Цилиндрична | Бял | Голям | Репичка |
Цилиндрична | Нето | Среден | Морков |
Когато тази таблица с данни за обучение бъде подадена към машината, тя ще изгради логически модел, използвайки формата, цвета, размера на зеленчука и т.н., за да предскаже резултата (зеленчук).
Тъй като към този модел се подава нов вход, алгоритъмът ще анализира параметрите и ще изведе името на плода.
За обучение без надзор:
При учене без надзор той създава групи или клъстери въз основа на атрибути. В горния пробен набор от данни параметърът зеленчук са:
# 1) Форма
Зеленчуците са групирани според формата.
- Кръгъл: Лук и домат.
- Цилиндрична: Репичка и морков.
Вземете друг параметър като размер.
# 2) Размер
Зеленчуците са групирани според размера и формата:
- Среден размер и кръгла форма: Домат
- Голям размер и кръгла форма: Лук
При ученето без надзор нямаме никакъв набор от данни за обучение и променлива на резултата, докато при контролирано обучение данните за обучение са известни и се използват за обучение на алгоритъма.
Разлика между контролираното срещу ненаблюдаваното обучение
Надзор | Без надзор |
---|---|
В контролираните алгоритми за обучение изходът за дадения вход е известен. | В алгоритмите за учене без надзор изходът за дадения вход е неизвестен. |
Алгоритмите се учат от обозначен набор от данни. Тези данни помагат за оценка на точността на данните за обучение. | Алгоритъмът е снабден с немаркирани данни, където той се опитва да намери модели и асоциации между елементите от данни. |
Това е техника за прогнозно моделиране, която точно предсказва бъдещите резултати. | Това е техника на описателно моделиране, която обяснява реалната връзка между елементите и историята на елементите. |
Той включва алгоритми за класификация и регресия. | Той включва алгоритми за учене на правила за клъстериране и асоцииране. |
Някои алгоритми на контролирано обучение са Линейна регресия, Наивен Байес и Невронни мрежи. | Някои алгоритми за учене без надзор са k- означава групиране, Apriori и др. |
Този тип обучение е относително сложен, тъй като изисква обозначени данни. | Той е по-малко сложен, тъй като няма нужда да се разбират и етикетират данните. |
Това е онлайн процес на анализ на данни и не изисква човешко взаимодействие. | Това е анализ на данните в реално време. |
Полууправлявано обучение
Подходът за полууправлявано учене взема както етикетирани, така и немаркирани данни за обучение. Този тип обучение е полезно, когато е трудно да се извлекат полезни функции от немаркирани данни (контролиран подход), а експертите по данни изпитват трудности при обозначаването на входните данни (ненадзорен подход).
Само малко количество етикетирани данни в тези алгоритми може да доведе до точността на модела.
Примери на полу-контролирано обучение включват CT сканиране и MRI, където медицински експерт може да маркира няколко точки в сканирането за всяка болест, докато е трудно да се маркират всички сканирания.
Заключение
Задачите за машинно обучение се класифицират най-общо на задачи с надзор, без надзор, полу-надзор и усилване.
Ученото под наблюдение е учене с помощта на етикетирани данни. ML алгоритмите се захранват с набор от данни за обучение, в който за всички входни данни е известен изходът, за да се предскажат бъдещи резултати.
Този модел е много точен и бърз, но изисква висок опит и време за изграждане. Също така тези модели изискват възстановяване, ако данните се променят. Задачите за ML като регресия и класификация се изпълняват в контролирана учебна среда.
Ученето без надзор се осъществява без помощта на ръководител. Входните данни, подадени към алгоритмите ML, не са етикетирани, т.е.за всеки вход не е известен изход. Алгоритъмът сам по себе си открива тенденциите и модела във входните данни и създава асоциация между различните атрибути на входа.
Този тип обучение е полезно за намиране на модели в данни, създаване на клъстери от данни и анализ в реално време. Задачи като клъстериране, KNN алгоритми и др. Попадат в условията на обучение без надзор.
Полу-контролираните учебни задачи предимството както на контролирани, така и на ненаблюдавани алгоритми чрез прогнозиране на резултатите, като се използват както етикетирани, така и немаркирани данни. Ученето с усилване е вид механизъм за обратна връзка, при който машината се учи от постоянна обратна връзка от околната среда, за да постигне целта си.
При този тип обучение агентите на ИИ извършват някои действия върху данните и средата дава награда. Усилващото обучение се използва от мултиплейър игри за деца, самоуправляващи се коли и др.
Следете нашия предстоящ урок, за да научите повече за машинното обучение и изкуствената невронна мрежа!
=> Посетете тук за ексклузивната серия за машинно обучение
Препоръчително четене
- Извличане на данни срещу машинно обучение срещу изкуствен интелект срещу дълбоко обучение
- 11 Най-популярни софтуерни инструменти за машинно обучение през 2021 г.
- Урок за машинно обучение: Въведение в ML и неговите приложения
- Типове данни на Python
- Типове данни на C ++
- Видове рискове при софтуерни проекти
- Видове тестове за миграция: С тестови сценарии за всеки тип
- 15 най-добри системи за управление на обучението (LMS на годината 2021)