data mining examples
Този урок обхваща най-популярните примери за извличане на данни в реалния живот. Научете за приложението за извличане на данни във финанси, маркетинг, здравеопазване и управление на клиентските услуги:
В това Безплатни серии за обучение за извличане на данни , разгледахме Процес на извличане на данни в предишния ни урок. Извличането на данни, което е известно и като Откриване на знания в бази данни (KDD), е процес на откриване на модели в голям набор от данни и хранилища за данни.
Различни техники като регресионен анализ, асоцииране и клъстериране, класификация и анализ на отклонения се прилагат към данните за идентифициране на полезни резултати. Тези техники използват софтуер и бекенд алгоритми, които анализират данните и показват модели.
YouTube за mp3 по-дълъг от 30 минути
Някои от добре познатите методи за извличане на данни са анализ на дървото на решенията, анализ на теоремата на Байес, извличане на често задавани елементи и др. Софтуерният пазар има много инструменти с отворен код, както и платени инструменти за извличане на данни като Weka, Rapid Miner и Оранжеви инструменти за извличане на данни.
Процесът на извличане на данни започва с предоставяне на определено въвеждане на данни на инструментите за извличане на данни, които използват статистически данни и алгоритми за показване на отчетите и моделите. Резултатите могат да бъдат визуализирани с помощта на тези инструменти, които могат да бъдат разбрани и допълнително приложени за извършване на бизнес модификации и подобрения.
Извличането на данни се използва широко от организациите при изграждането на маркетингова стратегия, от болниците за диагностични инструменти, от електронната търговия за кръстосани продажби на продукти чрез уебсайтове и много други начини.
Някои от примерите за извличане на данни са дадени по-долу за справка.
Какво ще научите:
- Примери за извличане на данни в реалния живот
- Примери за извличане на данни във финансите
- Приложения на извличането на данни в маркетинга
- Примери за приложения за извличане на данни в здравеопазването
- Системи за извличане на данни и препоръки
- Извличане на данни за CRM (Управление на връзките с клиентите)
- Извличане на данни с помощта на пример за дърво на решенията
- Най-популярният пример за извличане на данни: маркетинг и продажби
- Големи компании, използващи извличане на данни
- Заключение
- Препоръчително четене
Примери за извличане на данни в реалния живот
Важността на извличането и анализирането на данни нараства от ден на ден в реалния ни живот. Днес повечето организации използват извличане на данни за анализ на големи данни.
Нека видим как тези технологии ни носят полза.
# 1) Доставчици на мобилни услуги
Доставчиците на мобилни услуги използват извличане на данни, за да разработят своите маркетингови кампании и да задържат клиентите да се преместят при други доставчици.
От голямо количество данни като информация за фактуриране, имейл, текстови съобщения, предаване на данни в мрежата и обслужване на клиенти, инструментите за извличане на данни могат да предскажат „бързина“, която казва на клиентите, които искат да променят доставчиците.
С тези резултати се дава оценка на вероятността. Тогава доставчиците на мобилни услуги са в състояние да предоставят стимули, оферти на клиенти, които са изложени на по-висок риск от бъркане. Този вид копаене често се използва от големи доставчици на услуги като широколентови услуги, доставчици на телефони, газ и др.
(изображение източник )
# 2) Сектор за търговия на дребно
Data Mining помага на собствениците на супермаркети и търговци на дребно да знаят избора на клиентите. Разглеждайки историята на покупките на клиентите, инструментите за извличане на данни показват предпочитанията за закупуване на клиентите.
С помощта на тези резултати супермаркетите проектират разположенията на продукти на рафтовете и предлагат предложения за артикули като купони за съответстващи продукти и специални отстъпки за някои продукти.
Тези кампании се основават на RFM групиране. RFM означава скорост, честота и парично групиране. Промоциите и маркетинговите кампании са персонализирани за тези сегменти. Клиентът, който харчи много, но много по-рядко, ще бъде третиран по различен начин от клиента, който купува на всеки 2-3 дни, но с по-малка сума.
Извличането на данни може да се използва за препоръчване на продукти и препратки към артикули.
Извличане на данни в сектора на дребно от различни източници на данни.
(изображение източник )
# 3) Изкуствен интелект
Системата е направена изкуствено интелигентна, като я захранва със съответните модели. Тези модели идват от изходите за извличане на данни. Изходите на изкуствено интелигентните системи също се анализират за тяхната значимост, използвайки техниките за извличане на данни.
Препоръчващите системи използват техники за извличане на данни, за да правят персонализирани препоръки, когато клиентът взаимодейства с машините. Изкуственият интелект се използва върху извлечени данни, като например даване на препоръки за продукти въз основа на миналата история на покупки на клиента в Amazon.
# 4) Електронна търговия
Много сайтове за електронна търговия използват извличане на данни, за да предлагат кръстосани продажби и продажби на своите продукти. Сайтовете за пазаруване като Amazon, Flipkart показват „Хората също са гледали“, „Често купувани заедно“ на клиентите, които взаимодействат със сайта.
Тези препоръки се предоставят с помощта на извличане на данни през историята на покупките на клиентите на уебсайта.
# 5) Наука и инженерство
С появата на извличане на данни, научните приложения сега преминават от статистически техники към използване на техники за „събиране и съхраняване на данни“ и след това извършват извличане на нови данни, извеждат нови резултати и експериментират с процеса. Голямо количество данни се събират от научни области като астрономия, геология, сателитни сензори, глобална система за позициониране и т.н.
Извличането на данни в компютърните науки помага за наблюдение на състоянието на системата, подобряване на нейната производителност, откриване на софтуерни грешки, откриване на плагиатство и откриване на грешки. Извличането на данни също помага при анализирането на отзивите на потребителите относно продукти, статии, за да се изведат мнения и настроения на възгледите.
# 6) Превенция на престъпността
Data Mining открива отклонения в огромно количество данни. Престъпните данни включват всички подробности за престъплението, което се е случило. Data Mining ще изучава моделите и тенденциите и ще прогнозира бъдещи събития с по-добра точност.
Агенциите могат да разберат коя област е по-податлива на престъпления, колко полицейски персонал трябва да бъде разположен, коя възрастова група трябва да бъде насочена, номерата на превозните средства да бъдат изследвани и т.н.
# 7) Изследвания
Изследователите използват инструменти за извличане на данни, за да изследват връзките между изследваните параметри като условия на околната среда като замърсяване на въздуха и разпространение на заболявания като астма сред хората в целевите региони.
# 8) Земеделие
Фермерите използват Data Mining, за да открият добива на зеленчуци с количеството вода, необходимо на растенията.
# 9) Автоматизация
Използвайки извличане на данни, компютърните системи се научават да разпознават модели сред параметрите, които са в сравнение. Системата ще съхранява моделите, които ще бъдат полезни в бъдеще за постигане на бизнес цели. Това обучение е автоматизация, тъй като помага за постигане на целите чрез машинно обучение.
# 10) Динамично ценообразуване
Извличането на данни помага на доставчиците на услуги като кабинните услуги да зареждат динамично клиентите въз основа на търсенето и предлагането. Това е един от ключовите фактори за успеха на компаниите.
# 11) Транспорт
Data Mining помага при планиране на преместването на превозни средства от складове до търговски обекти и анализиране на моделите на зареждане на продукта.
# 12) Застраховка
Методите за извличане на данни помагат при прогнозирането на клиентите, които купуват полиците, анализират медицинските претенции, които се използват заедно, установяват измамно поведение и рискови клиенти.
Примери за извличане на данни във финансите
( изображение източник )
Финансовият сектор включва банки, застрахователни компании и инвестиционни компании. Тези институции събират огромно количество данни. Данните често са пълни, надеждни и с високо качество и изискват систематичен анализ на данните.
За съхраняване на финансови данни се изграждат хранилища за данни, които съхраняват данни под формата на кубчета данни. За да се анализират тези данни, се използват усъвършенствани концепции за куб на данни. Методите за извличане на данни, като клъстериране и анализ на странични данни, характеризиране се използват при анализ на финансови данни и добив.
Някои случаи във финансите, при които се използва извличане на данни, са дадени по-долу.
# 1) Прогноза за плащане на заем
Методите за извличане на данни, като избор на атрибут и класиране на атрибутите, ще анализират историята на плащанията на клиентите и ще изберат важни фактори като съотношението на плащане към дохода, кредитната история, срока на заема и др. също отпускат заеми на клиентите според факторния анализ.
# 2) Целеви маркетинг
Методите за извличане на данни от клъстери и класификация ще помогнат при намирането на факторите, които влияят върху решенията на клиента по отношение на банкирането. Идентифицирането на подобни поведенчески клиенти ще улесни целевия маркетинг.
# 3) Разкриване на финансови престъпления
Банковите данни идват от много различни източници, различни градове и различни банкови местоположения. Множество инструменти за анализ на данни са внедрени за проучване и откриване на необичайни тенденции като транзакции с голяма стойност. Инструментите за визуализация на данни, инструменти за анализ на отклонения, инструменти за клъстериране и т.н. се използват за идентифициране на връзките и моделите на действие.
Фигурата по-долу е проучване на Infosys, показващо желанието на клиента да банкира онлайн система в различни страни. Infosys използва Big Data Analytics за това проучване.
(изображение източник )
Приложения на извличането на данни в маркетинга
Извличането на данни засилва маркетинговата стратегия на компанията и насърчава бизнеса. Това е един от ключовите фактори за успеха на компаниите. Събират се огромни данни за продажби, пазаруване на клиенти, потребление и т.н. Тези данни се увеличават от ден на ден поради електронната търговия.
Извличането на данни помага да се идентифицира поведението на клиентите при покупка, да се подобри обслужването на клиентите, да се съсредоточи върху задържането на клиентите, да се увеличат продажбите и да се намалят разходите за бизнеса.
Някои примери за извличане на данни в маркетинга са:
# 1) Прогнозиране на пазара
За да предскажат пазара, специалистите по маркетинг ще използват техники за извличане на данни като регресия, за да проучат поведението на клиентите, промените и навиците, реакцията на клиентите и други фактори като маркетингов бюджет, други възникващи разходи и др. В бъдеще за професионалистите ще бъде по-лесно да предскаже клиентите в случай на промени във фактора.
# 2) Откриване на аномалии
Техниките за извличане на данни са внедрени за откриване на всякакви аномалии в данните, които могат да причинят всякакъв недостатък в системата. Системата ще сканира хиляди сложни записи, за да извърши тази операция.
# 3) Сигурност на системата
Инструментите за извличане на данни откриват прониквания, които могат да навредят на базата данни, предлагайки по-голяма сигурност на цялата система. Тези прониквания могат да бъдат под формата на дублирани записи, вируси под формата на данни от хакери и т.н.
Примери за приложения за извличане на данни в здравеопазването
(изображение източник )
В здравеопазването извличането на данни става все по-популярно и важно.
Данните, генерирани от здравеопазването, са сложни и обемни. За да се избегнат медицински измами и злоупотреби, инструментите за извличане на данни се използват за откриване на измамни предмети и по този начин предотвратяват загубата.
Някои примери за извличане на данни за здравната индустрия са дадени по-долу за справка.
# 1) Управление на здравеопазването
Методът за извличане на данни се използва за идентифициране на хронични заболявания, проследяване на рискови региони, склонни към разпространение на болести, разработване на програми за намаляване на разпространението на болестта. Здравните специалисти ще анализират болестите, регионите на пациентите с максимален прием в болницата.
С тези данни те ще разработят кампаниите за региона, за да информират хората за болестта и да видят как да я избегнат. Това ще намали броя на пациентите, приети в болници.
# 2) Ефективни лечения
Използвайки извличане на данни, обработките могат да бъдат подобрени. Чрез непрекъснато сравнение на симптомите, причините и лекарствата може да се извърши анализ на данните, за да се направят ефективни лечения. Извличането на данни също се използва за лечение на специфични заболявания и асоцииране на странични ефекти от лечението.
# 3) Измамни и злоупотребяващи данни
Приложенията за извличане на данни се използват за намиране на ненормални модели като лаборатория, резултати от лекар, неподходящи предписания и измамни медицински твърдения.
Системи за извличане на данни и препоръки
Препоръчващите системи дават на клиентите препоръки за продукти, които могат да представляват интерес за потребителите.
Препоръчаните артикули са или подобни на елементите, заявени от потребителя в миналото, или като се разгледат другите предпочитания на клиента, които имат подобен вкус като потребителя. Този подход се нарича подход, основан на съдържание и подход на съвместна работа по подходящ начин.
Много техники като извличане на информация, статистика, машинно обучение и т.н. се използват в препоръчващите системи.
Препоръчващите системи търсят ключови думи, потребителски профили, потребителски транзакции, общи характеристики сред елементите, за да се изчисли елемент за потребителя. Тези системи намират и останалите потребители, които имат подобна история на закупуване, и предсказват артикули, които тези потребители биха могли да купят.
В този подход има много предизвикателства. Системата за препоръки трябва да търси в милиони данни в реално време.
Има два вида грешки, направени от системата за препоръки:
Фалшиви негативи и фалшиви позитиви.
Фалшиви негативи са продукти, които не са препоръчани от системата, но клиентът би ги пожелал. Фалшиво положителни са продукти, които са препоръчани от системата, но не са желани от клиента. Друго предизвикателство е препоръката за потребителите, които са нови, без никаква история на покупки.
Интелигентна техника за отговаряне на заявки се използва за анализ на заявката и предоставяне на обобщена, свързана информация, свързана с заявката. Например: Показване на отзива за ресторанти вместо само адреса и телефонния номер на търсения ресторант.
Извличане на данни за CRM (Управление на връзките с клиентите)
Управлението на взаимоотношенията с клиентите може да бъде подсилено с извличане на данни. Добрите връзки с клиентите могат да бъдат изградени чрез привличане на по-подходящи клиенти, по-добри кръстосани продажби и продажби, по-добро задържане.
Извличането на данни може да подобри CRM чрез:
- Извличането на данни може да помогне на бизнеса да създаде целенасочени програми за по-висока реакция и по-добра възвръщаемост на инвестициите.
- Бизнесът може да предложи повече продукти и услуги по желание на клиентите чрез надпродажба и кръстосани продажби, като по този начин увеличава удовлетвореността на клиентите.
- С извличането на данни бизнесът може да открие кои клиенти търсят други опции. Използвайки тази информация, компаниите могат да изградят идеи, за да задържат клиента да напусне.
Извличането на данни помага на CRM в:
- Маркетинг на база данни: Маркетинговият софтуер позволява на компаниите да изпращат съобщения и имейли до клиентите. Този инструмент заедно с извличането на данни може да направи целенасочен маркетинг. С извличането на данни може да се извършва автоматизация и планиране на задания. Помага за по-добро вземане на решения. Това също ще помогне при технически решения относно това какъв вид клиенти се интересуват от нов продукт, коя пазарна област е добра за пускане на продукта.
- Кампания за придобиване на клиенти: С извличането на данни професионалистът на пазара ще може да идентифицира потенциални клиенти, които не знаят за продуктите или нови купувачи. Те ще могат да проектират предложенията и инициативите за такива клиенти.
- Оптимизация на кампанията: Компаниите използват извличане на данни за ефективността на кампанията. Той може да моделира отговорите на клиентите към маркетингови оферти.
Извличане на данни с помощта на пример за дърво на решенията
Алгоритмите на дървото за вземане на решения се наричат CART (класификационни и регресивни дървета). Това е контролиран метод на обучение. Дървесна структура е изградена върху избраните характеристики, условията за разделяне и кога да спрете. Дърветата на решенията се използват за прогнозиране на стойността на променливите на класа въз основа на учене от предишните данни за обучение.
Вътрешният възел представлява атрибут, а листният възел представлява етикет на клас.
(изображение източник )
Следните стъпки се използват за изграждане на структура на дърво на решенията:
- Поставете най-добрия атрибут в горната част на дървото (корен).
- Подмножествата се създават по такъв начин, че всяко подмножество представлява данни със същата стойност за атрибут.
- Повторете същите стъпки, за да намерите листните възли на всички клонове.
За да се предскаже етикет на клас, атрибутът на записа се сравнява с корена на дървото. При сравнение се избира следващият клон. Вътрешните възли също се сравняват по същия начин, докато достигнат листният възел предскаже променливата на класа.
как да намеря безжичен ключ за криптиране
Някои алгоритми, използвани за индукция на дървото за решения, включват алгоритъм на Hunt, CART, ID3, C4.5, SLIQ и SPRINT.
Най-популярният пример за извличане на данни: маркетинг и продажби
Маркетинг и продажби са областите, в които компаниите разполагат с голям обем данни.
# 1) Банки са първите потребители на технологията за извличане на данни, тъй като тя им помага при кредитна оценка. Извличането на данни анализира какви услуги, предлагани от банките, се използват от клиентите, какъв тип клиенти използват ATM карти и какво обикновено купуват с помощта на техните карти (за кръстосани продажби).
Банките използват извличане на данни, за да анализират транзакциите, които клиентът извършва, преди да решат да сменят банката, за да намалят отслабването на клиентите. Също така някои отклонения в транзакциите се анализират за откриване на измами.
# 2) Клетъчен телефон Фирми използвайте техники за извличане на данни, за да избегнете разбъркване. Избиването е мярка, показваща броя на клиентите, напускащи услугите. Той открива модели, които показват как клиентите могат да се възползват от услугите, за да задържат клиентите.
# 3) Анализ на пазарната кошница е техниката за намиране на групите артикули, които се купуват заедно в магазините. Анализът на транзакциите показва моделите, като например кои неща се купуват заедно често като хляб и масло, или кои артикули имат по-голям обем на продажбите в определени дни, като бира в петък.
Тази информация помага при планирането на оформленията на магазините, като предлага специална отстъпка за артикулите, които са по-малко търсени, създава оферти като „купи 2 вземи 1 безплатно“ или „вземи 50% при втора покупка“ и т.н.
(изображение източник )
Големи компании, използващи извличане на данни
Някои онлайн компании, използващи техники за извличане на данни, са дадени по-долу:
- AMAZON: Amazon използва Text Mining, за да намери най-ниската цена на продукта.
- Мак донълдс: McDonald’s използва добив на големи данни, за да подобри изживяването на клиентите си. Той изучава модела на поръчки на клиентите, времето на изчакване, размера на поръчките и т.н.
- НЕТФЛИКС: Netflix открива как да направи филм или сериал популярен сред клиентите, като използва неговите данни за извличане на данни.
Заключение
Извличането на данни се използва в различни приложения като банкиране, маркетинг, здравеопазване, телекомуникационни индустрии и много други области.
Техниките за извличане на данни помагат на компаниите да получат информирана информация, да увеличат своята рентабилност, като правят корекции в процесите и операциите. Това е бърз процес, който помага на бизнеса при вземането на решения чрез анализ на скрити модели и тенденции.
Вижте нашия предстоящ урок, за да научите повече за алгоритъма за извличане на данни от дървото на решенията !!
Препоръчително четене
- Извличане на данни: процес, техники и основни проблеми при анализа на данните
- Техники за извличане на данни: Алгоритъм, методи и най-добрите инструменти за извличане на данни
- Процес на извличане на данни: Включени модели, стъпки и предизвикателства
- Извличане на данни срещу машинно обучение срещу изкуствен интелект срещу дълбоко обучение
- 10+ най-добри инструмента за управление на данни, които да отговорят на вашите нужди от данни през 2021 г.
- Топ 14 НАЙ-ДОБРИ инструменти за управление на тестови данни през 2021г
- Топ 15 най-добри безплатни инструменти за извличане на данни: Най-изчерпателният списък
- Топ 10 конференции за големи данни, които трябва да следвате през 2021 година