how perform etl testing using informatica powercenter tool
Известен факт е, че ETL тестване е един от решаващите аспекти на всеки Бизнес разузнаване (BI) базирано приложение. За да се осигури качеството и приемането да започне да се развива в бизнеса, приложението BI трябва да бъде тествано предварително.
Основната цел на ETL тестването е да се гарантира, че Е xtract, т преобразуване & L oad функционалността работи в съответствие с бизнес изискванията и в синхрон със стандартите за производителност.
Преди да се задълбочим в ETL Тестване с Изчислителна техника , от съществено значение е да знаете какво представляват ETL и Informatica.
Какво ще научите:
- Какво ще научите в този урок по ETL:
- Инструмент за тестване на ETL на Informatica PowerCenter:
- Разбиране на ETL тестване, специфично за Informatica:
- Класификация на ETL тестване в Informatica:
- Ползи от използването на Informatica като ETL инструмент:
- Някои полезни съвети, които да ви помогнат при тестване на ETL на Informatica:
- Заключение:
- Препоръчително четене
Какво ще научите в този урок по ETL:
- Основи на ETL, Informatica и ETL тестване.
- Разбиране на ETL тестване, специфично за Informatica.
- Класификация на ETL тестване в Informatica.
- Примерни тестови случаи за тестване на ETL на Informatica.
- Предимства от използването на Informatica като Инструмент ETL .
- Съвети и трикове, които да ви помогнат при тестване.
При изчисленията, извличане, преобразуване, натоварване (ETL) се отнася до процес при използване на база данни и особено при съхранение на данни, който извършва:
- Извличане на данни - Извлича данни от еднородни или разнородни източници на данни.
- Преобразуване на данни - Форматира данните в необходимия тип.
- Зареждане на данни - Преместете и съхранявайте данните на постоянно място за дългосрочно използване.
Инструмент за тестване на ETL на Informatica PowerCenter:
Informatica PowerCenter е мощен инструмент за ETL от Informatica Corporation. Това е единна, унифицирана корпоративна платформа за интеграция на данни за достъп, откриване и интегриране на данни от практически всяка бизнес система във всяка
Това е единна, унифицирана корпоративна платформа за интеграция на данни за достъп, откриване и интегриране на данни от практически всяка бизнес система, във всякакъв формат и доставяне на тези данни в цялото предприятие с всякаква скорост. През Informatica PowerCenter , ние създаваме работни потоци, които изпълняват ETL операции от край до край.
Изтеглете и инсталирайте Informatica PowerCenter:
За да инсталирате и конфигурирате Informatica PowerCenter 9.x, използвайте връзката по-долу, която има инструкции стъпка по стъпка:
=> Informatica PowerCenter 9 Ръководство за инсталиране и конфигуриране
Разбиране на ETL тестване, специфично за Informatica:
ETL тестерите често имат уместни въпроси за това какво да тестват в Informatica и колко покритие на теста е необходимо?
Позволете ми да ви преведа обиколка за това как да извършите ETL тестване, специфично за Informatica.
Основните аспекти, които по същество трябва да бъдат обхванати от тестването на Informatica ETL, са:
- Тестване на функционалността на работния процес на Informatica и неговите компоненти; всички трансформации, използвани в основните картографирания.
- За да проверите пълнотата на данните (т.е. да се уверите дали прогнозираните данни се зареждат към целта без никакви съкращения и загуба на данни),
- Проверка дали данните се зареждат към целта в рамките на очакваните срокове (т.е. оценка на изпълнението на работния процес),
- Гарантиране, че работният поток не позволява да се зареждат невалидни или нежелани данни в целта.
Класификация на ETL тестване в Informatica:
За по-добро разбиране и лекота на тестера, ETL тестването в Informatica може да бъде разделено на две основни части -
какви програми могат да редактират pdf файлове
# 1) Тестване на високо ниво
# 2) Подробно тестване
Първо, при тестването на високо ниво:
- Можете да проверите дали работният процес на Informatica и свързаните с него обекти са валидни или не.
- Проверете дали работният процес завършва успешно при стартиране.
- Потвърдете дали всички необходими сесии / задачи се изпълняват в работния процес.
- Проверете дали данните се зареждат в желаната целева директория и с очакваното име на файл (в случай, че работният процес създава файл) и т.н.
С две думи, можете да кажете, че тестването на високо ниво включва всички основни проверки на здравословното състояние.
Преминавайки към следващата част, т.е. подробно тестване в Informatica , ще се задълбочите да проверите дали логиката, внедрена в Informatica, работи както се очаква по отношение на нейните резултати и ефективност.
- Трябва да направите проверка на изходните данни на ниво поле, което ще потвърди, че всяка трансформация работи добре
- Проверете дали записът се брои на всяко ниво на обработка и накрая дали целта е според очакванията.
- Наблюдавайте внимателно елементи като квалификатор на източника и цел в статистиката на източника / целта на сесията
- Уверете се, че продължителността на изпълнението на работния процес на Informatica е равна на очакваното време на изпълнение.
В обобщение можем да кажем, че подробното тестване включва строго валидиране на работния процес на Informatica и свързания с него поток от данни.
Нека вземем пример тук:
Имаме плосък файл, който съдържа данни за различни продукти. Той съхранява подробности като името на продукта, неговото описание, категория, дата на изтичане, цена и т.н.
Моето изискване е да извлека всеки запис на продукта от файла, да генерирам уникален идентификатор на продукта, съответстващ на всеки запис, и да го заредя в целевата таблица на базата данни. Също така трябва да потисна тези продукти, които или принадлежат към категорията „С“, или чийто срок на годност е по-малък от текущата дата.
Да кажем, плоският ми файл (източник) изглежда така:
(Забележка:Кликнете върху всяко изображение за увеличен изглед)
Въз основа на моите изисквания, посочени по-горе, моята таблица на базата данни (Target) трябва да изглежда така:
Име на таблицата: Tbl_Product
Prod_ID (първичен ключ) | Име на продукта | Prod_description | Prod_category | Prod_expiry_date | Prod_price |
---|---|---|---|---|---|
1001 | ABC | Това е продукт ABC. | М | 14.08.2017 | 150 |
1002 | DEF | Това е продукт DEF. | С | 6.10.2018 | 700 |
1003 | PQRS | Това е продукт PQRS. | М | 23.5.2019 | 1500 |
Сега, да речем, разработихме работен процес на Informatica, за да получим решение за моите изисквания за ETL.
Основното картографиране на Informatica ще чете данни от плоския файл, ще ги предава чрез трансформация на рутер, която ще отхвърли редове, които имат или категория на продукта като 'C' или дата на изтичане, след което ще използвам генериране на последователност, за да създам уникалния първичен ключ стойности за колона Prod_ID в таблица с продукти.
И накрая, записите ще бъдат заредени в таблица Product, която е целта за моето картографиране на Informatica.
Примери:
По-долу са дадени примерни тестови случаи за обяснения по-горе сценарий.
Можете да използвате тези тестови случаи като шаблон във вашия проект за тестване на Informatica и да добавяте / премахвате подобни тестови случаи в зависимост от функционалността на вашия работен процес.
# 1) Идентификационен случай на теста: T001
Цел на тестовия случай: Проверка на работния поток - (име на работен поток)
Процедура за изпитване:
- Отидете на мениджъра на работния процес
- Отворете работния поток
- Меню Workflow-> кликнете върху валидиране
Входна стойност / Тестови данни: Източниците и целите са налични и свързани
Източници: (име на всички екземпляри на източника)
Картографирания: (име на всички картографирания)
Цели: (име на всички целеви екземпляри)
Сесия: (име на всички сесии)
Очаквани резултати: Съобщение в лентата на състоянието на мениджъра на работния поток: „Работен поток (име на работен поток) е валиден“
въпроси и отговори за интервю за мобилно тестване pdf
Актуални резултати: Съобщение в лентата на състоянието на мениджъра на работния поток: „Работен поток (име на работен поток) е валиден“
Забележки:Подайте
Коментари на тестера:
# 2) Идентификационен случай на теста: T002
Цел на тестовия случай: За да се уверите дали работният процес се изпълнява успешно
Процедура за изпитване:
- Отидете на мениджъра на работния процес
- Отворете работния поток
- Щракнете с десния бутон в дизайнера на работния поток и изберете Стартиране на работния поток
- Проверете състоянието в Workflow Monitor
Входна стойност / Тестови данни: Същото като данните от теста за T001
Очаквани резултати: Съобщение в изходния прозорец в диспечера на работния поток: Актуализация на задачата: (име на работен поток) (Успешно)
Актуални резултати: Съобщение в изходния прозорец в диспечера на работния поток: Актуализация на задачата: (име на работен поток) (Успешно)
Забележки:Подайте
Коментари на тестера: Работният процес е успешен
Забележка: Можете лесно да видите състоянието на изпълнение на работния процес (неуспешно / успешно) в монитора на работния поток, както е показано в примера по-долу. След като работният процес бъде завършен, състоянието ще се отразява автоматично в монитора на работния процес.
В горната екранна снимка можете да видите началното и крайното време на работния поток, както и състоянието като успешно.
# 3) ID на тестовия случай: T003
Цел на тестовия случай: За да проверите дали желаният брой записи се зареждат към целта
Процедура за изпитване: След като работният процес се изпълни успешно, преминете към целевата таблица в базата данни
Проверете броя на редовете в таблицата на целевата база данни
Входна стойност / Тестови данни: 5 реда в изходния файл
Цел: таблица на базата данни - (Tbl_Product)
Заявка за изпълнение в SQL сървър: Изберете брой (1) от (Tbl_Product)
Очаквани резултати: Избрани са 3 реда
Актуални резултати: Избрани са 3 реда
Забележки:Подайте
Коментари на тестера:
# 4) Идентификационен случай: T004
Цел на тестовия случай: За да проверите дали генераторът на последователности в картографирането на Informatica работи добре за попълване (име на първичен_ключ_колона, напр. Prod_ID) колона
Процедура за изпитване: След като работният процес се изпълни успешно, преминете към целевата таблица в базата данни
Проверете уникалната последователност, генерирана в колона Prod_ID
Входна стойност / Тестови данни: стойност за Prod_ID оставена празна за всеки ред в изходния файл
Генераторът на последователности се преобразува в колоната Prod_ID в картографирането
Началната стойност на генератора на последователности е зададена като 1001
Цел: таблица на базата данни - (Tbl_Product) отворена в SQL Server
Очаквани резултати: Стойност от 1001 до 1003, попълнена срещу всеки ред за колона Prod_ID
Актуални резултати: Стойност от 1001 до 1003, попълнена срещу всеки ред за колона Prod_ID
Забележки:Подайте
Коментари на тестера:
# 5) Идентификационен случай: T005
е мрежов ключ, същият като парола
Цел на тестовия случай: За да проверите дали трансформацията на рутера работи добре, за да потисне записите, в случай че категорията на продукта е „C“ или продуктът е изтекъл.
Процедура за изпитване: След като работният процес се изпълни успешно, преминете към целевата таблица в базата данни
Изпълнете заявката в целевата таблица, за да проверите дали желаните записи са потиснати.
Входна стойност / Тестови данни: 5 реда в изходния файл
Цел: таблица на базата данни - (Tbl_Product)
Заявка за изпълнение в SQL сървър: Изберете * от Продукт, където Prod_category = ‘C’ или Prod_expiry_date< sysdate ;
Очаквани резултати: няма избрани редове
Актуални резултати: няма избрани редове
Забележки:Подайте
Коментари на тестера: (Ако някой)
# 6) Идентификационен случай: T006
Цел на тестовия случай: За да проверите ефективността на работния процес, като запишете работното време на работния процес.
Процедура за изпитване:
- Отворете монитора на работния поток и изпълнете изпълнението, извършено като част от T001.
- Запишете началния и крайния час на работния процес.
- Изчислете общото време на работа, като извадите началното време от крайния час.
Входна стойност / Тестови данни: Работният процес се изпълнява успешно
Начален час на работния процес в монитора
Краен час на работния процес в монитора.
Очаквани резултати: 2 мин 30 сек
Актуални резултати: 2 мин. 15 сек
Забележки:Подайте
Коментари на тестера: Разглеждането на теста като „преминаване“ в случай, че действителната продължителност на бягане е +/- 10% от очакваната продължителност на бягане.
# 7) Идентификационен случай: T007
Цел на тестовия случай: Да провери данните на ниво колона на целевата таблица, за да се гарантира, че няма загуба на данни.
Процедура за изпитване: След като работният процес се изпълни успешно, отидете на SQL Server.
Изпълнете заявката в целевата таблица, за да проверите дали няма загуба на данни.
Входна стойност / Тестови данни: Работният процес се изпълнява успешно
Един примерен запис от плосък файл на източника.
SQL заявка: Изберете Top 1 * от Tbl_Patient;
Очаквани резултати:
Върнат е 1 ред
Prod_ID (първичен ключ) | Име на продукта | Prod_description | Prod_category | Prod_expiry_date | Prod_price |
---|---|---|---|---|---|
1001 | ABC | Това е продукт ABC. | М | 14.08.2017 | 150 |
Актуални резултати:
Върнат е 1 ред.
Prod_ID (първичен ключ) | Име на продукта | Prod_description | Prod_category | Prod_expiry_date | Prod_price |
---|---|---|---|---|---|
1001 | ABC | Това е продукт ABC. | М | 14.08.2017 | 150 |
Забележки:Подайте
Коментари на тестера: Разглеждането на теста като „преминаване“ в случай, че действителната продължителност на бягане е +/- 10% от очакваната продължителност на бягане.
Ползи от използването на Informatica като ETL инструмент:
Informatica е популярен и успешен инструмент за ETL, защото:
- Има висок процент на успех „стартиране на живо“ (почти 100%)
- Informatica има способността да позволява Lean Integration.
- Това е инструмент с умерени цени в сравнение с други инструменти за ETL.
- Той се предлага с вътрешен график за работа. Така че, не е необходимо да използвате отделен планировчик поотделно, както някои други ETL инструменти.
- Лесното обучение и наличието на инструменти направиха Informatica по-популярна.
Някои полезни съвети, които да ви помогнат при тестване на ETL на Informatica:
- Генерирайте тестовите данни преди изпълнение на тестовите сценарии.
- Данните от теста трябва да са в синхрон с теста, за който се използва.
- Уверете се, че сте обхванали всичките 3 сценария - не се подават данни, подават се невалидни данни и се подават валидни данни като вход към работния процес на Informatica.
- Не забравяйте да тествате, че всички необходими данни се зареждат, за да се насочат напълно. За това можете да използвате тестов случай - T003, описан по-горе като пример.
- Много е важно да проверите дали работният поток прави всички трансформации на данни правилно според бизнес правилата.
- Бих предложил, че за всяко преобразуване, приложено във вашето картографиране на Informatica, трябва да имате контролен списък, за да проверите изходните данни спрямо него. По този начин можете лесно да докладвате за грешки, ако трансформацията не работи добре.
Заключение:
И така, видяхме подробно някои от примерните тестови случаи, които могат да се използват като шаблон за покриване на ETL тестване в Informatica. Както споменах по-рано, можете да добавяте / премахвате / модифицирате тези тестови случаи в зависимост от сценария, който имате във вашия проект.
Както споменах по-рано, можете да добавяте / премахвате / модифицирате тези тестови случаи в зависимост от сценария, който имате във вашия проект.
Informatica PowerCenter е основа за всякакви дейности по интеграция на данни.
Можете лесно да извършвате автоматизирано тестване на данни, копирани за тестване, разработка или производствена среда, без скриптове и това е причината PowerCenter да е най-популярният ETL инструмент в наши дни.
Препоръчително четене => ETL срещу DB тестване - По-подробен поглед към ETL необходимостта от тестване
За автора: Това е статия за гости на Priya K. Тя има 4+ години практически опит в разработването и поддържането на приложения за ETL на Informatica.
Чувствайте се свободни да публикувате вашите запитвания / коментари за този инструмент за ETL.
Препоръчително четене
- Най-добри инструменти за тестване на софтуер 2021 г. (Инструменти за автоматизация на QA теста)
- Как да извършите Backend тестване
- Въпроси и отговори за интервю за ETL тестване
- Урок за тестване на хранилище на данни за ETL (Пълно ръководство)
- Изтегляне на eBook за тестване на Primer
- ETL срещу DB тестване - По-подробен поглед върху ETL Тестване на нуждите, планирането и ETL инструментите
- Тестване на натоварване с помощта на LoadUI - безплатен инструмент за тестване на натоварване с отворен код
- Топ 10 инструменти за тестване на ETL през 2021 г.