Завдання №2
Прикладна аналітика
У цьому завданні ми порахуємо кілька продуктових метрик і подивимося, які розподіли можуть зустрітися на практиці.
Опис даних
ad_id— ідентифікатор оголошення (реклами)xyz_campaign_id— ідентифікатор рекламної кампанії в базі компанії Xfb_campaign_id— ідентифікатор кампанії у Facebookage— вікова група, якій показувалася рекламаgender— стать тих, кому показували рекламуinterest— код, що вказує категорію, до якої належить інтерес користувача (відповідність число - інтерес)impressions— число показівclicks— число кліківspent— сума, яку компанія витратила на показ оголошенняtotal_conversion— кількість людей, які зацікавилися продуктом після перегляду рекламиapproved_conversion— кількість людей, які купили продукт після перегляду реклами
Загальний план
Завантажте дані, перевірте кількість спостережень і стовпців, типи даних, наявність пропущених значень, які унікальні значення зустрічаються. Скільки унікальних рекламних кампаній було проведено?
Подивіться на дані та їхній опис. Співвіднесіть назви змінних із відповідним типом даних:
- Дискретні:
- Номінативні:
- Неперервні:
- Рангові/порядкові:
Побудуйте графік розподілу числа показів (
Impressions) для кожної реклами, прологарифмувавши значення. Які твердження є правдивими:- Розподіл унімодальний
- Розподіл бімодальний
- Отриманий розподіл не є нормальним
- Розподіл симетричний
- Отриманий розподіл є нормальним
Створіть нову змінну з
CTR(click-through rate), тобто відношення кількості кліків до кількості показів: \[ CTR = \frac{clicks}{impressions} \]Створіть нову змінну, потім подивіться на описові статистики. Вкажіть
ad_idоголошення з найбільшимCTR.Візуалізуйте
CTRіз розбивкою за номером рекламної кампанії (xyz_campaign_id). Якому графіку відповідає розподілCTRкампанії916?

CPC (cost-per-click) — вартість за клік користувача по оголошенню. Розраховується шляхом ділення суми витрачених грошей на загальне число кліків:
\[ CPC = \frac{spent}{clicks} \]
Виведіть описові статистики для нової змінної, подивіться на форму розподілу. Розрахуйте міжквартильний розмах, округлений до двох знаків після крапки.
Зверніть увагу, що в стовпці можуть зустрітися NaN. Якщо ви використовуєте функцію iqr зі scipy, то слід вказати аргумент nan_policy='omit', щоб їх проігнорувати. При побудові графіка необхідно використовувати метод .dropna().
Візуалізуйте
CPCз розбивкою за статтю користувачів, яким були показані оголошення.Конверсія (conversion rate) — відношення числа користувачів, які вчинили цільову дію на певному етапі, до загальної кількості тих, хто дійшов до цього етапу.
Порахуйте конверсію з кліка в покупку. Як відповідь вкажіть конверсію для оголошення
1121814у відсотках, округливши значення до 2 знаків після крапки. Наприклад, якщо значення кліків дорівнює10, а покупок -2, тоCRна цьому етапі становить 2/10=0.2=20.
Кліки — Clicks, Покупки — Approved_Conversion.