Atrybucja marketingowa po iOS

Każdy stack raportowy, który dziedziczymy, zawiera trzy liczby dla tego samego kanału — i wszystkie trzy kłamią w różnych kierunkach. Meta twierdzi, że dowiozła 220 zakupów w miesiącu. GA4 w modelu last-click przyznaje Mecie 90. Eksport z finansów pokazuje przychód, którego nie tłumaczy żadna z tych liczb. Atrybucja marketingowa po iOS nie jest problemem danych, który się rozwiązuje; jest niepewnością, którą się zarządza. Prowadzimy konta przy założeniu, że żaden pojedynczy model nie jest prawdziwy — i budujemy raportowanie, które mimo to pozwala podejmować dobre decyzje budżetowe.

Dla firm sprzedających na rynkach US i UK problem jest ostrzejszy niż lokalnie: wyższy udział ruchu z iOS, więcej kanałów w miksie i większe budżety oznaczają, że błąd atrybucji kosztuje realne tysiące dolarów miesięcznie. Ten artykuł opisuje stack triangulacji, którego używamy w kontach wydających 10–80 tys. $ miesięcznie, po co istnieje każda warstwa i co dokładnie kładziemy co tydzień przed założycielami.

Żaden model nie mówi prawdy — ale każdy kłamie przewidywalnie

Użyteczny wniosek nie brzmi „atrybucja jest zepsuta”. Brzmi: każde źródło pomiaru ma znany kierunek błędu, a gdy znasz kierunek, liczba staje się użyteczna.

Konwersje raportowane przez platformy zawyżają wkład platform. Meta, Google i TikTok każde z osobna przypisują sobie konwersje, z oknami kliknięć i wyświetleń, które przechwytują popyt stworzony gdzie indziej. Zsumuj przychód raportowany przez trzy kanały, a regularnie wyjdzie 130–180% faktycznego przychodu sklepu. Błąd jest największy na retargetingu i brandowym searchu, gdzie platforma staje między już zdecydowanym kupującym a kasą.
Last-click zaniża kanały odkrywania. GA4 last-click głodzi kanały tworzące popyt — paid social, wideo, influencerów — i przecenia kanały, które go zbierają: brandowy search, direct, e-mail. Zespół realokujący budżet po last-clicku systematycznie odetnie finansowanie górze własnego lejka, a dwa miesiące później zobaczy spadek wolumenu brandowych wyszukiwań.
Deklaratywne „skąd o nas wiesz” nadreprezentuje zapamiętywalne punkty styku. Ankiety pozakupowe są tanie i kierunkowo użyteczne, ale respondenci wymieniają podcast, nie reklamę retargetingową, a response rate 15–40% przechyla próbkę w stronę zaangażowanych klientów.
Modele data-driven są nieprzejrzyste. DDA w GA4 i różne narzędzia MMM-lite produkują wiarygodnie wyglądające krzywe, ale nie możesz zaudytować ich założeń — i nadal widzą tylko te punkty styku, które zostały wyśledzone.

Żadne z tych źródeł nie dostaje weta. Każde zarabia na konkretną rolę — z wkalkulowanym błędem.

Stack triangulacji

Pracujemy na czterech warstwach w ścisłej hierarchii. Dolne warstwy karmią optymalizację; górne podejmują decyzje budżetowe.

Atrybucja platformy — do optymalizacji wewnątrz platformy. Liczby Meta to sygnał, na którym uczy się system emisji Meta, więc utrzymujemy je czyste i używamy do porównań kampania kontra kampania, reklama kontra reklama — wewnątrz tej samej platformy. Porównania względne w obrębie jednego systemu atrybucji są prawomocne, nawet gdy poziom absolutny jest zawyżony.
Zdarzenia server-side — dla jakości sygnału i spójnego rejestru zdarzeń. CAPI na Meta, enhanced conversions na Google, server-side GTM tam, gdzie stack to udźwignie. Ta warstwa nie naprawia atrybucji; naprawia pokrycie pomiaru — a to inny problem, który większość zespołów myli z atrybucją.
Uzgadnianie przychodu — do kalibracji. Co tydzień zestawiamy przychód deklarowany przez platformy z systemem zamówień (Shopify, baza billingowa, CRM). Stosunek deklarowanego do faktycznego staje się deflatorem każdej platformy. Jeśli Meta twierdzi, że dowiozła 84 tys. $, a uzgodnienie potwierdza około 55 tys. $, liczby Meta czytamy na potrzeby planowania z wagą ~0.65 — a przesunięcie tego stosunku samo w sobie jest zdarzeniem diagnostycznym wartym zbadania.
Łączny CAC i MER — warstwa decyzyjna. Całkowite wydatki podzielone przez nowych klientów; całkowity przychód podzielony przez całkowite wydatki. Te liczby nie mogą kłamać o całości, bo w ogóle nie zależą od atrybucji. Każda decyzja o skalowaniu, cięciu i realokacji zapada tutaj.

Hierarchia rozstrzyga spory, które paraliżują zespoły marketingowe. Gdy ROAS platformy i łączny MER się nie zgadzają — wygrywa łączny. Gdy last-click i liczby platformy spierają się o wkład kanału — nie rozsądzamy. Testujemy.

Zdarzenia server-side: napraw pokrycie, zanim zaczniesz debatować o modelach

Spieranie się o modele atrybucji na zepsutej warstwie zdarzeń to strata czasu — a to najczęstszy stan, jaki zastajemy w audytach. Zanim jakakolwiek triangulacja, fundament:

Conversions API (lub odpowiednik platformy) strzelające server-side, z deduplikacją względem piksela przeglądarkowego zweryfikowaną po event_id, nie zakładaną
Event Match Quality 8+ na zdarzeniu zakupu — zahashowany e-mail, telefon i adres przekazywane z obiektu zamówienia
Jedno kanoniczne zdarzenie zakupu, z wartością i walutą, zgodne z systemem zamówień w granicach 2–3% przy cotygodniowym zestawieniu
Enhanced conversions i consent mode skonfigurowane na Google, żeby kampanie Search i PMax optymalizowały się na tych samych klientach, których rozpoznaje CRM

W koncie B2B SaaS przebudowa warstwy zdarzeń — tak, żeby platformy dostawały zdarzenia zakwalifikowanych leadów (z CRM, server-side) zamiast surowych wypełnień formularza — zmieniła wszystko poniżej: w sześć tygodni platformy przesunęły emisję ku odbiorcom generującym pipeline sprzedażowy, koszt zakwalifikowanej szansy spadł o 38%, a debata o atrybucji w dużej mierze wygasła, bo każde źródło wreszcie liczyło to samo.

Łączny CAC i MER jako warstwa decyzyjna

Mechanika, którą prowadzimy co tydzień, per konto:

MER = całkowity przychód / całkowite wydatki reklamowe, śledzony jako liczba krocząca 7- i 28-dniowa względem celu wyprowadzonego z marży, nie z ambicji
Łączny CAC nowego klienta = całkowite wydatki / nowi klienci (klienci powracający wykluczeni — mieszanie ich to najczęstszy sposób, w jaki liczby łączne po cichu się upiększają)
Udział wydatków vs. trend przychodu per kanał, żeby kanał można było skalować lub ciąć na podstawie jego krańcowego wpływu na łączną linię, a nie na podstawie samodzielnie raportowanego ROAS

Reguła operacyjna jest prosta: liczby platform proponują, liczby łączne decydują. Jeśli wydatki na Meta rosną o 30%, a łączny MER przez kolejne dwa tygodnie trzyma się lub poprawia — inkrementalny budżet działa, cokolwiek mówi GA4. Jeśli ROAS platformy wygląda stabilnie, a łączny MER się osuwa — któryś kanał przypisuje sobie popyt, którego nie stworzył, i typowi podejrzani to retargeting oraz brandowy search.

Metryki łączne mają realną słabość: są wolne i niekonkretne. Mówią, że całość jest zdrowa albo chora, ale nie który organ. Dlatego siedzą na szczycie stacku, zamiast go zastępować — i dlatego istnieje warstwa niżej.

Holdouty i testy geo tam, gdzie pozwala wolumen

Gdy inkrementalność kanału jest naprawdę sporna, przestajemy modelować i robimy eksperyment. Dwa projekty, których faktycznie używamy:

Geo holdouty. Wyłączamy (lub przykręcamy) sporny budżet w dobranym zestawie regionów na 2–4 tygodnie i porównujemy przychód z regionami kontrolnymi. To najczystszy odczyt dostępny średniemu reklamodawcy — i nie wymaga współpracy platformy; na rynku amerykańskim, z dziesiątkami porównywalnych stanów i obszarów metropolitalnych, działa szczególnie dobrze. Test wymiarujemy tak, żeby oczekiwany efekt był co najmniej 2–3x większy od szumu przychodu na poziomie regionów; poniżej mniej więcej 20 tys. $ miesięcznie w spornym kanale ta matematyka rzadko się domyka — i wtedy mówimy to wprost, zamiast odgrywać teatr.
Holdouty na odbiorcach retargetingu. Wykluczamy losowy wycinek puli retargetingowej i porównujemy wskaźniki zakupu. Retargeting testujemy w pierwszej kolejności, bo to tam koncentruje się nadatrybucja platform. Zmierzony uplift to często 10–30% tego, co deklaruje platforma. Wyłączaliśmy warstwy retargetingu deklarujące 4x ROAS, bo holdout pokazał inkrementalny zwrot poniżej 1x — a łączny MER nie drgnął, gdy budżet zniknął. To był werdykt.

Jedno zastrzeżenie, którego się trzymamy: wynik holdoutu to estymata z przedziałem ufności, nie objawienie. Test uznajemy za rozstrzygający tylko wtedy, gdy zmierzony efekt jest duży względem szumu. W przeciwnym razie aktualizuje nasze deflatory i idziemy dalej.

Co pokazujemy założycielom co tydzień

Tygodniowy raport to jedna strona. W kolejności:

Łączny MER i CAC nowego klienta względem celu, z trendem 7- i 28-dniowym
Wydatki i przychód per kanał, z przychodem deklarowanym przez każdą platformę pokazanym obok jej uzgodnionego deflatora — żeby luka była widoczna, a nie ukryta
Kontrola uzgodnienia — suma przychodu deklarowanego przez platformy vs. przychód faktyczny, z flagą, gdy stosunek przesuwa się o więcej niż ~10 punktów tydzień do tygodnia
3–5 decyzji podjętych lub zaproponowanych — ruchy budżetowe, testy uruchomione, testy odczytane — każda powiązana z liczbą, która ją uzasadniła
Diagnostyka kreacji i lejka poniżej: które koncepty niosą budżet, według naszego workflow analityki kreacji

Czego celowo nie pokazujemy: wykresów ścieżek multi-touch, „konwersji wspomaganych” per kanał i jakiegokolwiek ROAS platformy prezentowanego bez deflatora. Te artefakty generują dyskusje i zero decyzji.

Uczciwe podsumowanie atrybucji marketingowej po iOS: precyzja na poziomie użytkownika zniknęła i nie wróci. To, co zostało, wystarcza — czyste zdarzenia na dole, skalibrowane liczby platform w środku, łączna ekonomia na górze i eksperymenty tam, gdzie stawka je uzasadnia. Konta prowadzone w ten sposób podejmują decyzje wyglądające na wolniejsze — i lepsze. Jeśli chcesz zobaczyć, gdzie twój obecny stack raportowy sytuuje się względem tego standardu — warstwa pomiaru to pierwsza rzecz, którą punktujemy w audycie.

Intelligent Syndicate Research

Piszą operatorzy, którzy prowadzą konta. Bez ghostwriterów i wymyślonych person.

Atrybucja po iOS: czemu naprawdę ufamy w raportowaniu