OpenAI pokazuje agentów, którzy uczą się z prawdziwej pracy podatkowej
OpenAI i Thrive zbudowali agenta podatkowego na Codexie, który pracował na 7000 deklaracji, skracał przygotowanie o około jedną trzecią i poprawia się na korektach ekspertów.

OpenAI pokazało jeden z ciekawszych przykładów praktycznego agenta AI. Nie chodzi o asystenta, który obiecuje zrobić wszystko za wszystkich, tylko o system do pracy podatkowej: przygotowywanie szkiców deklaracji, harmonogramów, obliczeń i poprawek na podstawie realnych korekt ekspertów.
Projekt powstał z Thrive Holdings dla Crete, sieci ponad 30 firm CPA. W pilotażu obejmującym 7000 deklaracji podatkowych agent miał skrócić ręczne przygotowanie pracy o około jedną trzecią i osiągnąć do 97% dokładności szkiców.
To jest ważne, bo rozmowa o agentach AI zbyt często ucieka w hasło "autonomii". W usługach profesjonalnych prawdziwy test jest mniej efektowny: czy system potrafi wejść w istniejący proces, dać się sprawdzić, przyjąć poprawki i nie utrudniać ludziom pracy.
Ten przykład jest przez to ciekawszy niż kolejny pokaz chatbota. Pokazuje agentów jako narzędzia do poprawiania konkretnych workflow, a nie jako magiczne okienko do wszystkiego.
Co tak naprawdę zbudowało OpenAI
Agent działa wokół przygotowywania podatków, zwłaszcza tych fragmentów pracy, które znajdują się między surowymi dokumentami a gotową deklaracją.
Może pomagać w tworzeniu szkiców deklaracji biznesowych, przygotowywać wspierające zestawienia, wykonywać obliczenia i uwzględniać poprawki stanowe lub lokalne. To nie jest prosty formularz z chatbotem obok. To domenowy proces z dokumentami, regułami, wyjątkami, standardami firmy i śladem do weryfikacji.
OpenAI podkreśla, że system powstał z użyciem Codexa, czyli narzędzi kojarzonych głównie z programowaniem. I właśnie dlatego przykład jest ciekawy.
Praca podatkowa, gdy spojrzeć na nią z dystansu, przypomina kod bardziej, niż mogłoby się wydawać. Są dane wejściowe, transformacje, walidacje, wyjątki, komentarze recenzenta i końcowy artefakt, za który ktoś musi wziąć odpowiedzialność.
Lepsze pytanie nie brzmi więc: "czy AI zastąpi księgowych?". Lepsze pytanie brzmi: "czy AI zaczyna rozumieć język pracy firm księgowych?".
Dlaczego podatki są trudnym testem
Podatki są dobrym poligonem, bo błędy nie są tu tylko irytujące. Mogą kosztować pieniądze, stworzyć problem z regulacjami albo podważyć zaufanie klienta.
Sama praca też ma niewygodny kształt. Model musi czytać dokumenty, łączyć dane, stosować reguły zależne od jurysdykcji, pamiętać konwencje firmy i przygotować coś, co profesjonalista może szybko sprawdzić.
Ten ostatni element jest kluczowy. Narzędzie, które oszczędza czas tylko wtedy, gdy wszystko zrobi idealnie, jest w praktyce mało użyteczne.
W prawdziwej firmie agent musi pomagać także wtedy, gdy szkic wymaga poprawek. Wynik ma być czytelny, logiczny, łatwy do przejrzenia i łatwy do poprawienia. Jeśli recenzent traci więcej czasu na rozplątywanie pracy agenta niż na ręczne przygotowanie deklaracji, produkt przegrywa.
Deklarowana oszczędność około jednej trzeciej czasu sugeruje, że ten pierwszy praktyczny próg został przekroczony. To nie brzmi jak science fiction. Brzmi jak narzędzie, które zapracowana firma mogłaby rzeczywiście zostawić w procesie.
Najważniejszy jest mechanizm poprawiania
Najciekawszą częścią tej historii nie jest sama dokładność. Najciekawsza jest pętla uczenia się z realnej pracy.
OpenAI opisuje system, który korzysta ze śladów produkcyjnych, korekt ekspertów, ewaluacji i propozycji zmian w workflow. Prościej: agent wykonuje zadanie, profesjonaliści je sprawdzają, system zapisuje, co było nie tak lub co dało się zrobić lepiej, a potem aktualizuje sposób pracy.
To dużo dojrzalszy model niż zadawanie temu samemu chatbotowi kolejnego pytania i liczenie, że tym razem odpowie lepiej.
Poważny agent potrzebuje pamięci na poziomie procesu. Powinien uczyć się, że określony typ dokumentu firma obsługuje w określony sposób, że dana kalkulacja wymaga konkretnej listy kontrolnej albo że powtarzający się błąd należy zamienić w regułę.
W tym miejscu agenci w usługach profesjonalnych zaczynają przypominać żywe procedury operacyjne. Firma nie dostaje wyłącznie asystenta. Dostaje workflow, który można mierzyć, poprawiać i rozwijać.
Dlaczego Codex pasuje do tego zadania
Codex najczęściej kojarzy się z kodem, ale ten projekt pokazuje szerszy wzorzec. Wiele procesów biznesowych jest blisko programowania, nawet jeśli nikt nie nazywa ich programowaniem.
Podatki mają logikę warunkową. Podobnie underwriting ubezpieczeniowy, ocena kredytowa, raportowanie zgodności, dokumentacja medyczna, zakupy i audyt wewnętrzny.
W takich obszarach praca nie polega na swobodnej kreatywności. To ustrukturyzowany osąd: zastosuj reguły, obsłuż wyjątki, przygotuj szkic i pozwól człowiekowi go szybko ocenić.
Tu narzędzia z rodowodem programistycznym mogą mieć przewagę. Są tworzone do pracy krok po kroku, przetwarzania artefaktów, poprawiania wyników i działania z testami.
Nie oznacza to, że każde biuro stanie się software house'em. Oznacza raczej, że wiele cennych zadań biurowych ma ukrytą, powtarzalną logikę. Agenci stają się przydatni wtedy, gdy potrafią tę logikę zobaczyć i ulepszać.
Człowiek nadal jest częścią produktu
Ten agent podatkowy nie jest ciekawy dlatego, że usuwa ludzi z procesu. Jest ciekawy dlatego, że robi pętlę z człowiekiem bardziej produktywną.
Recenzja eksperta nie jest tu przejściową wadą. Jest elementem produktu.
Firma CPA nie potrzebuje systemu, który z pełną pewnością samodzielnie wysyła skomplikowane deklaracje. Potrzebuje systemu, który przygotowuje mocne szkice, pokazuje niepewność, respektuje standardy firmy i skraca czas sprawdzania.
To bardziej realistyczny model dla branż regulowanych i wrażliwych reputacyjnie. AI bierze na siebie przygotowanie. Profesjonalista zostawia sobie osąd, odpowiedzialność i ostateczną decyzję.
Właśnie tu pojawia się ekonomia. Jeśli czas ekspertów jest najdroższy i najrzadszy, najlepszy agent nie udaje, że eksperci są zbędni. Najlepszy agent sprawia, że eksperci mniej czasu spędzają na rutynowym składaniu materiałów, a więcej na decyzjach, które naprawdę wymagają ich wiedzy.
Co to oznacza dla usług profesjonalnych
Podatki są jednym przykładem, ale wzorzec łatwo przenieść dalej.
Kancelarie mają analizę umów i discovery. Firmy księgowe mają audyt i zamknięcie miesiąca. Konsultanci mają research, modele i materiały dla klientów. Banki mają przeglądy zgodności. Ubezpieczyciele mają akta szkód.
W każdym z tych miejsc agent musi zrobić coś więcej niż streszczenie. Musi wejść w istniejący system dokumentów, akceptacji, wyjątków i nawyków recenzenckich.
Nie wygrają zespoły z najdłuższym promptem. Wygrają zespoły, które potrafią zamienić swoją wiedzę w mierzalny proces: jak wygląda dobra praca, jakie błędy mają znaczenie, gdzie człowiek przejmuje decyzję i jak poprawki wracają do systemu.
To cicha, ale ważna zmiana. Adopcja AI przesuwa się od "dajmy ludziom chatbota" do "nauczmy organizację poprawiać własne pętle pracy".
Nie warto bezkrytycznie czytać liczb
Wyniki pilotażu są mocne, ale nie należy traktować ich jak uniwersalnej obietnicy.
7000 deklaracji w konkretnej sieci firm mówi nam, że system zadziałał w tym środowisku. Nie oznacza automatycznie, że każda kancelaria księgowa podłączy podobne narzędzie i od pierwszego dnia zobaczy identyczną dokładność oraz oszczędność czasu.
Znaczenie mają jakość danych, typy dokumentów, dyscyplina recenzji, sposób pracy firmy i głębokość integracji.
To nie osłabia tej historii. To jest jej właściwa lekcja. Agenci stają się naprawdę mocni dopiero wtedy, gdy są osadzeni tam, gdzie praca faktycznie się dzieje.
Ogólny model może imponować. Domenowy agent, poprawiany przez ekspertów w produkcji, zaczyna zmieniać koszt pracy.
Najkrócej
To jeden z wyraźniejszych sygnałów, że agenci AI wychodzą z trybu demo i wchodzą w operacje.
Historia nie polega na tym, że specjaliści podatkowi znikają. Polega na tym, że firma może zacząć zamieniać powtarzalne, eksperckie workflow w systemy agentowe, które uczą się w użyciu.
To bardziej przyziemna wersja przyszłości agentów, ale prawdopodobnie właśnie ta wersja będzie mieć największe znaczenie.
Kolejna fala AI w usługach profesjonalnych nie będzie należała do najgłośniejszego asystenta. Będzie należała do systemów, które potrafią siedzieć w realnym procesie, dobrze przyjmować korekty i przyspieszać ludzi bez niszczenia zaufania do wyniku.
(Zdjęcie: Kelly Sikkema / Unsplash, licencja.)


