OpenAI Agents SDK wzmacnia governance dzięki sandboxowi

Nowa odsłona Agents SDK od OpenAI wprowadza natywne wykonanie w sandboxie, model-native harness i abstrakcję Manifest — co realnie ułatwia przenoszenie agentowych workflowów z prototypu na produkcję bez utraty governance.

Autor: Redakcja TreffikAI16 kwietnia 2026Zaktualizowano 30 maja 20265 min czytania

Abstrakcyjny ciemny terminal symbolizujący sandboxowane wykonanie agenta AI

Opis model-native harnessu, sandboxów i manifestów znajduje się w oficjalnej prezentacji nowej wersji OpenAI Agents SDK.

OpenAI odsłoniło znaczącą iterację swojego Agents SDK, wprowadzając sandboxowane wykonanie jako prymityw pierwszej klasy i przebudowując control harness pod sposób, w jaki frontier modele faktycznie chcą pracować. Dla zespołów governance, ryzyka i platform w przedsiębiorstwach to jedna z bardziej konsekwentnych premier infrastruktury agentowej w tym roku.

Dlaczego enterprise utknęło między trzema złymi opcjami

Zespoły przenoszące agentów z prototypu na produkcję były zmuszane do niewygodnych kompromisów architektonicznych:

Frameworki niezależne od modelu dawały przenośność, ale zostawiały najlepsze możliwości frontier modeli na stole.
SDK dostawcy modelu ściśle obejmowały model, ale dawały ograniczoną widoczność control harnessu.
Zarządzane API agentowe upraszczały deployment, ale zamykały workloady w wąskim środowisku wykonawczym i ograniczały dostęp do wrażliwych danych firmowych.

Zaktualizowane Agents SDK to próba OpenAI, by skolapsować ten trylemat dostarczając standaryzowanej infrastruktury z model-native harnessem i natywnym wykonaniem w sandboxie.

Model-native harness, a nie kolejny framework

Nowy harness wyrównuje wykonanie z naturalnym wzorcem operacyjnym modeli OpenAI. Najbardziej liczy się to, gdy zadanie wymaga koordynacji między systemami — retrieval, narzędzia, filesystem, pamięć — a niezawodność jest decydującym czynnikiem między demem a produkcyjnym rolloutem.

Przykładem jest Oscar Health. Ubezpieczyciel zdrowotny przetestował zaktualizowaną infrastrukturę na workflowie z dokumentacji klinicznej, którego poprzednie podejścia nie obsługiwały wystarczająco niezawodnie. Poza wyciąganiem metadanych, system musiał rozumieć granice pojedynczych wizyt pacjentów wewnątrz długich, chaotycznych plików medycznych.

„Zaktualizowane Agents SDK uczyniło dla nas możliwym do produkcji zautomatyzowanie krytycznego workflowu dokumentacji klinicznej, którego poprzednie podejścia nie obsługiwały wystarczająco niezawodnie” — powiedziała Rachael Burns, Staff Engineer i AI Tech Lead w Oscar Health. „Różnica polegała nie tylko na wyciąganiu właściwych metadanych, ale na poprawnym rozumieniu granic każdej wizyty w długich, złożonych dokumentach.”

Po stronie deweloperskiej harness pakuje to, co kiedyś było bespoke'ową hydrauliką:

Konfigurowalna pamięć i orkiestracja świadoma sandboxa
Narzędzia filesystem w stylu Codex, w tym narzędzie apply_patch do edycji plików
Użycie narzędzi przez MCP (Model Context Protocol)
Niestandardowe instrukcje przez AGENTS.md
Progresywne ujawnianie przez skille i wykonanie kodu przez narzędzie shell

Pitch jest znajomy: przestań przebudowywać kruche customowe konektory i skup wysiłek inżynierski na logice domeny.

Manifest: przewidywalny workspace dla autonomicznego kodu

Stare stacki rzadko witają autonomiczne programy uprzejmie. Retrieval musi być precyzyjny; vector store'y muszą pozostać zsynchronizowane; halucynacje muszą być zawężone; a compute musi być pod kontrolą. Bez standardowej powierzchni zespoły kończą sklejaniem tego wszystkiego ręcznie.

SDK wprowadza abstrakcję Manifest, opisującą workspace agenta: które lokalne pliki są zamontowane, gdzie idą outputy i jak zorganizowane jest środowisko. Manifesty łączą się bezpośrednio z głównymi enterprise'owymi object store'ami — AWS S3, Azure Blob Storage, Google Cloud Storage i Cloudflare R2 — więc model widzi przewidywalny widok, gdzie czytać inputy, pisać outputy i trzymać stan podczas długich runów.

Z tego wypadają dwie wygrane governance:

Agent jest sterowany z dala od niefiltrowanych data lakes w stronę konkretnych, zwalidowanych okien kontekstu.
Zespoły data governance mogą śledzić proweniencję każdej zautomatyzowanej decyzji, od lokalnego prototypowania aż do produkcji.

Natywny sandbox: argument bezpieczeństwa

SDK natywnie wspiera teraz wykonanie w sandboxie, dając zespołom out-of-the-box warstwę uruchamiania kodu agenta wewnątrz kontrolowanych środowisk, które już zawierają wymagane pliki i zależności. Zespoły inżynierskie mogą przynieść własny sandbox — albo użyć wbudowanych integracji z Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop i Vercel.

Mityacja ryzyka jest nagłówkiem. Każdy system, który czyta dane zewnętrzne lub wykonuje wygenerowany kod, musi być traktowany jako narażony na prompt injection i próby exfiltracji. Architektoniczna odpowiedź OpenAI to oddzielenie control harnessu od warstwy compute: credentialsy żyją z harnessem, nigdy w środowisku, w którym faktycznie działa kod wygenerowany przez model. Wstrzyknięta złośliwa komenda w sandboxie nie może dosięgnąć control plane'a ani ukraść głównych kluczy API, tępiąc ścieżkę lateral movement, która spędza zespołom security sen z powiek.

Snapshotting: dlaczego to też historia kosztowa

Bezpieczeństwo nie jest jedynym powodem, by interesować się tym oddzieleniem. Długo działający agenci padają — kontenery się crashują, sieci wypadają, limity API biją w dach. Jeśli dwudziestokrokowy agent kompilujący raport finansowy umiera na kroku dziewiętnastym, ponowne uruchomienie całej sekwencji spala drogi compute.

Ponieważ stan jest zewnętrzny, SDK wspiera snapshotting i rehydratację: jeśli kontener sandboxa zostaje utracony, infrastruktura odtwarza stan w świeżym kontenerze i wznawia od ostatniego checkpointu. Zespoły finansów, poznajcie swoją nową ulubioną funkcję.

To samo oddzielenie odblokowuje też dynamiczne skalowanie:

Runy mogą wywoływać jeden lub wiele sandboxów w zależności od obciążenia
Konkretni subagenci mogą być rutowani do izolowanych środowisk
Zadania mogą być paralelizowane między kontenerami dla szybszych czasów wall-clock

Dostępność i co dalej

Nowy harness i możliwości sandboxa są generally available przez API, wycenione na standardowe tokeny i tool-use — bez customowego kontraktu procurement. Startują najpierw dla Pythona, ze wsparciem dla TypeScriptu zaplanowanym na przyszłą release'ę.

OpenAI mówi, że dodatkowe możliwości, w tym code mode i subagenci, wylądują w bibliotekach Pythona i TypeScriptu. Ekosystem ma się także poszerzyć, z większą liczbą dostawców sandboxów i większą liczbą sposobów wpięcia SDK w istniejące systemy wewnętrzne.

Co zabrać

Dla liderów platform i governance, trzy rzeczy warto zaznaczyć w swoich zespołach:

Oddzielenie harnessu od compute jest nową bazą. Jeśli twój wewnętrzny framework agentowy wciąż wykonuje kod wygenerowany przez model wewnątrz tego samego środowiska, w którym leżą twoje credentialsy, masz teraz widoczną architekturę referencyjną, która argumentuje przeciw temu.
Manifesty to okazja do uporządkowania dostępu do danych. Nawet jeśli nie adoptujesz SDK OpenAI, sam wzorzec — zadeklaruj workspace, wskaż na governance'owane storage, ogranicz okno kontekstu — to pragmatyczna kontrola, którą możesz skopiować.
Przenośność sandboxa ma znaczenie. Wbudowane wsparcie dla wielu dostawców sandboxa sprawia, że to mniejsza historia lock-inu niż wcześniejsze platformy agentowe — co ułatwia uzasadnienie wewnętrzne.

Niezależnie od tego, czy Agents SDK stanie się domyślnym substratem dla agentów enterprise, czy tylko podniesie poprzeczkę, którą musi przeskoczyć każdy inny framework, kierunek jest jasny: produkcyjni agenci stają się problemem governance w pierwszej kolejności, a problemem jakości modelu w drugiej.

Tagi:#openai #agenci #governance

Udostępnij: