OpenAI Agents SDK wzmacnia governance dzi�ki sandboxowi

Nowa ods�ona Agents SDK od OpenAI wprowadza natywne wykonanie w sandboxie, model-native harness i abstrakcj� Manifest � co realnie u�atwia przenoszenie agentowych workflow�w z prototypu na produkcj� bez utraty governance.

Autor: Redakcja TreffikAI16 kwietnia 20265 min czytania

Abstrakcyjny ciemny terminal symbolizuj�cy sandboxowane wykonanie agenta AI

OpenAI ods�oni�o znacz�c� iteracj� swojego Agents SDK, wprowadzaj�c sandboxowane wykonanie jako prymityw pierwszej klasy i przebudowuj�c control harness pod spos�b, w jaki frontier modele faktycznie chc� pracowa�. Dla zespo��w governance, ryzyka i platform w przedsi�biorstwach to jedna z bardziej konsekwentnych premier infrastruktury agentowej w tym roku.

Dlaczego enterprise utkn�o mi�dzy trzema z�ymi opcjami

Zespo�y przenosz�ce agent�w z prototypu na produkcj� by�y zmuszane do niewygodnych kompromis�w architektonicznych:

Frameworki niezale�ne od modelu dawa�y przeno�no��, ale zostawia�y najlepsze mo�liwo�ci frontier modeli na stole.
SDK dostawcy modelu �ci�le obejmowa�y model, ale dawa�y ograniczon� widoczno�� control harnessu.
Zarz�dzane API agentowe upraszcza�y deployment, ale zamyka�y workloady w w�skim �rodowisku wykonawczym i ogranicza�y dost�p do wra�liwych danych firmowych.

Zaktualizowane Agents SDK to pr�ba OpenAI, by skolapsowa� ten trylemat dostarczaj�c standaryzowanej infrastruktury z model-native harnessem i natywnym wykonaniem w sandboxie.

Model-native harness, a nie kolejny framework

Nowy harness wyr�wnuje wykonanie z naturalnym wzorcem operacyjnym modeli OpenAI. Najbardziej liczy si� to, gdy zadanie wymaga koordynacji mi�dzy systemami � retrieval, narz�dzia, filesystem, pami�� a niezawodno�� jest decyduj�cym czynnikiem mi�dzy demem a produkcyjnym rolloutem.

Przyk�adem jest Oscar Health. Ubezpieczyciel zdrowotny przetestowa� zaktualizowan� infrastruktur� na workflowie z dokumentacji klinicznej, kt�rego poprzednie podej�cia nie obs�ugiwa�y wystarczaj�co niezawodnie. Poza wyci�ganiem metadanych, system musia� rozumie� granice pojedynczych wizyt pacjent�w wewn�trz d�ugich, chaotycznych plik�w medycznych.

�Zaktualizowane Agents SDK uczyni�o dla nas mo�liwym do produkcji zautomatyzowanie krytycznego workflowu dokumentacji klinicznej, kt�rego poprzednie podej�cia nie obs�ugiwa�y wystarczaj�co niezawodnie� � powiedzia�a Rachael Burns, Staff Engineer i AI Tech Lead w Oscar Health. �R�nica polega�a nie tylko na wyci�ganiu w�a�ciwych metadanych, ale na poprawnym rozumieniu granic ka�dej wizyty w d�ugich, z�o�onych dokumentach.�

Po stronie deweloperskiej harness pakuje to, co kiedy� by�o bespoke'ow� hydraulik�:

Konfigurowalna pami�� i orkiestracja �wiadoma sandboxa
Narz�dzia filesystem w stylu Codex, w tym narz�dzie apply_patch do edycji plik�w
U�ycie narz�dzi przez MCP (Model Context Protocol)
Niestandardowe instrukcje przez AGENTS.md
Progresywne ujawnianie przez skille i wykonanie kodu przez narz�dzie shell

Pitch jest znajomy: przesta� przebudowywa� kruche customowe konektory i skup wysi�ek in�ynierski na logice domeny.

Manifest: przewidywalny workspace dla autonomicznego kodu

Stare stacki rzadko witaj� autonomiczne programy uprzejmie. Retrieval musi by� precyzyjny; vector store'y musz� pozosta� zsynchronizowane; halucynacje musz� by� zaw�one; a compute musi by� pod kontrol�. Bez standardowej powierzchni zespo�y ko�cz� sklejaniem tego wszystkiego r�cznie.

SDK wprowadza abstrakcj� Manifest, opisuj�c� workspace agenta: kt�re lokalne pliki s� zamontowane, gdzie id� outputy i jak zorganizowane jest �rodowisko. Manifesty ��cz� si� bezpo�rednio z g��wnymi enterprise'owymi object store'ami � AWS S3, Azure Blob Storage, Google Cloud Storage i Cloudflare R2 � wi�c model widzi przewidywalny widok, gdzie czyta� inputy, pisa� outputy i trzyma� stan podczas d�ugich run�w.

Z tego wypadaj� dwie wygrane governance:

Agent jest sterowany z dala od niefiltrowanych data lakes w stron� konkretnych, zwalidowanych okien kontekstu.
Zespo�y data governance mog� �ledzi� proweniencj� ka�dej zautomatyzowanej decyzji, od lokalnego prototypowania a� do produkcji.

Natywny sandbox: argument bezpiecze�stwa

SDK natywnie wspiera teraz wykonanie w sandboxie, daj�c zespo�om out-of-the-box warstw� uruchamiania kodu agenta wewn�trz kontrolowanych �rodowisk, kt�re ju� zawieraj� wymagane pliki i zale�no�ci. Zespo�y in�ynierskie mog� przynie�� w�asny sandbox � albo u�y� wbudowanych integracji z Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop i Vercel.

Mityacja ryzyka jest nag��wkiem. Ka�dy system, kt�ry czyta dane zewn�trzne lub wykonuje wygenerowany kod, musi by� traktowany jako nara�ony na prompt injection i pr�by exfiltracji. Architektoniczna odpowied� OpenAI to oddzielenie control harnessu od warstwy compute: credentialsy �yj� z harnessem, nigdy w �rodowisku, w kt�rym faktycznie dzia�a kod wygenerowany przez model. Wstrzykni�ta z�o�liwa komenda w sandboxie nie mo�e dosi�gn�� control plane'a ani ukra�� g��wnych kluczy API, t�pi�c �cie�k� lateral movement, kt�ra sp�dza zespo�om security sen z powiek.

Snapshotting: dlaczego to te� historia kosztowa

Bezpiecze�stwo nie jest jedynym powodem, by interesowa� si� tym oddzieleniem. D�ugo dzia�aj�cy agenci padaj� � kontenery si� crashuj�, sieci wypadaj�, limity API bij� w dach. Je�li dwudziestokrokowy agent kompiluj�cy raport finansowy umiera na kroku dziewi�tnastym, ponowne uruchomienie ca�ej sekwencji spala drogi compute.

Poniewa� stan jest zewn�trzny, SDK wspiera snapshotting i rehydratacj�: je�li kontener sandboxa zostaje utracony, infrastruktura odtwarza stan w �wie�ym kontenerze i wznawia od ostatniego checkpointu. Zespo�y finans�w, poznajcie swoj� now� ulubion� funkcj�.

To samo oddzielenie odblokowuje te� dynamiczne skalowanie:

Runy mog� wywo�ywa� jeden lub wiele sandbox�w w zale�no�ci od obci��enia
Konkretni subagenci mog� by� rutowani do izolowanych �rodowisk
Zadania mog� by� paralelizowane mi�dzy kontenerami dla szybszych czas�w wall-clock

Dost�pno�� i co dalej

Nowy harness i mo�liwo�ci sandboxa s� generally available przez API, wycenione na standardowe tokeny i tool-use � bez customowego kontraktu procurement. Startuj� najpierw dla Pythona, ze wsparciem dla TypeScriptu zaplanowanym na przysz�� release'�.

OpenAI m�wi, �e dodatkowe mo�liwo�ci, w tym code mode i subagenci, wyl�duj� w bibliotekach Pythona i TypeScriptu. Ekosystem ma si� tak�e poszerzy�, z wi�ksz� liczb� dostawc�w sandbox�w i wi�ksz� liczb� sposob�w wpi�cia SDK w istniej�ce systemy wewn�trzne.

Co zabra�

Dla lider�w platform i governance, trzy rzeczy warto zaznaczy� w swoich zespo�ach:

Oddzielenie harnessu od compute jest now� baz�. Je�li tw�j wewn�trzny framework agentowy wci�� wykonuje kod wygenerowany przez model wewn�trz tego samego �rodowiska, w kt�rym le�� twoje credentialsy, masz teraz widoczn� architektur� referencyjn�, kt�ra argumentuje przeciw temu.
Manifesty to okazja do uporz�dkowania dost�pu do danych. Nawet je�li nie adoptujesz SDK OpenAI, sam wzorzec � zadeklaruj workspace, wska� na governance'owane storage, ogranicz okno kontekstu � to pragmatyczna kontrola, kt�r� mo�esz skopiowa�.
Przeno�no�� sandboxa ma znaczenie. Wbudowane wsparcie dla wielu dostawc�w sandboxa sprawia, �e to mniejsza historia lock-inu ni� wcze�niejsze platformy agentowe � co u�atwia uzasadnienie wewn�trzne.

Niezale�nie od tego, czy Agents SDK stanie si� domy�lnym substratem dla agent�w enterprise, czy tylko podniesie poprzeczk�, kt�r� musi przeskoczy� ka�dy inny framework, kierunek jest jasny: produkcyjni agenci staj� si� problemem governance w pierwszej kolejno�ci, a problemem jako�ci modelu w drugiej.

Tagi:#openai#agents#governance

Udostępnij: