Zahteve za razpise za podjetniško AI v 2026: ocenjevalna preglednica, ki zahteva dokaze

Razpis za podjetniško AI je brez vrednosti, razen če dobavitelje prisili k preverljivim odgovorom z dokazi in ga spremlja strukturiran test po oddaji ponudb. Panoga se je prepričala, da je problem v tem, katera vprašanja postaviti. Ni tako. Problem je v tem, da kupci sprejemajo besedilo namesto odgovorov, besedilo pa je točno to, kar je usposobljen pisati vsak prodajni inženir.

Razpis za 2026 mora določiti oblike odgovorov, zahtevane dokaze, tehtano ocenjevanje, mejne vrednosti in vzorce odgovorov, ki vodijo v izključitev, preden se postavi eno samo vprašanje. Sledi struktura ocenjevalne preglednice, ki jo predamo podjetjem pri evalvaciji lokalnih AI platform — tehtane kategorije, zahteve za dokaze in protokol validacije, ki ga lahko to četrtletje prilepite v svojo predlogo za javno naročilo.

Predloge s seznami vprašanj so past za javna naročila

Dolgi katalogi vprašanj za AI razpise prevladujejo v izdajateljskem prostoru, ker so enostavni za pisanje in z njimi je nemogoče izgubiti. Ena konkurenčna predloga vsebuje več kot 125 uredljivih vprašanj ^[1]. Nič od tega ne pomaga nabavni ekipi, ki v petek popoldne primerja dva osemdesetstranskih odgovora dobaviteljev.

Težava ni pokritost vprašanj. Težava je ocenjevanje odgovorov. Ko vsak dobavitelj vrne isti gladek odstavek o ‘varnosti na podjetniški ravni’ in ‘robusten upravljanju’, vprašanje ni doseglo ničesar. AI ruši tradicionalno javno naročanje, ker nima fiksne površine funkcij — halucinacije, spremljanje, opuščanje modelov in razložljivost se spreminjajo med trajanjem pogodbe. Ploščat seznam tega ne more zajeti. Tehtana rubrika z obveznimi dokazi pa lahko.

Obravnavajte razpis kot prisilni mehanizem za razkrivanje, ne kot raziskovanje dejstev. Povejte dobaviteljem točno, kako mora videti sprejemljiv odgovor, kateri dokaz ga mora spremljati in kateri vzorci odgovorov povzročijo samodejno izključitev.

Opravite delo na strani kupca, preden sploh obstaja seznam dobaviteljev

Polovica razpisov, ki jih vidimo, neuspešno konča, preden je sploh sestavljen seznam dobaviteljev. Kupec nikoli ni klasificiral prioritetnih primerov uporabe, stopenj občutljivosti podatkov, pravil za človeka v zanki, potrdstvenih tokov dela ali metrik uspeha. Če to delo preskočite, dobavitelji privzeto definirajo ocenjevalna merila — v kakršni koli obliki, ki lasknni njihovemu izdelku. Več kot 80 % AI projektov neuspešno konča, vzroki pa so prevladujočno na strani kupca: neusklajnost, nezadostni podatki, tehnološko usmerjen miselni sklop, šibka infrastruktura in nerealna pričakovanja ^[4].

Štirje dokumenti morajo biti na mizi, preden se postavi kakršno koli vprašanje. Register primerov uporabe, ki klasificira vsak kandidatni delovni tok po občutljivosti podatkov, regulatornem dosegu in tolerantni stopnji napak. Inventar podatkov, ki navaja izvorne sisteme, iz katerih bo AI bral, kdo jih ima v lasti in katero klasifikacijo ima vsak od njih. Operativni model, ki definira kontrolne točke za človeka v zanki, RACI za AI rezultate in poti eskalacije, ko se model zmoti. Številčno definicijo uspeha — cilje latentnosti, proge natančnosti citiranja, stopnje deflektiranja ali karkoli primer uporabe zahteva.

Brez teh štirih artefaktov je razpis odprti poziv in dobavitelj je LLM. Dobili boste samozavestno odgovor, ki ga je nemogoče preveriti.

Stehtajte kategorije. Objavite mejne vrednosti.

Ocenjevalna preglednica za podjetniško AI potrebuje stehtane odseke in nepregovorne mejne vrednosti, ki izključijo dobavitelje, preden se ocenjevanje začne. Za lokalno zmožno platformo so kategorije: suverenost podatkov in model namestitve (20 %), RAG in verodostojnost citiranja (15 %), orkestracija agentov in orodij z obsegi delovanja (15 %), upravljanje, revizija in opazovalne zmogljivosti (15 %), integracijska struktura in življenjski ciklus modela (10 %), varnostni in skladnostni položaj (10 %), TCO s pogodbenii zgornjimi mejami (10 %) ter vzdržnost dobavitelja in pokritost podpore v EU (5 %). Prilagodite uteži, vendar jih objavite v razpisu, da dobavitelji vejo, po čem so ocenjeni.

Mejne vrednosti za uspeh/neuspeh stojijo nad ocenjevanjem. Dobavitelj, ki ne more delovati v celoti na infrastrukturi stranke, vključno z ločeno od zunanjega sveta, ne prestane mejne vrednosti suverenosti, ne glede na to, kako dobro se obnese drugje. Dobavitelj, ki usmerja katero koli vsebino poziva ali dokumenta skozi tretjeosebni LLM API, ki ga kupec ni izrecno odobril, ne prestane. Dobavitelj, ki ne more navesti citatov za izvorni dokument, stran in revizijo, ne prestane mejne vrednosti za RAG. Dobavitelj, katerega model upravljanja dokazuje AI odkrivanje, kontekstualno zavedanje, izvajanje v realnem času, reviznost in pripravljenost za delovne toke, ki jih vodijo avtonomni agenti, le na slajdu z načrti razvoja — ne v produkciji — ne prestane mejne vrednosti upravljanja ^[6]. Mejne vrednosti so binarne. Obstajajo zato, da besedilo ne more rešiti strukturnega pomanjkanja.

AI zmogljivosti zdaj predstavljajo 30–40 % ocenjevalnih meril za podjetniške CX razpise, naraščajoč z nič, kupci pa zahtevajo dokaze produkcijske namestitve namesto teoretičnih načrtov razvoja ^[2]. Če vaša ocenjevalna preglednica še vedno obravnava AI kot 10 % bonusni odsek na vrhu generične SaaS predloge, ocenjujete napačen izdelek.

Zahtevajte artefakte. Samo besedilo ocenite z nič.

Vsaka zahteva mora določiti artefakt, ki dokazuje odgovor. Odzivi samo v obliki besedila štejejo kot neuspeh. To je edina sprememba z najvišjim vplivom, ki jo lahko napravi kupec v 2026, skoraj nobena objavljena predloga pa je ne uveljavlja. Seznam artefaktov je kratek in konkreten: arhitekturni diagrami, ki prikazujejo tok podatkov na omrežni ravni, popoln seznam podprocesorjev z jurisdikcijami, vzorci izvozov revizijskih dnevnikov, postopki potrditve brisanja s časovnimi okviri, diagrami topologije namestitve za lokalne in ločene načine, podpisana poročila SOC 2 ali ISO ter rezultati rdečih ekip ali prompt-injection testov z metodologijo.

Vprašanja o rezidenci podatkov so najpomembnejša. Zahtevajte od dobaviteljev, da razkrijejo točne lokacije obdelave podatkov, vsak tretjeosebni LLM API, ki prejema podatke strank, politike hranjenja, ali se podatki strank uporabljajo za usposabljanje ali fine-tuning, standarde šifriranja v tranzitu in v mirovanju, procese brisanja s preveritvijo, podprocesorje in SLA obvestil o kršitvah ^[5]. Vsak odgovor pride z artefaktom — diagramom, reference klavzule pogodbe, posnetkom zaslona administracijskega konzole, vzorčno vrstico dnevnika. ‘Da, usklajena smo z GDPR’ brez dokumenta, ki to dokazuje, ni odgovor.

Na vrh vsakega odseka postavite eno navodilo: ‘Odgovori brez navedenega artefakta bodo ocenjeni z nič.’ Ta stavek naredi več za filtriranje dobaviteljev kot dodatnih petdeset vprašanj.

Kategorije za 2026, ki jih predloge pred 2025 nimajo

Stari IT razpisi nimajo kategorije za stvari, ki dejansko razlikujejo podjetniške AI platforme v 2026. Beleženje klicanja orodij, obsegi avtorizacije dejanj, sledenje citiranja do strani in revizije, odpornost na prompt-injection, reviznost avtonomnih delovnih tokov — nič od tega ne obstaja v predlogah, ki jih večina nabavnih ekip še vedno reciklira. Okviri upravljanja, ki se pojavljajo letos, eksplicitno testirajo AI odkrivanje in pokritost, kontekstualno zavedanje, upravljanje politik, izvajanje v realnem času, reviznost, prilagajanje arhitekture in pripravljenost za delovne toke, ki jih vodijo avtonomni agenti ^[6]. To je minimalna površina.

Na strani RAG mora vsak odgovor modela nositi citat do izvornega dokumenta, številke strani in revizije — preverljivo v UI s strani netehničnega uporabnika. Pragovi halucinacij spadajo v pogodbo, ne v marketinški material. Na strani agentov mora vsako orodje, ki ga model lahko prikliče, imeti deklarirani obseg avtorizacije, nespremenljiv dnevnik klicanja in kontrolno točko človeškega odobritve, ki se lahko konfigurira po obsegu. Če dobavitelj ne more pokazati vzorčnega revizijskega dnevnika dejanja agenta — vnos, orodje, ki je bilo poklicano, parametri, iznos, odobritelj — nima podjetniške platforme za agente. Ima demo.

Produkcijska AI neuspešno konča na infrastrukturi in usklajenosti toliko kot na kakovosti modela ^[4]. Ocenjevalna preglednica, ki spraševanje samo o modelnih benchmarkih, spregleda sloj, kjer se večina neuspehov dejansko zgodi: kakovost pridobivanja, propagacija dovoljenj, zanesljivost orodij in opazovalne zmogljivosti.

TCO je preglednica, ne odstavek

Ocenjevanje mora zahtevati konkretne cifre, ne generične klavzule ‘upoštevajte skupne stroške lastništva’, ki omogoča dobaviteljem, da citirajo nalepko cene in absorbirajo preostalo v naročila sprememb. Odsek TCO potrebuje pet numeričnih pododskov, vsak s pogodbenimi zgornjimi mejami. Ekonomija žetonov pod realnostno obremenitvijo, z izdelanim primerom z uporabo predvidene količine kupca. Variabilnost stroškov sklepanja med konicami in zunaj konic, z zgornjo mejo. Obvladovanje opuščanja modela — ko se osnovni model upokoji, kdo plača za ponovno evalvacijo, ponovno pozivanje in regresijsko testiranje. Stroški okolja za neprodukcijske, vključno z razvojnimi, postopnimi in odpovednimi obnova. Cene izhoda in migracije, vključno z oblikami izvoza podatkov, artefakti ponovnega usposabljanja in stroški vzporednega zagona obeh dobaviteljev med prehodom.

Skriti stroški so ena najpogosteje citiranih skrbi v trenutnem AI javnem naročanju ^[5], vendar se skoraj nikoli ne prevedejo v uveljavljiv jezik razpisa. Zahtevajte od dobaviteljev, da napolnijo preglednico stroškovnega modela, ki jo je priskrbel kupec, namesto da opisujejo svoje cene v prozi. Isti vnosi, ista formula, primerljivi izhodi. Dobavitelji, ki to zavrnejo, ne ščitijo komercialne zaupnosti — ščitijo opcijskost na vaš račun.

Test je pravi razpis

Pisni odgovori so filter, ne odločitev. Zadnjih 20 % skupnega ocenjevanja mora priti iz ponovljivega dokaza koncepta, izvedenega na testnih nizih, ki jih je priskrbel kupec, ocenjenega po isti rubriki kot pisni razpis. Test brez strukturiranega protokola je gledališče.

Protokol dokaza koncepta ima šest komponent. Ocenjevalni niz, ki ga je priskrbel kupec, z vsaj 200 reprezentativnimi vprašanji z znanimi pravilnimi odgovori in izvornimi dokumenti. Prag halucinacij, izražen kot maksimalni odstotek odgovorov brez veljavnih citatov, s pogodbo pogojeno s tem, da ostane pod njim. Baterija prompt-injection sond, zagnanih proti nameščenemu sistemu z zabeležnimi rezultati. Testiranje latentnosti pod sočasno obremenitvijo, ki se ujema s pričakovanimi produkcijskimi vzorci. Pregled revizijskih dnevnikov, kjer nabavna varnostna ekipa izvaža in pregleda dnevnike za vzorčni delovni tok. Potrjena vaja brisanja podatkov — pošljite zahtevo za brisanje, opazujte, kako artefakt izgine, potrdite, da je izginil iz indeksov, embeddings, predpomnilnikov in varnostnih kopij, s časovnimi žigi. Dobavitelji, ki ne morejo dokončati vaje v svojem navedenem SLA, ne prestanejo dokaza koncepta ne glede na kakovost modela. Kupci že prehajajo k zahtevanju dokazov produkcije nad načrti razvoja ^[2]; dokaz koncepta je, kjer postane to povpraševanje zavezujoče.

Če vaš razpis za 2026 ne more diskvalificirati dobavitelja na podlagi dokazov, ki jih zavrne predložiti, ne nabavljate AI platforme — preizkušate prodajni predstav.

Spoznajte, kako lokalna AI platforma Wavenetic odgovarja na razpis, ki zahteva dokaze — https://wavenetic.com