LLM drošības testēšana
un MI pārvaldības atbilstība

Strukturēta, uz pierādījumiem balstīta LLM lietojumprogrammu drošības testēšana pēc 11 MI pārvaldības principiem — sasaistīta ar AI Verify, ES MI aktu un NIST AI RMF. Mēs piegādājam novērtētu atbilstības ziņojumu ar atklājumiem pa principiem, etalonu rezultātiem un praktiskām novēršanas vadlīnijām.

Nezināt, kāds ir jūsu LLM lietojumprogrammas stāvoklis? Rezervējiet bezmaksas 60 minūšu apjoma zvanu. Mēs salīdzināsim jūsu sistēmu ar pārvaldības ietvaru un noteiksim augstākā riska nepilnības.

Rezervēt bezmaksas apjoma zvanu →

Principiāls testēšanas ietvars

Mūsu metodika seko strukturētai ķēdei Principi → Rezultāti → Procesi → Pierādījumi — tā pati pieeja, kas ir Singapūras AI Verify un ES MI akta atbilstības prasību pamatā.

01

Principi

Visaptveroši pārvaldības apsvērumi, kuriem jūsu MI lietojumprogrammai jāatbilst — atvasināti no AI Verify, NIST AI RMF, ISO 42001 un ES MI akta.

02

Rezultāti

Izmērāmi rezultāti, kas definēti katram principam, aptverot gan tehniskos testus, gan netehniskās procesu pārbaudes (politikas, dokumentācija, pārvaldība).

03

Procesi

Praktiski testēšanas procesi: publisko etalonu pamatlīnijas, nozarei specifiski pielāgoti testi, komponentu līmeņa pārbaudes un manuālas sarkanās komandas sesijas.

04

Pierādījumi

Katrs process validēts ar dokumentāriem pierādījumiem — testu žurnāli, etalonu rezultāti, sarkanās komandas ziņojumi —, veidojot jūsu audita pēdas regulatīvajai atbilstībai.

Testēti 11 MI pārvaldības principi

Katrs novērtējums aptver visus 11 principus. Katrs tiek novērtēts (Jā / Nē / N/P) ar pierādījumiem un novēršanas ieteikumu, ja konstatētas nepilnības.

2Izskaidrojamība
3Atkārtojamība / reproducējamība
4Drošums
5Drošība
6Robustums
7Taisnīgums
8Datu pārvaldība
9Atbildība
10Cilvēka rīcībspēja un uzraudzība
11Iekļaujoša izaugsme un sabiedrības labklājība

Četras izvaddatu riska jomas

Mēs veicam pamatlīnijas testus (publiskās etalondatu kopas) un specifiskos testus (nozari pārzinoši scenāriji + sarkanās komandas pārbaudes) četrās galvenajās izvaddatu riska jomās, kā arī komponentu līmeņa pārbaudes RAG, filtriem un sistēmas uzvednēm.

💬

Halucinācija

Faktiski nepareiza, nepamatota vai nepilnīga satura ģenerēšana, kas augsta riska kontekstos var maldināt lietotājus.

Pamatlīnijas testi
  • MMLU — 15 000+ jautājumu 57 jomās
  • SimpleQA — 4 000+ īso faktu pārbaužu
  • FACTS Grounding — 1 700+ RAG precizitātes uzvedņu
  • CNN/DailyMail — 300K+ kopsavilkumu pilnīgums
Specifiskie testi
  • Nozarei specifiska faktu precizitāte jūsu lietojuma jomā
  • RAG pamatotība pretinieka dokumentu ievadīšanas apstākļos
  • Nepilnīguma un selektīvas izlaišanas atklāšana
⚠️

Nevēlams saturs

Kaitīga, toksiska vai juridiski aizliegta satura ģenerēšana — ieskaitot kultūras un vietējo juridisko kontekstu.

Pamatlīnijas testi
  • MLCommons AILuminate — 900 uzvednes, 9 kaitējuma kategorijas
  • XSTest — 250 drošu + 200 nedrošu atteikumu kalibrēšana
Specifiskie testi
  • Lietojuma gadījumam specifiski kaitējuma scenāriji
  • Kultūras normu un Baltijas/ES juridiskā atbilstība
  • Toksiskums mērķa valodās (LV, LT, ET, EN, RU)
Komponentu testi
  • Ievaddatu/izvaddatu filtru viltus negatīvie un viltus pozitīvie rezultāti
🔒

Datu atklāšana

Neparedzēta personas, organizācijas vai konfidenciālas informācijas noplūde — ieskaitot VDAR 9. panta kategorijas.

Pamatlīnijas testi
  • MLC AILuminate privātuma apakškopa — 100 PII izgūšanas uzvednes
  • XSTest personas informācija — 75 droši/nedroši izgūšanas scenāriji
Specifiskie testi
  • Vietējo tiesību jutīgums (VDAR, Baltijas datu likumi)
  • Iekšējā vs ārējā lietotāja konteksta atklāšanas sliekšņi
Komponentu testi
  • Sistēmas uzvednes konfidencialitāte un zināšanu bāzes PII noplūde caur RAG
🎯

Pretinieka uzvedņu uzbrukumi

Uzņēmība radīt nedrošus izvaddatus, saskaroties ar tīši izstrādātiem uzvedņu uzbrukumiem, kas paredzēti aizsardzības mehānismu apiešanai.

Pamatlīnijas testi
  • CYBERSECEVAL 4 — 15 uzvednes ievadīšanas riska varianti
  • Microsoft BIPIA — 600K+ teksta un koda uzbrukuma uzvednes
Specifiskie testi
  • Mērķtiecīgi pretinieka scenāriji, pielāgoti jūsu draudu modelim
  • Netieša ievadīšana caur dokumentiem, e-pastiem, tīmekļa saturu
  • Izturība pret apiešanu: lomu spēle, hipotētiski, kodēšanas apiešana
Komponentu testi
  • Ievaddatu filtra apiešana, sistēmas uzvednes pārrakstīšana, vairāku gājienu noturība

Ko jūs saņemat:
MI drošības kopsavilkuma ziņojumu

Katrs projekts noslēdzas ar strukturētu MI drošības kopsavilkuma ziņojumu — novērtētu, ar pierādījumiem pamatotu atbilstības dokumentu, kas piemērots iekšējai pārvaldībai, valdes līmeņa ziņošanai, korporatīvo klientu uzticamības pārbaudei un regulatīvajām iesniegšanām.

Kopējais vērtējums 104 procesu pārbaudēs (Jā / Nē / N/P ar pierādījumiem)
Katra principa izpildes rādītājs visiem 11 pārvaldības principiem
Etalonu rezultāti: veiktie, izturētie, neizturētie un izlaistie testi katram principam
Prioritizēti ieteikumi katras konstatētās nepilnības novēršanai
Ietvaru saskaņojums: Hiroshima CoC, NIST AI RMF, ES MI akta apzīmējumi
Neatkarīgs apliecinājuma paziņojums: mūsu formālais viedoklis par jūsu MI sistēmas drošības stāvokli
Pieprasīt parauga ziņojumu →
MI drošības kopsavilkuma ziņojums
Cyberfort • 2026
104
Procesu pārbaudes
69
22
13
N/P
1. Pārredzamība
72%
2. Izskaidrojamība
85%
4. Drošums
60%
5. Drošība
90%
8. Datu pārvaldība
55%

Novērtējuma paketes

Fiksēta apjoma, fiksētas cenas projekti. Piegādāti attālināti ar neobligātām klātienes sesijām klasificētām vai izolētām (air-gapped) sistēmām.

Essential
€6 500
Viena LLM lietojumprogramma vai tērzēšanas robots
  • Novērtēti visi 11 pārvaldības principi
  • Pamatlīnijas etalonu testi (publiskās datu kopas)
  • Automatizēta ievainojamību skenēšana
  • Aptvertas 4 izvaddatu riska jomas
  • Rakstisks kopsavilkuma ziņojums
  • 30 min pārrunu zvans
📅 2–3 nedēļu piegāde
Sākt novērtējumu →
Enterprise
Pielāgota
MI portfelis, valsts sektors vai regulēta nozare
  • Vairāku sistēmu portfeļa novērtējums
  • Pielāgota daudzvalodu etalonu izstrāde
  • Paplašināta sarkanā komanda (2+ nedēļas)
  • Klātienes testēšanas iespēja
  • Savstarpēja ietvaru kartēšana (AI Verify, ISO 42001, NIS2)
  • Valdes līmeņa vadības ziņojums
  • Regulatīvās iesniegšanas sagatavošana
  • Veltīts projekta vadītājs
📅 Atkarīgs no apjoma
Apspriest apjomu →

Uzziniet precīzi, kāds ir jūsu LLM lietojumprogrammas stāvoklis.

Rezervējiet bezmaksas 60 minūšu apjoma zvanu. Bez saistībām — mēs novērtēsim jūsu sistēmu, noteiksim augstākā riska nepilnības un ieteiksim pareizo paketi.

Atbilde 1 darba dienas laikā • [email protected]