GenAI-HPC4WB FFplus projekat
PROBLEM / IZAZOV
HR i tehnologije regrutovanja napredovale su brzo posljednjih godina, ali ti napretci su uglavnom izgrađeni oko velikih svjetskih jezika — prije svega engleskog. Jezici Zapadnog Balkana — crnogorski, srpski, bosanski i hrvatski — dijele zajednički lingvistički korijen, ali nose distinktivan vokabular, profesionalni registar i regionalni kontekst s kojim opšti AI modeli loše barataju. Kada se primjenjuju na zadatke poput analize biografija, razumijevanja opisa radnih mjesta ili uparivanja kandidata s pozicijama na ovim jezicima, gotovi LLM modeli daju rezultate koji su suviše neprecizni za praktičnu upotrebu, ograničavajući mogućnost regionalnih kompanija da iskoriste prednosti modernih AI alata za zapošljavanje.
Rješavanje ovog nedostatka zahtijeva fino podešavanje (fine-tuning) moćnih unaprijed treniranih jezičkih modela na skupovima podataka specifičnim za domen i region — proces koji je računarski daleko izvan dosega standardnog hardvera. Treniranje i adaptacija velikih jezičkih modela kao što su BERTić (BERT-zasnovani model razvijen specifično za južnoslavenske jezike), LLaMA 3.0 i Mistral, kako bi dobro funkcionisali u profesionalnom kontekstu Zapadnog Balkana, zahtijeva pristup GPU računarskim resursima velikog obima. Bez toga, jezički kvalitet regionalnih AI alata ostaje daleko iza onoga što je dostupno na većim jezičkim tržištima.

RJEŠENJE
Dvije crnogorske kompanije — Recrewty (AI platforma za regrutovanje) i DigitalSmart — sarađivale su na projektu GenAI-HPC4WB u okviru FFPlus Open Call #1, dobivši finansiranje od EuroHPC JU po ugovoru br. 101163317 (Program digitalne Evrope). Uz smjernice i podršku Univerziteta Donja Gorica (UDG) i NCC Crna Gora, projekat je obezbijedio pristup superkompjuteru Leonardo Booster (EuroHPC JU, CINECA, Italija) putem Development Access Call-a. Primarna upotreba HPC resursa bila je fino podešavanje modela BERTić i drugih open-source LLM-ova na anonimizovanim, domenski specifičnim tekstualnim skupovima podataka na crnogorskom, srpskom, bosanskom i hrvatskom jeziku — pri čemu u nijednoj fazi nisu prenošeni lični podaci na HPC infrastrukturu. Rezultat je skup regionalno prilagođenih jezičkih modela koji značajno poboljšavaju sposobnost platforme da obrađuje profesionalni tekst na ovim jezicima. Šira platforma GenAI-HPC4WB koristi ove poboljšane modele za podršku analizi biografija i uparivanju s opisima radnih mjesta, pružajući regruterima kvalitetnije alate za jezičko razumijevanje na tržištu Zapadnog Balkana. Projekat se trenutno nalazi u završnoj fazi.

BENEFITI
- Unaprijeđena regionalna jezička AI: Fino podešavanje modela BERTić i drugih LLM-ova na superkompjuteru Leonardo Booster rezultiralo je jezičkim modelima s bitno boljim razumijevanjem crnogorskog, srpskog, bosanskog i hrvatskog u profesionalnom i HR kontekstu — što popunjava prazninu koja je ranije kočila primjenu AI alata u regionu.
- Obim i brzina omogućeni HPC-om: GPU resursi superkompjutera Leonardo Booster omogućili su treniranje modela u velikom obimu i iterativno eksperimentisanje koje bi na standardnom hardveru bilo nepraktično, značajno skraćujući razvojni ciklus regionalno prilagođenih AI modela.
- Pristup privatnosti od samog dizajna: Nikakvi lični podaci niti podaci o kandidatima nisu poslati na HPC infrastrukturu. Cjelokupno fino podešavanje vršeno je na anonimizovanim tekstualnim skupovima podataka, osiguravajući potpunu usklađenost s GDPR-om i usklađenost s okvirom EU Akta o vještačkoj inteligenciji od samog početka.
- Dostupni AI alati za regionalne MSP-ove: Poboljšani jezički modeli podržavaju rekrutacijske platforme u obradi biografija i opisa radnih mjesta na lokalnim jezicima s većom preciznošću, pomažući kompanijama svih veličina da iskoriste AI-potpomognute procese zapošljavanja, ne zamjenjujući pritom ljudsku procjenu u procesu.
- Ponovljivi model za usvajanje HPC-a na Zapadnom Balkanu: Ovaj projekat demonstrira da crnogorski MSP-ovi, uz podršku NCC Crna Gora i UDG, mogu uspješno da pristupe i koriste vrhunsku evropsku HPC infrastrukturu za izgradnju komercijalno relevantnih AI proizvoda za nedovoljno pokrivena regionalna jezička tržišta.
NCC Montenegroi Univerzitet Donja Gorica podržali su ovaj projekat, prvenstveno tokom pripreme FFPlus prijave i zahtjeva za pristup superkompjuteru Leonardo Booster.

