Naučni rad na 23. INFOTEH-JAHORINA konferenciji

Naučni rad pod nazivom „Manipulacija izlaza putem LoRA za generativnu vještačku inteligenciju“, autora I. Čulafić i saradnici, predstavljen je na 23. Međunarodnom simpozijumu INFOTEH-JAHORINA, koji je održan u periodu od 20. do 22. marta 2024. godine. Trening modela za predikciju trajao je oko šest sati na NVIDIA RTX 4090 GPU sa 24GB VRAM memorije. Ovo istraživanje poslužiće kao osnova za buduće eksperimente na HPC resursima. Rad je objavljen u IEEE Xplore bazi i dostupan je na linku: https://ieeexplore.ieee.org/document/10495995

APSTRAKT – Generativna vještačka inteligencija je posljednjih godina doživjela nagli porast popularnosti, obilježen pojavom revolucionarnih modela kao što su DALL-E 2, Midjourney i Stable Diffusion, koji su predvodili napredak u ovoj tehnološkoj oblasti. Cilj ovog istraživanja je korišćenje potencijala Stable Diffusion modela i njegovih ekstenzija u svrhu treniranja LoRA (Low-Rank Adaptation) modela za generisanje slika koje vjerno odražavaju originalne motive, koristeći unaprijed određeni broj primjera iz skupa podataka. Primarni cilj istraživanja je prikaz mogućnosti Stable Diffusion i generativne AI tehnologije u širem kontekstu, istraživanje mogućnosti koje nude open-source okviri, isticanje izazova povezanih sa loše organizovanim skupovima podataka za obuku, kao i prednosti kvalitetno organizovanih i obrađenih podataka. U radu je sprovedena komparativna analiza različitih diffusion modela i različitih jačina LoRA parametara. Istraživanje takođe ima za cilj da uporedi rezultate dobijene treniranjem sa većim brojem parametara na malim i relativno velikim skupovima podataka, kako bi se utvrdilo da li je pretreniranje i overfitting izraženije kod manjih ili većih datasetova.