Diplomski rad iz oblasti kompjuterske vizije i mašinskog učenja za znakovni jezik

Mr. Igor Radulović odbranio je svoj diplomski rad na temu primjene kompjuterske vizije i mašinskog učenja za kreiranje prediktivnog modela za znakovni jezik. Odbrana rada održana je 3. oktobra na Univerzitetu Donja Gorica (UDG). Ovaj rad je realizovan pod uticajem kursa AI4S3 i uz podršku mentora iz NCC Crna Gora i HPC4S3ME tima.

APSTRAKT – Ovaj rad istražuje primjenu naprednih tehnika kompjuterske vizije i mašinskog učenja u razvoju sistema koji omogućava prevođenje znakovnog jezika u govor ili pisani tekst u realnom vremenu. Projekat ima za cilj da olakša komunikaciju gluvonijemih osoba sa osobama koje ne poznaju znakovni jezik, kako bi se prevazišle jezičke barijere i poboljšao društveni status gluvonijemih u zajednici. Korišćenjem tehnologija kao što su Google Colab, Python, Roboflow, VS Code i Detectron2, razvijen je sistem koji prepoznaje različite gestove američkog znakovnog jezika (ASL) i prevodi ih u razumljive informacije. Sistem je zasnovan na dubokim neuronskim mrežama i procesima kao što su treniranje modela i segmentacija instanci, sa ciljem postizanja visokog nivoa tačnosti i pouzdanosti. Kroz evaluaciju rezultata, ostvaren je impresivan F1 rezultat od 95,6%, dok tehnička ograničenja i dalje predstavljaju važan izazov za budući razvoj. Ovaj rad ukazuje na značajan društveni uticaj primjene kompjuterske vizije u komunikaciji gluvonijemih osoba, omogućavajući njihovu veću integraciju i prisustvo u savremenom društvu.

Computer vision and machinle learning for sign language