Ovaj kratki kurs uvodi osnove dizajna konverzacionih sistema (intent-i, entiteti, slot filling, dijalog) i savremene LLM pristupe (prompt inženjering, function calling, RAG). Polaznici praktično kreiraju četbot uz indeksiranje sopstvenih dokumenata, evaluaciju kvaliteta odgovora, zaštitu sadržaja i brzi deploy na web/. Uključena je i HPC perspektiva za masovno ugrađivanje embedinga i offline evaluacije/„load testing “.
- Datum: 21.11.2025 u 11:45
- Lokacija: PS, UDG
- Registracija je obavezna: https://forms.gle/SRW6GYiRAbi8pFBe8
- Namijenjeno za: studente, istraživače i profesionalce sa osnovnim znanjem Pythona i web/API rada.

Pregled sadržaja:
Sesija 1 (90 min) – teorijski okvir
- Od klasičnog NLU (intent, entiteti, slotovi) do LLM agenta
- Dizajn dijaloga: state machine vs. tools/functions
- RAG osnove: indeksiranje, chunking, hibridno pretraživanje, citiranje izvora
- Evaluacija i sigurnost: relevance/groundedness, moderacija, PII
- HPC pogled: kada i zašto batch embedding i evaluacije
Sesija 2 (90 min) – hands-on lab
- Postavljanje projekta i starter RAG pipeline
- Uvoz/indeks dokumenata, prompt + function calling
- Brza evaluacija i guardrails
- Deploy web chata + osnovna telemetrija
Ishodi učenja
- Razlikovati i uporediti intent-based i LLM-based pristup.
- Modelovati dijalog i dizajnirati RAG tok sa citiranjem izvora.
- Isporučiti četbot sa evaluacijom i zaštitama.
- Primijeniti HPC tehnike za skaliranje embedinga i offline testiranje.

