18. jula 2023. godine, Meta je objavila LLaMA 2 – familiju modela koja je zauvijek promenila pravila igre u razvoju otvorenih AI sistema. Za razliku od svog prethodnika (LLaMA 1, objavljenog februara iste godine), LLaMA 2 je lansiran sa komercijalnom licencom koja dozvoljava slobodnu upotrebu u poslovne svrhe – čak i velikim korporacijama. Ovim potezom Meta je direktno izazvala zatvorene modele poput GPT-4 (OpenAI) i Claude (Anthropic).
Modeli dolaze u tri veličine – 7B (7 milijardi), 13B (13 milijardi) i 70B (70 milijardi parametara) – pri čemu najveći od njih (70B) postiže performanse usporedive sa vodećim zatvorenim sistemima u mnogim benchmark testovima. Važno je napomenuti da su svi modeli besplatni za istraživačke i akademske svrhe, što je dodatno potaklo inovacije u zajednici.
Specifikacije i ključna tehnička poboljšanja
LLaMA 2 modeli su trenirani na 2 triliona tokena (jedinica tekstualnih podataka), što predstavlja 40% više od prethodne verzije. Najveći model (70B) koristi poboljšanu arhitekturu koja optimizuje odnos između performansi i računarskih zahteva – omogućavajući efikasnije korišćenje resursa bez žrtvovanja kvaliteta. Svi modeli podržavaju:
- Kontekstni prozor od 4.096 tokena (dovoljno za većinu praktičnih primena, od chatbotova do analize dokumenta)
- Optimizaciju za konverzacije kroz Reinforcement Learning from Human Feedback (RLHF) – istu tehniku koju koriste i zatvoreni modeli poput GPT-4
- Podršku za engleski i 26 drugih jezika (uključujući srpski, iako sa ograničenijim performansama od engleskog)
Meta je paralelno lansirala i LLaMA 2-Chat – varijante specijalno prilagođene za dijaloge. Ovi modeli pokazuju značajna poboljšanja u:
- Koherentnosti razgovora (manje “halucinacija” i besmislenih odgovora)
- Sledjenju instrukcija (bolje razumevanje nijansi u pitanjima)
- Bezbednosnim filtrima (smanjen rizik od štetnih ili pristrasnih odgovora)
Na standardnim benchmarkovima, poput HumanEval (za kodiranje) i MMLU (za opšte znanje), LLaMA 2-70B postiže rezultate bliske vodećim zatvorenim modelima – često sa manje od 10% zaostatka u preciznosti.
Uticaj na ekosistem otvorenih AI modela
Objavljivanje LLaMA 2 pokrenulo je lavinu inovacija u oblasti otvorenog AI-a. U roku od nekoliko meseci:
- Tehnološki divovi poput Microsofta, Amazona (preko AWS Bedrock) i IBM-a (u okviru Watsonx) integrisali su LLaMA 2 u svoje cloud platforme, omogućavajući lakši pristup preduzećima.
- Istraživači i startapi kreirali su stotine derivativnih modela za specifične primene – od medicinske dijagnostike do pravne analize.
- Platforme poput Hugging Face (koja nudi jednoklik deploy), Together AI i Replicate demokratizovale su pristup, omogućavajući čak i malim timovima da fine-tuneju i hostuju modele bez skupe infrastrukture.
Zahvaljujući otvorenoj prirodi, LLaMA 2 je postao osnova za projekte kao što su:
- Code Llama (specijalizovan za programiranje)
- LlamaFactory (alati za lako fine-tuningovanje)
- llama.cpp (optimizacija za pokretanje na lokalnim uređajima, čak i na laptopovima)
Zašto je ovo važno?
LLaMA 2 nije samo još jedan jezički model – on predstavlja prekretnicu u razvoju AI-a iz više razloga:
- Prvi otvoreni model koji parira zatvorenim sistemima – do tada su samo kompanije poput OpenAI i Google imale modele ove klase, zatvorene za javnost. LLaMA 2 je dokazao da otvoreni pristup može da stvori konkurentne performanse.
- Demokratizacija AI tehnologije – komercijalna licenca omogućila je startupima, univerzitetima i čak pojedincima da grade sopstvene AI rešenja bez milionskih investicija u razvoj modela.
- Neutralizacija “cloud zavisnosti” – kompanije više nisu prisiljene da se oslanjaju na API-je velikih provajdera (poput OpenAI ili Google Cloud), već mogu da hostuju modele na sopstvenoj infrastrukturi, čuvajući podatke i kontrolišući troškove.
- Transparencija kao novi standard – Meta je objavila detaljnu dokumentaciju, uključujući podatke o treniranju, arhitekturi i ograničenjima, postavljajući primer za buduće otvorene modele.
- Potsticanje konkurencije i inovacija – otvoreni pristup ubrzao je razvoj novih alata, biblioteka i primena, od lokalnih chatbotova do specijalizovanih AI asistenata za industriju.
Kao što je MIT Technology Review istakao, LLaMA 2 je “možda najvažniji korak ka otvorenijem AI ekosistemu od pojave transformerske arhitekture 2017. godine”. Njegov uticaj se osjeća i danas, jer sve više kompanija i vlada prepoznaje strategijsku važnost otvorenih modela za nacionalnu bezbednost, ekonomiju i tehnološku suverenost.




