V zadnjem času smo lahko priča popularizaciji in hitremu vzponu uporabe klepetalnega robota ChatGPT. ChatGPT temelji na jezikovnem modelu GPT (ang. generative pre-training transformer), ki ga je razvila organizacija OpenAI. ChatGPT je jezikovni model velikega podatkovnega obsega (ang. large language model), ki temelji na sistemu umetne inteligence (ang. artificial intelligence). Deluje tako, da preko uporabniškega vmesnika klepetalnika analizira vprašanje oziroma nalogo uporabnika in mu nato poda rešitev na način, ki je primerljiv pristni človeški komunikaciji. Med drugim je sposoben analize in priprave različnih pravnih besedil, priprave povzetka pravnih besedil, razvrščanja pravnih besedil po različnih kriterijih, iskanja po različnih virih informacij ipd. S tem prispevkom želim predstaviti vpliv takih orodij v pravu, pa tudi omejitve, s katerimi se srečujejo napredni sistemi umetne inteligence pri reševanju pravnih problemov.
Generativni jezikovni modeli in ChatGPT
ChatGPT je klepetalni robot, ki temelji na generativnem (jezikovnem) modelu (ang. generative language model) tretje generacije (verzija GPT 3.5). Model GPT temelji na nevronskih mrežah (ang. neural networks) in globokem učenju (ang. deep learning).1 Nevronske mreže so podobne delovanju in strukturi človeških možganov.2 Človeški možgani so sestavljeni iz celic (nevronov), ki so med seboj povezane s tankimi nitkami (sinapsami). Nevroni si s pomočjo sinaps izmenjujejo električne dražljaje, zato je znanje, pridobljeno med učenjem, nakopičeno v sinapsah oziroma njihovi prevodnosti. Če je vsota signalov, ki prispejo v posamezni nevron, dovolj velika, pride do aktivacije posameznega nevrona, kar pomeni, da ta nevron pošlje signal, ki se preko sinaps prenese v ostale nevrone v možganih.
Kljub zapletenemu delovanju bioloških možganov je znanstvenikom pred več kot desetletjem uspelo razviti napravo, imenovano nevronska mreža. Enako kot v možganih je gradnik nevronske mreže nevron, ki predstavlja element z več vhodi, skozi katere vstopajo signali. Vsak vhod ima svojo utež - prost parameter, ki se določi med učenjem oziroma vzpostavljanjem nevronske mreže. Vhodni podatki se najprej pomnožijo z utežmi, nato se dobljeni rezultati seštejejo in na koncu vrednost še omeji s pomočjo omejevalnika. Če je rezultat pozitiven, omejevalnik aktivira nevron. Najtežji del uporabe nevronskih mrež je njihovo učenje. To je razmeroma zapleten postopek, kjer se izračunavajo vrednosti uteži. Učenje se izvaja le enkrat v fazi načrtovanja nevronske mreže. Pri preprostih nevronskih mrežah imajo nevroni majhno številko vhodov. Tako je lahko na primer nevron z dvema vhodoma mogoče ponazoriti v ravnini. Sicer pa lahko imajo nevroni neomejeno število vhodov in posledično omogočajo povezovanje podatkov na različnih ravneh oziroma dimenzijah. Najpreprostejše nevronske mreže imajo vse povezave naprej (ang. forward neural networks), bolj zapletene nevronske mreže imajo tudi povratne povezave (ang. recurrent neural networks).3 Globoko učenje je sofisticirana oblika nevronskih mrež, ki vsebuje večje število plasti podatkov z mnogo povezavami med posameznimi nevroni, kar omogoča reševanje kompleksnih nalog.4
Na globokem učenju temelječi generativni (jezikovni) modeli so namenjeni iskanju vzorcev v vhodnih podatkih, na podlagi katerih poseben algoritem generira rešitve za vnaprej dano nalogo.5 Cilj takšne obravnave podatkov je čim bolj natančen in vsebinsko bogat rezultat, ki je podan tako, da ima uporabnik občutek, da je rešitev takšna, kot bi jo podala oseba z razvitimi kognitivnimi sposobnostmi, in ne stroj (Turingov test).6 Tovrstni novejši jezikovni modeli običajno služijo podajanju odgovorov na različna vsebinska vprašanja, pripravi povzetkov besedil, pripravi besedil na podlagi usmeritev uporabnika, prevajanju besedil, predvidevanju nadaljevanja besedila ipd. Slednje je mogoče le, če je generativni jezikovni model pripravljen in učen na veliki množici informacij s svojega delovnega področja, kar se običajno meri v številu parametrov.7 Posamezen parameter predstavlja vrednost, pridobljeno z učenjem generativnega (jezikovnega) modela, oziroma utež, ki analizira vhodni podatek. ChatGPT, ki temelji na modelu GPT-3, razpolaga s 175 milijardami parametrov, njegov predhodnik GPT-2 razpolaga z 1,5 milijarde parametrov, model PaLM, ki ga uporablja Google, pa s 540 milijardami parametrov.8
Strojna analiza in iskanje podatkov v različnih pravnih virih
Analiza različnih pravnih virov (kot sta pravna literatura in sodna praksa) predstavlja na eni strani precejšnji intelektualni napor, po drugi strani pa zadovoljstvo, ko pravni strokovnjak naleti na ključno informacijo, ki jo potrebuje za rešitev problema, na katerega je naletel pri svojem delu. Kljub nekaterim naprednim tehnološkim rešitvam na področju strojne analize in iskanja po pravnih virih je iskanje specifičnih pravnih informacij velikokrat še vedno precej neučinkovito tako z vidika porabljenega časa kot tudi točnosti rezultatov. Pravni viri so namreč obsežni, narava pravnih terminov specifična, informacije v pravnih virih pa razdrobljene in nestrukturirane. Kljub napredku v zadnjih letih in tendenci po odpiranju podatkov9 so pravne informacije shranjene v oblikah, ki ne omogočajo kvalitetne strojne analize, kar otežuje njihovo primernost za računalniško obdelavo. Zato je v prvi vrsti pomembno, da so pravne informacije dostopne v širokem obsegu in v ustreznih digitalnih oblikah.10 Globoko učenje in nevronske mreže omogočajo večplastno strukturo podatkov, ki so povezani na različnih ravneh (plasteh), kar se kaže v večji učinkovitosti iskanja in pridobivanju ključnih informacij, ki jih uporabnik potrebuje pri rešitvi naloge. Ker stroj per se ne ve, ali je podatek, na katerega se opre pri reševanju naloge in podajanju rešitve, pravilen ali ne, je lahko posledično tudi rezultat napačen. Za pravilno rešitev naloge morajo biti torej podatki kakovostni, točni, popolni in ažurni.11
Zastavljeno vprašanje za preizkus delovanja
Generativni jezikovni model ChatGPT temelji na korpusih besedil z različnih vsebinskih področij, zato sem želel preizkusiti, v kakšnem obsegu je sistem sposoben razumevanja in reševanja pravnih nalog. V ta namen sem mu zastavil za pravnega strokovnjaka relativno enostavno vprašanje, in sicer: "Kakšno zaporno kazen lahko pričakuje storilec kaznivega dejanja goljufije v Sloveniji, Nemčiji in v ameriški zvezni državi New York?",12 ter prosil, da za to priloži seznam relevantne sodne prakse.
Za vse tri države sem uvodoma prejel splošen odgovor, da je dosojena zaporna kazen odvisna od specifičnih okoliščin posameznega primera. Za Slovenijo ChatGPT ni dal konkretnega odgovora o vrsti in višini zaporne kazni, temveč da odločitev sprejme sodišče in da so javno dostopne le odločitve Vrhovnega sodišča Republike Slovenije (kar ni povsem točna informacija).13 Za Nemčijo sem prejel odgovor, da lahko sodišče izreče denarno kazen ali zaporno kazen do pet let, v kvalificiranih primerih pa tudi zaporno kazen do deset let.14 Informacija je pravilna, saj enako določa 263. člen nemškega kazenskega zakonika.15 Za nobenega od obeh primerov pa nismo prejeli seznama sodne prakse, temveč obrazložen "diplomatski" odgovor, zakaj ChatGPT sodne prakse ne more posredovati. Najbolj popoln odgovor s seznamom sodne prakso je ChatGPT podal za zvezno državo New York.16
Za vse odgovore je značilno, da so popolni, kar pomeni, da je ChatGPT v celoti odgovorili na zastavljeno vprašanje, četudi mogoče odgovor z vidika uporabnika vsebinsko ne reši njegovega problema. Bistveno je, da je sistem pravilno razumel vprašanje in ga obravnaval celostno. Razlog, da so nekateri odgovori vsebinsko popolnejši, je ...
Nadaljevanje članka za naročnike >> Hajd Marcel, ChatGPT in strojna obdelava pravnih besedil
>> ali na portalu Pravna praksa, št. 6-7, 2023
>> Še niste naročnik? Preverite uporabniške pakete!
---------------------------------------------------
Opombe:
Članki izražajo stališča avtorjev, in ne nujno organizacij, v katerih so zaposleni, ali uredništva portala IUS-INFO.