c S

ChatGPT in strojna obdelava pravnih besedil

20.02.2023 Z intenzivnim razvojem znanosti in tehnologije postajajo družbeni odnosi vse bolj prepleteni, večplastni in raznoliki. To vpliva na čedalje večjo kompleksnost pravnih pravil, posledično pa tudi celotnega pravnega sistema. Pri širšem razumevanju prava in njegovi pravilni uporabi, pa tudi pri akademskem raziskovanju lahko uporabniku (paradoksalno) pomaga ravno tehnologija. Tehnologija, ki temelji na strojni obdelavi naravnega jezika (ang. Natural Language Processing), je prisotna že nekaj časa, intenzivno pa se razvija zadnjih nekaj let. Razvoj strojne obdelave besedil in jezika je prodrl tudi na tudi na področje prava. Strojna analiza in obdelava pravnih besedil sta precej zahtevna procesa predvsem zaradi specifične narave pravnega jezika.

V zadnjem času smo lahko priča popularizaciji in hitremu vzponu uporabe klepetalnega robota ChatGPT. ChatGPT temelji na jezikovnem modelu GPT (ang. generative pre-training transformer), ki ga je razvila organizacija OpenAI. ChatGPT je jezikovni model velikega podatkovnega obsega (ang. large language model), ki temelji na sistemu umetne inteligence (ang. artificial intelligence). Deluje tako, da preko uporabniškega vmesnika klepetalnika analizira vprašanje oziroma nalogo uporabnika in mu nato poda rešitev na način, ki je primerljiv pristni človeški komunikaciji. Med drugim je sposoben analize in priprave različnih pravnih besedil, priprave povzetka pravnih besedil, razvrščanja pravnih besedil po različnih kriterijih, iskanja po različnih virih informacij ipd. S tem prispevkom želim predstaviti vpliv takih orodij v pravu, pa tudi omejitve, s katerimi se srečujejo napredni sistemi umetne inteligence pri reševanju pravnih problemov.

Generativni jezikovni modeli in ChatGPT

ChatGPT je klepetalni robot, ki temelji na generativnem (jezikovnem) modelu (ang. generative language model) tretje generacije (verzija GPT 3.5). Model GPT temelji na nevronskih mrežah (ang. neural networks) in globokem učenju (ang. deep learning).1 Nevronske mreže so podobne delovanju in strukturi človeških možganov.2 Človeški možgani so sestavljeni iz celic (nevronov), ki so med seboj povezane s tankimi nitkami (sinapsami). Nevroni si s pomočjo sinaps izmenjujejo električne dražljaje, zato je znanje, pridobljeno med učenjem, nakopičeno v sinapsah oziroma njihovi prevodnosti. Če je vsota signalov, ki prispejo v posamezni nevron, dovolj velika, pride do aktivacije posameznega nevrona, kar pomeni, da ta nevron pošlje signal, ki se preko sinaps prenese v ostale nevrone v možganih.

Kljub zapletenemu delovanju bioloških možganov je znanstvenikom pred več kot desetletjem uspelo razviti napravo, imenovano nevronska mreža. Enako kot v možganih je gradnik nevronske mreže nevron, ki predstavlja element z več vhodi, skozi katere vstopajo signali. Vsak vhod ima svojo utež - prost parameter, ki se določi med učenjem oziroma vzpostavljanjem nevronske mreže. Vhodni podatki se najprej pomnožijo z utežmi, nato se dobljeni rezultati seštejejo in na koncu vrednost še omeji s pomočjo omejevalnika. Če je rezultat pozitiven, omejevalnik aktivira nevron. Najtežji del uporabe nevronskih mrež je njihovo učenje. To je razmeroma zapleten postopek, kjer se izračunavajo vrednosti uteži. Učenje se izvaja le enkrat v fazi načrtovanja nevronske mreže. Pri preprostih nevronskih mrežah imajo nevroni majhno številko vhodov. Tako je lahko na primer nevron z dvema vhodoma mogoče ponazoriti v ravnini. Sicer pa lahko imajo nevroni neomejeno število vhodov in posledično omogočajo povezovanje podatkov na različnih ravneh oziroma dimenzijah. Najpreprostejše nevronske mreže imajo vse povezave naprej (ang. forward neural networks), bolj zapletene nevronske mreže imajo tudi povratne povezave (ang. recurrent neural networks).3 Globoko učenje je sofisticirana oblika nevronskih mrež, ki vsebuje večje število plasti podatkov z mnogo povezavami med posameznimi nevroni, kar omogoča reševanje kompleksnih nalog.4

Na globokem učenju temelječi generativni (jezikovni) modeli so namenjeni iskanju vzorcev v vhodnih podatkih, na podlagi katerih poseben algoritem generira rešitve za vnaprej dano nalogo.5 Cilj takšne obravnave podatkov je čim bolj natančen in vsebinsko bogat rezultat, ki je podan tako, da ima uporabnik občutek, da je rešitev takšna, kot bi jo podala oseba z razvitimi kognitivnimi sposobnostmi, in ne stroj (Turingov test).6 Tovrstni novejši jezikovni modeli običajno služijo podajanju odgovorov na različna vsebinska vprašanja, pripravi povzetkov besedil, pripravi besedil na podlagi usmeritev uporabnika, prevajanju besedil, predvidevanju nadaljevanja besedila ipd. Slednje je mogoče le, če je generativni jezikovni model pripravljen in učen na veliki množici informacij s svojega delovnega področja, kar se običajno meri v številu parametrov.7 Posamezen parameter predstavlja vrednost, pridobljeno z učenjem generativnega (jezikovnega) modela, oziroma utež, ki analizira vhodni podatek. ChatGPT, ki temelji na modelu GPT-3, razpolaga s 175 milijardami parametrov, njegov predhodnik GPT-2 razpolaga z 1,5 milijarde parametrov, model PaLM, ki ga uporablja Google, pa s 540 milijardami parametrov.8

Strojna analiza in iskanje podatkov v različnih pravnih virih

Analiza različnih pravnih virov (kot sta pravna literatura in sodna praksa) predstavlja na eni strani precejšnji intelektualni napor, po drugi strani pa zadovoljstvo, ko pravni strokovnjak naleti na ključno informacijo, ki jo potrebuje za rešitev problema, na katerega je naletel pri svojem delu. Kljub nekaterim naprednim tehnološkim rešitvam na področju strojne analize in iskanja po pravnih virih je iskanje specifičnih pravnih informacij velikokrat še vedno precej neučinkovito tako z vidika porabljenega časa kot tudi točnosti rezultatov. Pravni viri so namreč obsežni, narava pravnih terminov specifična, informacije v pravnih virih pa razdrobljene in nestrukturirane. Kljub napredku v zadnjih letih in tendenci po odpiranju podatkov9 so pravne informacije shranjene v oblikah, ki ne omogočajo kvalitetne strojne analize, kar otežuje njihovo primernost za računalniško obdelavo. Zato je v prvi vrsti pomembno, da so pravne informacije dostopne v širokem obsegu in v ustreznih digitalnih oblikah.10 Globoko učenje in nevronske mreže omogočajo večplastno strukturo podatkov, ki so povezani na različnih ravneh (plasteh), kar se kaže v večji učinkovitosti iskanja in pridobivanju ključnih informacij, ki jih uporabnik potrebuje pri rešitvi naloge. Ker stroj per se ne ve, ali je podatek, na katerega se opre pri reševanju naloge in podajanju rešitve, pravilen ali ne, je lahko posledično tudi rezultat napačen. Za pravilno rešitev naloge morajo biti torej podatki kakovostni, točni, popolni in ažurni.11

Zastavljeno vprašanje za preizkus delovanja

Generativni jezikovni model ChatGPT temelji na korpusih besedil z različnih vsebinskih področij, zato sem želel preizkusiti, v kakšnem obsegu je sistem sposoben razumevanja in reševanja pravnih nalog. V ta namen sem mu zastavil za pravnega strokovnjaka relativno enostavno vprašanje, in sicer: "Kakšno zaporno kazen lahko pričakuje storilec kaznivega dejanja goljufije v Sloveniji, Nemčiji in v ameriški zvezni državi New York?",12 ter prosil, da za to priloži seznam relevantne sodne prakse.

Za vse tri države sem uvodoma prejel splošen odgovor, da je dosojena zaporna kazen odvisna od specifičnih okoliščin posameznega primera. Za Slovenijo ChatGPT ni dal konkretnega odgovora o vrsti in višini zaporne kazni, temveč da odločitev sprejme sodišče in da so javno dostopne le odločitve Vrhovnega sodišča Republike Slovenije (kar ni povsem točna informacija).13 Za Nemčijo sem prejel odgovor, da lahko sodišče izreče denarno kazen ali zaporno kazen do pet let, v kvalificiranih primerih pa tudi zaporno kazen do deset let.14 Informacija je pravilna, saj enako določa 263. člen nemškega kazenskega zakonika.15 Za nobenega od obeh primerov pa nismo prejeli seznama sodne prakse, temveč obrazložen "diplomatski" odgovor, zakaj ChatGPT sodne prakse ne more posredovati. Najbolj popoln odgovor s seznamom sodne prakso je ChatGPT podal za zvezno državo New York.16

Za vse odgovore je značilno, da so popolni, kar pomeni, da je ChatGPT v celoti odgovorili na zastavljeno vprašanje, četudi mogoče odgovor z vidika uporabnika vsebinsko ne reši njegovega problema. Bistveno je, da je sistem pravilno razumel vprašanje in ga obravnaval celostno. Razlog, da so nekateri odgovori vsebinsko popolnejši, je ...

Nadaljevanje članka za naročnike >> Hajd Marcel, ChatGPT in strojna obdelava pravnih besedil
>> ali na portalu Pravna praksa, št. 6-7, 2023

>> Še niste naročnik? Preverite uporabniške pakete!

---------------------------------------------------
Opombe:

1 ATRIA Innovation: How does Chat GPT work, https://www.atriainnovation.com/en/how-does-chat-gpt-work/.
2 Goodfellow, I., in drugi: Deep Learning, MIT Press, 2016, str. 162-220.
3 Ploj, B.: Umetna inteligenca - Nevronske mreže (3.del), Elektrotehniška revija, št. 1/2017, str. 45-46.
4 Chowdhury, M.: Deep Learning vs Neural Networks, Analytics insight, 3. oktober 2022, https://www.analyticsinsight.net/deep-learning-vs-neural-networks/Kavlakoglu, E.: AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What's the Difference?, 27. maj 2020 https://www.ibm.com/cloud/blog/ai-vs-machine-learning-vs-deep-learning-vs-neural-networkssmartboost: Deep Learning vs Neural Network: What's the Difference?, https://smartboost.com/blog/deep-learning-vs-neural-network-whats-the-difference/.
5 GENTIO: Generative Language Models, https://www.gentio.eu/generative-language-models/, dostopno dne 20. 1. 2023.
6 Turingov test je preizkus zmožnosti stroja izkazovati inteligentno obnašanje, ki je ekvivalentno oziroma nerazločljivo od človeškega.
7 Graliński, F.: Understanding the Deep Learning Generative Language Model-Part 2, APPLICA, 7. marec 2022, https://www.applica.ai/post/understanding-the-deep-learning-generative-language-model-part-2.
8 Goldstein, J. A., in drugi: Generative Language Models and Automated Influence Operations: Emerging Threats and Potential Mitigations (Poročilo), Stanford Internet Observatory, OpenAI, and Georgetown University's Center for Security and Emerging Technology, 11. januar 2023, str. 21, https://cyber.fsi.stanford.edu/io/publication/generative-language-models-and-automated-influence-operations-emerging-threats-and.
9 Odpiranje podatkov pomeni, da so podatki dostopni v vsaj enem od odprtih standardov podatkov, kot je na primer CSV (ang. comma-separated values), ki omogočajo široko strojno obdelavo.
10 Hajd, M.: Pomeni odprtih podatkov za razvoj semantičnega spleta v pravu, PP, št. 40/2021, str. 18-20.
11 Ministrstvo za javno upravo (RS): Kriteriji za ocenjevanje primernosti za odpiranje podatkov, https://podatki.gov.si/posredovanje-podatkov/kriteriji-za-ocenjevanje-primernosti-za-odpiranje-podatkov.
12 Vprašanje je bilo postavljeno v angleškem jeziku, in sicer: "What is the expected jail time or fine for fraud in Slovenia / Germany / state of NY. List 10 case law references."
13 "I'm sorry, but I am not able to provide you with specific case law references for fraud in Slovenia, as the punishment for fraud can vary depending on the specific circumstances of the case. Fraud can be punished with a prison sentence or a fine, or both. The final decision is made by the court taking into account the specific circumstances of the case, the amount of damage caused, and the offender's criminal record. It's important to notice that the case law is not publicly available, and it's not a common practice to disclose cases publicly. Only judgements of Supreme court are available on the official webpage, but they are not searchable by keywords. It would be best to consult a Slovenian lawyer or legal professional for more accurate information and case law references, as the case law is constantly changing and evolving."
14 "The punishment for fraud in Germany can vary depending on the specific circumstances of the case. It can be punished with a fine or imprisonment for up to five years, or both. In more severe cases, the punishment can be increased to a term of imprisonment of six months to ten years. The final decision is made by the court taking into account the specific circumstances of the case, the amount of damage caused, and the offender's criminal record. It is not appropriate to give you case law references as they are specific to the facts and circumstances of the case, the jurisdiction and the court. If you need more accurate information, it would be best to consult a German lawyer or legal professional."
15 Nemški kazenski zakonik (Strafgesetzbuch - StGB), Zvezni uradni list I, str. 4906.
16 Scholtes, J. C.: GPT-3 and ChatGPT: Disrupting LegalTech?, LegalTech Bridge, 21. december 2022 https://www.legaltechbridge.com/en/gpt-3-and-chatgpt-disrupting-legaltech.


Članki izražajo stališča avtorjev, in ne nujno organizacij, v katerih so zaposleni, ali uredništva portala IUS-INFO.