FERRARI Studio

Come le lingue riciclano parti di parole per evitare ambiguità

di Paul Arnold, Phys.org – editing di Gaby Clark, revisione di Robert Egan.

Traduzione di Alessandra Zuanazzi

 

Molte lingue riciclano le parole attribuendo ad esse significati diversi. In inglese, ad esempio, “run” può significare “correre” ma anche gestire qualcosa, come in “run a company” (gestire un’azienda). Oppure in spagnolo, dove il termine “lengua” indica sia l’organo della lingua sia l’idioma, quindi “la lengua española”. Questa modalità di riutilizzo delle parole è nota come colexificazione.

 

Esiste però un altro tipo di riciclo, definito colexificazione parziale, secondo il quale le lingue riutilizzano solamente parti di parole. Un chiaro esempio è la parola inglese “grand” (grande), che in inglese accomuna “grandfather” (nonno) e “grandmother” (nonna). Fino ad ora, tuttavia, si conosceva ben poco di regole, modelli e di quanta diffusione trovasse questo fenomeno nelle diverse lingue.

 

Un recente studio, pubblicato sulla rivista Nature Human Behaviour, esplora come diverse lingue riutilizzino in modo sistematico queste piccole parti di parole, bilanciando simultaneamente l’efficienza con la necessità di mantenere distinti i significati. Barend Beekhuizen, del Dipartimento di Studi Linguistici dell’Università di Toronto Mississauga, in Canada, ha pubblicato un articolo di commento nella sezione News & Views della stessa rivista dedicato a questa ricerca.

 

 

Un continuo braccio di ferro

 

 Prima di iniziare il loro studio, il team di ricercatori ha ipotizzato l’esistenza di un costante braccio di ferro tra due forze opposte che modellano il modo in cui i significati vengono associate alle parole. Si tratta della compressione lessicale (il riutilizzo di parole per garantire la massima semplicità) e la differenziazione lessicale (l’uso di forme diverse per evitare ambiguità nei significati). Una lingua, quindi, può certamente riutilizzare le stesse forme per significati correlati; tuttavia, un riutilizzo eccessivo rischia di complicare la distinzione tra tali significati.

 

I ricercatori hanno esaminato un vastissimo database linguistico, Lexibank, che raccoglie elenchi di parole derivanti da molte lingue. In particolare, hanno analizzato dati provenienti da oltre 1.900 lingue appartenenti a 192 famiglie linguistiche differenti.

 

Per comprendere la modalità in cui le due forze sopracitate operino nel mondo reale, i ricercatori si sono avvalsi di due strumenti. In primo luogo, per misurare il grado di interconnessione tra due concetti nella memoria umana, hanno utilizzato i dati di un gioco di associazioni di parole, nel quale a migliaia di soggetti veniva proposta una parola chiedendo poi di esprimere il primo pensiero che questa evocava loro.

 

In secondo luogo, hanno impiegato modelli informatici basati sull’IA per analizzare milioni di frasi e determinare la sovrapponibilità dei contesti in cui ricorrono parole diverse. Questo ha permesso loro di stimare la facilità con cui due significati rischiano di essere confusi se espressi con la stessa forma.

 

 

Rendere le cose più semplici

 

Il team ha scoperto che il riutilizzo di parti di parole non è affatto casuale e si verifica in molte famiglie linguistiche differenti. Il riutilizzo di una parola intera avviene quando quest’ultima è impiegata per più di un significato strettamente correlato che le persone riescono a distinguere facilmente: ne è un esempio la parola inglese “mouth” (che in inglese, appunto, viene utilizzata sia per indicare la bocca come parte del corpo, sia per indicare la foce di un fiume).

 

Il riciclo parziale delle parole rappresenta invece una sorta di compromesso. Si verifica quando due concetti sono fortemente correlati ma compaiono di frequente in contesti simili. In questi casi, la lingua riutilizza parti di parole con significati affini in modo da semplificare il tutto, mantenendo però i termini leggermente diversi per evitare malintesi. Come sottolineano i ricercatori nel loro articolo: «la colexificazione parziale sembra emergere come strategia intermedia laddove la colexificazione totale rischierebbe di generare ambiguità in contesti sovrapponibili».

 

Un esempio contemplato nel modello dei ricercatori è rappresentato dai termini inglesi “fourteen” (quattordici) e “ten” (dieci). Si tratta di numeri strettamente correlati ma, poiché utilizzati in contesti analoghi tra loro, assegnarne lo stesso identico nome creerebbe confusione. Le lingue tendono quindi a favorire forme che condividono una parte di elementi pur rimanendo distinte.

 

Gli autori dello studio affermano che, in futuro, potrebbe aver senso indagare se lo stesso equilibrio tra efficienza e chiarezza contribuisca alla modellazione anche di altri aspetti del linguaggio, per esempio la grammatica.