steve's

apprendimento digitale e dintorni

Linguistica degli artefatti digitali

Nov
18

E’ la mia ultima fissazione. Un progetto di ricerca al suo nascere, cui sto cercando di dare sostanza e continuità presso Scienze della Comunciazione con un Laboratorio permanente, ma che è aperto a collaborazioni di vario genere.
L’idea (che mi pare originale, o comunque davvero poco diffusa) è che si possa guardare all’enorme corpus di codice sorgente scritto negli ultimi 50 anni come, appunto, ad un corpus testuale, scritto in lingue diverse, in epoche diverse, e quindi soggetto alle stesse leggi di qualsiasi altro corpus documentale.

Il progetto può essere descritto come la scoperta di un continente sconosciuto: quello dei codici sorgente dei programmi. Più di 50 anni di letteratura; più di 50 lingue diverse. Un corpus di testi dalle dimensioni quantitative enormi (SourceForge.net contiene quasi un milione di “libri” diversi relativi solo agli ultimi 5 anni). Nessun’indagine, nemmeno di ricognizione, è stata condotta finora da un punto di vista linguistico, cioè riconoscendo a questi documenti la loro caratteristica principale: cioè di essere scritti da persone concrete in tempi determinati, secondo le loro personali idiosincrasie ma anche seguendo stilemi e mode determinati. Prima di essere “descrizioni di un algoritmo in un liguaggio di programmazione”, sono documenti scritti e come tali risentono di tutte le particolarità di ogni testo a forma chiusa, come le poesie, le sceneggiature, le pubblicità ma anche gli spartiti musicali.

Esistono ovviamente grammatiche specifiche dei singoli linguaggi (non grammatiche descrittive, ma prescrittive); non ci sono però studi che trattano i linguaggi di programmazione diversi allo stesso modo delle lingue naturali, con caratteristiche espressive, specificità, evoluzione. Al massimo si tentano derivazioni di un linguaggio dall’altro, o se ne misura la diffusione nel tempo e nello spazio, senza arrivare ad una linguistica degna di questo nome.

Apparentemente, nessuna delle “scoperte” della linguistica moderna (dalla stilistica alla semiotica alla linguistica attanziale) è mai stata applicata a questo campo.

L’anno scorso ho tenuto un seminario a Science della Comunicazione, alla Sapienza di Roma, su questo argomento, insieme a Andrea Sterbini, ricercatore di Scienze ed esperto di linguaggi di programmazione.
Lui ha messo su un Wiki che potete consultare.
Se siete interessate/i all’argomento e avete voglia di approfondirne un aspetto, fatevi sentire.

Lascia un commento