John Bux, Com-s’ha-fet (2/4)
Treballar amb les hemeroteques és relativament difícil. Fins el dia d’avui, les intel·ligències artificials hi tenen accés limitat i has de saber què cerques perquè no entenen o saben què pretens trobar. En aquest sentit, cal dir diverses coses sobre les hemeroteques i/o sobre Bux. En primer lloc, només pots cercar sobre les que són obertes o existents. Sembla obvi... però ho dic en el sentit que no he pogut cercar en presumptes hemeroteques de més de mitja Europa. Se m’acudeix Itàlia, on no n’he trobat; Anglaterra, on m’havia de subscriure; Noruega; Alemanya; Suècia... Si travessem l’Atlàntic, tampoc l’hem pogut cercar a l’Argentina, ni a Mèxic, ni, tristament, als Estats d’Units d’Amèrica o Cuba. Tenint en compte això, pren tot el sentit el de l’obvietat.
Dit això, hi ha altres dificultats afegides. El programari amb el qual pots trobar el que cerques en les hemeroteques funciona amb reconeixement de caràcters. Per entendre’ns, és com quan entres a una zona no permesa amb el cotxe i al cap d’un temps reps una bonica multa. No és que hi hagi algú prenent nota de les matrícules, sinó que hi ha un programari que és capaç d’identificar una matrícula, i fins i tot llegir-la. Així doncs, quan tu cerques una paraula en una hemeroteca, cerca les coincidències amb el que escrius. I aquest és un matís molt important. Afortunadament, generalment no té en compte els accents, tot i que John Bux no en dugui.
Tanmateix, la troballa depèn de diversos factors. En primer lloc, com deia, de la paraula. Diria que en el 95% dels casos (per posar un valor), a John Bux se l’ha anomenat així, però també se li ha posat la hac en altres posicions, o se li ha dit d’altres maneres. Naturalment, si no hi ha coincidència no ho troba. A banda, també depèn de l’estat de la digitalització. Com us podeu imaginar, digitalitzar diaris de fa un centenar d’anys... en alguns se’ls ha esborrat la tinta; en d’altres en falta un tros; en d’altres el que ho va digitalitzar va posar la pàgina malament, o fins i tot la digitalització es va fer de capçaleres enquadernades i els extrems es veuen corbats i no s’identifiquen les paraules. Sigui com sigui, el fet és que tot i les mancances, l’hem trobat en més de dos mil dos-cents retalls de diaris. Però imagineu les que poden arribar a faltar! No obstant així, hem pogut dreçar la carrera artística d’uns vint anys.
Com ho hem pogut fer? També és complex. Sembla fàcil, però no ho és. Hom podria dir... doncs ordenes les capçaleres i ja ho tens. En part sí... però què passa en una entrevista de Bux de l’any 1931 quan parla d’una actuació d’uns anys enrere? o què passa si s'anuncia la seva actuació a setmanes vista, o si no s'anuncia i trobes la crònica quan ell ja para a una altra banda? La cosa es complica. Per tant, vàrem crear una petita base de dades amb la data, i el lloc d’actuació. Un cop ho teníem tot més o menys documentat, aleshores sí, ordenem per data i anem omplint buits temporals. Una tasca laboriosa, però necessària si es vol fer un treball amb un mínim de rigor.
Un cop s’havia fet això, ja era el moment de posar-se a escriure, i així es va fer. Però he dit més amunt que la cerca s’ha fet en tres tongades, tenint en compte que el procés de John Bux, rere les passes de l’home de goma ha durat més de sis anys. I amb les tres tongades ha passat una cosa meravellosa i dramàtica al mateix temps. He anat trobant més referències, però m’ha fet revisar tot el camí o el que havia redactat prèviament. Ha sigut, una mica, com el mite de Sísif. Però endavant, endavant... més motivació i més repte. Poc productiu, però engrescador.
He obviat, però no per això menys important, la part de la llengua. On s’han concentrat més referències són a Catalunya, Espanya, França i Brasil. Amb el català i l’espanyol, naturalment no hi ha hagut problema però... amb el francès i portuguès, o fins i tot l’holandès... com ens ho hem hagut de fer? Relativament molt simple, però molt entretingut i també molt laboriós. En primer lloc, transcriure-ho (el programari de reconeixement és força fal·lible), i segonament, fer ús de les noves tecnologies i utilitzar traductors en línia. Segurament són traduccions matusseres, però és el que ens vèiem compel·lits a fer amb un pressupost de zero mil, zero-cents zero-zero (o hauria de dir zeranta-zero?) euros: a més, per copsar el sentit ja és vàlid i suficient.
Comentaris
Publica un comentari a l'entrada