Visul primului inginer al limbii române: un dicționar cît Google
Povești fără timbru 24 octombrie 2011 Niciun comentariu la Visul primului inginer al limbii române: un dicționar cît Google 122„Am făcut o pasiune din a vorbi corect românește”, spune Cătălin Frâncu. A crescut această pasiune în urmă cu zece ani, pe cînd era student în SUA, la MIT, iar, treptat, a transformat-o într-un proiect online. Fără să aibă vreo pregătire academică sau studii de specialitate, Cătălin s-a decis să facă site-ul dexonline.ro, unde să fie trecute toate cuvintele limbii române. I-a dat drumul în februarie 2001, iar de la 200 de definiții, cît a scris în primele luni, a ajuns la aproape 420.000. La început, oamenii credeau că este un lingvist sau cercetător al Academiei Române, dar el spune amuzat că „dincolo de clasa a opta nu am mai făcut gramatică”. A făcut totul pe cont propriu, fără nici o sursă de finanțare din partea vreunei instituții, iar acum portalul a devenit unul dintre cele mai accesate și mari dicționare online din România. După zece ani de locuit și lucrat în SUA, la Google, Cătălin a renunțat la visul american pentru a-și îndeplini visurile de inginer. Nu are nici un regret că și-a lăsat locul de muncă din California, iar acum se dedică numai proiectelor de voluntariat pe care le are. Dexonline a devenit copilul lui, care crește pe zi ce trece.
Era cu o copertă alb cu roz, iar literele erau puțin în relief. Era dicționarul de sinonime și a costat 35.000 de lei. A fost primul pe care l-am primit. „O să facem toată colecția și o vezi de ce mare ajutor îți va fi”, spunea taică-miu, atunci cînd mi l-a dat. La opt ani descopeream cum e să te joci cu unele cuvinte, iar în colecție s-au adunat cam zece la număr. La Cătălin Frâncu, primul dicționar a fost unul al Limbii Române Moderne, ulterior, pe la 11-12 ani l-a primit și pe cel al Limbii Române Contemporane și de Neologisme. Acum, acasă în București, are cam 15-20, împrăștiate pe rafturi, iar printre acestea se găsește și mamutul DEX. Pe o parte dintre ele le-ar putea arunca, le are deja în micul server din cameră. Acolo se află tot DEX-ul în varianta digitală, alături de alte șase dicționare. Este munca lui de mai bine de zece ani și are exact 417.948 de definiții.
Vorbește repede și clar, zîmbește larg și entuziasmul i se zărește în colțul buzelor. A ajuns în SUA în 1999, cînd s-a transferat la MIT (Massachusetts Institute of Technology), iar din februarie 2001 a început să lucreze la DEX, varianta online. Îi plăceau dicționarele americane pe care le găsea pe internet, bazele lor de date erau imense, iar în România nu vedea nici un astfel de proiect. A fost ca o probă de principii, iar în fond, recunoaște el, o dovadă de patriotism. Și a început singur, folosindu-și calculatorul personal, care se transforma, periodic, cînd în server, cînd în consolă de joc. „Primul server a fost la mine, în camera de cămin, în primul an, după care, cînd am plecat în California, am luat calculatorul cu mine. L-am desfăcut bucăți, l-am pus în valiză, iar atunci site-ul a fost închis vreo două-trei zile. Apoi, cînd mai voiam să mă joc pe calculator, închideam sistemul de operare Linux și treceam în Windows și serverul cădea din nou. Dar asta a fost pînă prin 2003, cînd am cumpărat un calculator care stătea deschis non stop numai pentru DEX”, povestește Cătălin.
Primul cuvînt pe care l-a introdus a fost „negativ”. Fără nici un motiv anume, spune el. Fiecare proiect pe care l-a început l-a văzut ca pe o platformă la care să poată contribui toți utilizatorii, care urma să crească pe măsură ce era descoperit de oameni. Iar primul proiect la care a lucrat a fost un soi de trivia despre celebrități, unde fiecare utilizator venea și adăuga cîte o nouă întrebare sau cîte un nou personaj. „La început am pornit cu o bază de date goală, dar oricine putea să adauge o întrebare cu două răspunsuri. Prima întrebare pe care am băgat-o a fost ceva de genul «e în viață sau a murit?», «e bărbat sau femeie?». Da sau nu, astfel era un arbore de posibilități, care se bifurca la fiecare întrebare. Din momentul ăla, informația tot creștea și era la dispoziția fiecăruia și a ajuns la câteva sute de noduri. Lumea își băga pînă și colegii de clasă pe acolo”.
Student restanțier, caut coleg de cameră la MIT
Avea deja trei restanțe, materiile nu îi plăceau, iar „metoda de predare și de atitudine față de student era foarte dezamăgitoare”. Era în al treilea an de studii la Politehnica din București și a decis să se transfere. A depus vreo zece dosare de admitere la cele mai bune universități din SUA, printre care Princeton, Harvard, Standford, și MIT. A fost acceptat numai de ultima, MIT, iar în 1999 a ajuns în SUA, lăsînd în urmă Politehnica și, în total, alte cinci restanțe.
„Acolo a fost prima oară cînd mi-am dat seama că eu acolo chiar trebuie să învăț. Spre deosebire de Poli, unde aveam 30 de ore de curs, la MIT aveam, cu tot cu laboratoare, pînă în 20 și mai învățam încă pe atît în rest”, spune Cătălin. În plus, mai petrecea cîte șase ore pe săptămînă în sălile de lectură și în bibliotecile Institutului. În 2002 a terminat masterul și urma să dea și la studiile de doctorat, însă dosarul nu i-a fost admis. Spune că ar fi fost de vină și contextul acelor ani, cînd a fost recesiunea dot-com bubble. Dezvoltarea puternică a Internetului a dus la cotarea a numeroase companii IT pe bursă, însă creșterile investitorilor nu au venit atît de repede pe cît preconizau, iar multe au intrat în faliment: „Speculația mea este că, asta era în 2001 – 2002, fix după atacurile de la World Trade Center, atunci era și o recesiune, acel dot-com bubble, care a început în 2000 și a continuat pînă în 2004. Multă lume a dat la școală și numărul de dosare a fost mult mai mare decît de obicei și eu nu am fost atît de deștept pe cît credeam probabil și nu am fost primit”, spune Cătălin.
Autoironia i-o simți cînd vorbește despre el și adeseori îl auzi cum se descrie drept un tocilar. „Probabil cînd iei zece la toate materiile, nu poți susține altceva, și nu îmi plăceau toate materiile”, continuă el. Se descrie pe blogul său ca fiind un „mîndru tocilar al MIT-ului” și-ți aduce și argumente: își face gimnastica pe episoadele din „The Big Bang Theory” și „ieși să mănînci la un restaurant din cartier cu o revistă Scientific American. Și scrii un post pe blog despre asta”.
Fără să fi fost acceptat la doctorat, și-a căutat un loc de muncă și a început un internship la Google. Din 2002 a devenit inginer de software la marele motor de căutare. În același timp, site-ul creștea cu pași mici și cu multă reticență din partea celorlalți. „Nu o să îți iasă”, „de ce te implici în așa ceva?” sau „nimeni nu te va ajuta”, au fost printre primele reacții pe care le-a tot primit. La urma urmei, era un proiect pe care-l făcea din SUA, care era de folos în principal utilizatorilor din România, fără să aibă un ajutor din partea cuiva. A lăsat în spate părerile celorlalți, spunînd că „filosofia mea este că rețeta eșecului este să încerci să îi mulțumești pe toți”.
Limba română, în 200 de cuvinte
În 2001, cînd a pornit proiectul, dicționarul avea numai definițiile pe care le-a scris Cătălin. Deși era în SUA, el a atras numeroși voluntari care să-l ajute cu adăugarea cuvintelor. La un an au venit primii colaboratori, în februarie 2002, oamenii de la Federația Română de Scrabble și-au oferit ajutorul pentru a putea avea și ei la îndemînă, pe Internet, lista oficială a cuvintelor din limba română. Ei s-au dovedit a fi printre cei mai activi voluntari care au mărit dicționarul virtual.
Proiectul devenea popular și veneau din ce în ce mai mulți oameni interesați. În 2003 s-au mutat la adresa actuală și erau deja 20.000 de cuvinte, pentru ca în februarie 2004 să ajungă la 30.000. În noiembrie 2003 au lansat și „ghidul de exprimare corectă”, iar pe 1 august 2004 au terminat definițiile din DEX: au fost peste 65.000, iar următorul pas a fost acoperirea celorlalte dicționare existente. În 2006 erau peste 283.000 de definiții puse la dispoziția utilizatorilor. Toate aceste cuvinte au fost adăugate de voluntari, iar, pînă acum, sînt în jur de 200 de oameni care au reușit să ia cuvintele din maldărul de hîrtii și să le transforme în biți. „Mulți utilizatori vin și ne întreabă cum pot să ne ajute. Pe site, noi avem un ghid și le spunem că ne pot semnala greșelile de tipar și că pot contribui cu definiții. Alții au venit și ne-au scris o aplicație de iPhone, astfel că omul fie poate să își ia cuvîntul de pe Internet, în timp real, fie, dacă nu are conexiune, poate să își descarce un set de date”, mărturisește Cătălin.
În total, el a adăugat în jur de 2.000 de cuvinte, ceea ce înseamnă cam 50 de pagini din DEX, însă printre cei mai activi colaboratori se găsesc Laurențiu Bașchir și Laura Gellner, care au tastat cît patru-cinci Biblii, iar „o Bibilie are cam 3,5 milioane de litere”, continuă Cătălin. Pe site, cei doi apar în topul colaboratorilor, iar primul are 48.731 de definiții trimise, iar Laura Gellner are 66.251 pe care le-a scris din Germania, fără să se fi întîlnit vreodată cu Cătălin. În echipa lui se găsesc Radu Borza, Matei Gall sau Octavian Mocanu, care s-au ocupat de „dex flex”, programul prin care utilizatorii pot vedea declinările și conjugările verbelor. Ei se ocupă și de ceea ce ține de programare sau promovarea site-ului, iar în total sînt șapte oameni care-și ocupă timpul cu programarea, scrierea, corectarea sau găsirea definițiilor.
Facebook nu știe ce înseamnă „a partaja”
La început, el a apelat și la Academia Română, sperînd să primească definițiile în format digital, fără să mai fie nevoie de transcrierea mecanică. „Prima oară le-am scris înainte să mă apuc de proiect. Le-am zis ce vreau să fac și dacă nu vor să îmi dea DEX-ul. Ceea ce acum mi se pare complet naiv, nici eu nu le-aș fi dat unui străin”, amintește Cătălin. Nu a primit răspuns nici prima oară, nici după ce a început să adauge definiții, iar site-ul devenea din ce în ce mai popular. A vrut să facă din dexonline.ro un portal pentru Academie, punîndu-le la dispoziție bannere virtuale sau oferindu-le alte facilități, dar aceștia nu au mai cooperat deloc. Oricum, mărturisește el, le este recunoscător pentru că nu s-au împotrivit proiectului și nu a fost vreun conflict legat de drepturile de autor. În plus, firma Siveco a reușit să le ofere drepturile de publicare pentru cinci dicționare.
„Viteza de reacție a instituției e destul de mică pentru rapiditatea cu care se modifică uzul sau anumite cuvinte din limba română”, observă el. Edițiile revizuite apar la o perioadă destul de mare, iar aici el vine cu cazul în care Academiei i s-a cerut să precizeze sensul peiorativ al cuvintelor jidan și țigan. „Academia a dat acel discurs, în care își exprima recomandările și spunea că «o veți vedea în 2014, în următoarea ediție a dicționarului». Eu l-aș trimite la tipografie de mîine și aș scrie «ediția a doua revizuită și adăugită» sau «ediția 2.5», nu știu, dar s-a dus vremea cînd stăteai ca să aștepți trei ani de zile pentru rectificare”.
De aceea, mărturisește el, se bazează tot timpul pe acea masă de voluntari pe care o poate activa cînd are nevoie. Oricum, munca nu se va termina în viitorul apropiat, „limba este într-o continuă mișcare și datoria noastră este să consemnăm definiții, chiar și cu riscul de a greși și pe ici și pe colo”, iar pe ideea asta a introdus și argourile în dicționar, cu tot cu obscenitățile aderente. „Îmi spunea o mamă că a căutat «a se da uța», care are o conotație sexuală și așa este, dar soluția în nici un caz este să ne prefacem că nu există. Trebuie consemnat ca atare”, continuă Cătălin. Oricum, periodic, printre mesajele primite, numeroși utilizatori îi recomandă cîte o nouă definiție pentru cuvintele obscene care-s trecute pe site.
De asemenea, pe dexonline.ro se găsesc numeroase cuvinte care nu sînt recunoscute, în mod oficial, de vreo instituție – autoritate pentru limba română, acestea apărînd într-o perioadă scurtă de timp. Cătălin se folosește de Dicționarul Cuvintelor Recente al Floricăi Dimitrescu. „De 40-50 de ani încoace, ea își cumpără patru-cinci ziare pe care le citește, dar le citește, nu neapărat ca să se informeze, dar ca să caute și cuvinte neconsemnate încă. Ea este un lexicon ambulatoriu, își dă seama că acel cuvînt nu există și îl decupează din ziar, împreună cu sensul și le consemnează”, povestește el. Au venit și propuneri de a-l transforma și într-un dicționar enciclopedic, iar unii autori deja sînt prezenți. Însă el e conștient de faptul că „ar munci inutil pentru a publica efortul Wikipedia, care deja este deja mult mai bun decît ce am putea noi să facem”.
În prezent, site-ul are peste un milion de vizitatori pe lună, tot într-o lună sînt căutate șapte milioane de definiții și sînt afișate 20 de milioane de pagini cu informații. Iar, periodic, în orele de vîrf, serverul se supraîncălzește și pică, atunci, Cătălin recurge la filosofia Google: „decît să cumpărăm un super mega computer, luăm servere multe și ieftine și paralelizăm munca”. În plus, întreținerea unui server scump l-ar costa foarte mult, iar acum sînt găzduiți pe gratis de ELVsoft.
De un an și jumătate, dexonline.ro are o nouă interfață, iar din aprilie 2011 a pus și „cuvîntul zilei”, una dintre cele mai cerute rubrici. Cuvintele care apar sînt selectate dintr-o listă făcută de voluntari, iar dacă ar avea ocazia, Cătălin ar pune un cuvînt calchiat, „ar fi ceva de genul «aplicație», «a partaja», sau «expertiză»”.
E aproape ras în cap și se încruntă mai degrabă în semn de bucurie. I se măresc pupilele ochilor și-ți spune cu bucurie că: „trecerea spre digital este fascinantă”. Ar vrea ca dexonline.ro să devină un punct de referință atunci cînd un utilizator are o nelămurire legată de limba română sau de un cuvînt anume. Își dă seama că cititul se împarte, încet, între răsfoitul unei cărți și plimbatul degetului pe o tabletă, însă „teoria mea este că inteligența unui copil și dorința lui de a se informa este influențată de cît de multe cărți vede la el în casă. De exemplu, la mine aveam bibliotecile pline, îi vedeam pe ai mei citind seara la veioză. În clipa în care singurele tale cărți vor fi de fapt un ebook cu sute de cărți pe el, mie mi-e un pic teamă de impactul asupra copiilor”.
„Sînt aproape obligat moral să intru pe DEX”
În această toamnă vrea să mai aducă un programator. Site-ul este din ce în ce mai solicitat, iar periodic se blochează cînd traficul este foarte mare. Nu-și mai dedică cîte 20 de ore pe săptămînă, cum făcea în 2007 și a creat o firmă în jurul site-ului, pentru a putea contabiliza cîștigurile care vor veni. Speră că va putea să-și plătească și cîțiva dintre voluntarii care au scris definițiile pentru site. În același timp, a început un alt proiect. Civvic.ro va fi un portal unde se va găsi tot materialul legislativ al României, acolo vor fi postate legile, ordonanțele de urgență sau decretele, iar în acest moment lucrează la publicarea Monitoarelor Oficiale vechi. Iar dintr-o pasiune personală, a lansat și un site pentru anti-șah (în 2001), un joc de șah unde participanții trebuie să scape cît mai repede de piesele de pe tablă. „Acolo captura este obligatorie și regele e o piesă obișnuită, se poate lua ca orice piesă, iar cine își dă primul piesele, cîștigă jocul”, povestește Cătălin. Pe nici unul dintre aceste proiecte nu primește vreun ban, însă, într-un final „cînd ai o idee bună și tu știi că va fi folositoare, utilă lumii, implementează și vei găsi și o modalitate să o monetizezi”.
În ieșirile în oraș, cu prietenii, discuțiile se poartă între paharele de vin și formele corecte ale cuvintelor. Cicălindu-l, prietenii îl întreabă „hai măi, știi tu unde să verificăm și noi o definiție?” și, rîzînd, Cătălin spune că „sînt aproape obligat moral să intru pe DEX”.
***
E duminică, 23 octombrie, pe dexonline.ro cuvîntul zilei e „liminar”. Vine din francezul liminaire și înseamnă inițial, introductiv. E introdus de Laura Gellner și e doar una dintre cele 66.439 definiții pe care le-a scris. Nu l-aș fi căutat în dicționar și nici nu aș fi deschis vreunul în caz că m-aș fi întîlnit cu acest cuvînt. Dacă voiați să verificați, „a se da uța” înseamnă de fapt „a avea contact sexual”, ca să nu rămînă nici o curiozitate.
Cătălin Frâncu se dedică acum numai proiectelor de voluntariat pe care le are, n-ar mai vrea să fie prins, opt ore, în biroul de serviciu, iar de DEX nu s-ar rupe decît dacă ar fi o idee „fascinantă, deși nu m-ar lăsa inima”. Pînă atunci, DEX-ul este copilul lui, asta pînă cînd va fi suficient de matur să aibă copii reali, așa mărturisește pe site-ul lui. În rest, e un tocilar modest și e mîndru de asta.
***
Angajatul cu numărul 500
Nu a intrat la doctorat, însă a fost acceptat la un stagiu de practică la Google, iar apoi, din 2002, a devenit angajatul cu numărul 500. „Totul răul spre bine”, trage el linie, iar acolo a stat pînă în 2006, unde a lucrat ca inginer software. Era prima lui slujbă și a fost o experiență extraordinară. Fiecare avea libertatea să vină pînă și cu copilul sau animalul de companie – bine, să fie prezent la ședințe – dar „de vreme ce muncim toți la ideea asta care nouă ni se pare că e genială și că va revoluționa lumea, orice este permis”. Iar Cătălin a muncit, printre altele, la un proiect, care presupunea crearea unui alt motor de căutare intern pentru inginerii Google, care se numea SiteInfo. „Eu am făcut un acest motor prin care inginerii care lucrau la Google să poată căuta rapid un url, o adresă, ca să vadă în ce stare este acea pagină”, povestește el.
O vară a lucrat lîngă biroul fondatorilor Larry Page și Sergey Brin. Echipa lui lucra la un proiect care presupunea crearea unei baze de date cu angajații companiei, unde să se găsească proiectele și stadiile în care se aflau aceștia. Era un soi de inventar al resurselor din companie. „Ei aveau un war room, cameră de război, iar echipa care lucra la acel proiect era mutată mai aproape de ei și ei dădeau buzna din cînd în cînd să vadă cum merge”, era un alt fel de a se motiva, spune Cătălin. I-a plăcut foarte mult și motoul intern promovat între angajați, „don’t be evil”. Trebuiau să dea tot ce era mai bun din ei, nu erau adepții „cîrpelilor”, iar produsul în sine trebuia să îmbunătăteșească viața la cît mai mulți oameni.
„Insistau pe anumite deprinderi”, iar, într-un final, acestea făceau parte din mecanismului angajatului. Cătălin își însușea toate practicile care-l atrăgeau. La trei ani de cînd s-a întors din America, pe unele dintre ele le păstrează și acum. „Ei trăiesc într-o relaxare pe care nu am întîlnit-o la noi” continuă el.
Visul american înlocuit cu visul de inginer
Însă România a rămas „acasă”. „E greu de pus degetul. Noi ne-am decis să venim în România prin 2005, dar am amânat din diverse motive. Eu țin foarte mult legătura cu România, iar în vacanțe, în loc să vedem alte locuri, noi veneam aici și atunci am fost sinceri cu noi. Am zis că ne place în România și că preferăm să locuim în România și să mergem în America, invers”, mărturisește Cătălin. Dacă voiau, atît el cît și soția lui, să obțină cetățenia, ar fi primit-o, după un lung proces, abia în 2012. Era prea mult, recunoaște el.
El nu s-a gîndit niciodată că va rămîne definitiv în SUA, iar proiectul DEX a fost, își dă seama, și o formă de manifestare a patriotismului. Cît a stat acolo, purta discuții cu prietenii despre formele corecte ale cuvintelor, se întîlneau periodic la grătar, preferînd mîncărurile cu gust de România. „E ciudat, cînd ajungi acolo începi să faci lucruri de patriotism pe care aici nu le faci, ți se par desuete, iar acolo e altceva”.
George GURESCU
Adaugă un comentariu