La IA, salvavides per a les llengües minoritàries?
Conversa amb la directiva de Google i experta en llenguatge computacional Pilar Manchón
Pilar Manchón (Sevilla, 1972) és filòloga i informàtica, i actualment és la directora d'estratègia d'investigació en intel·ligència artificial de Google des del 2019. Va aterrar a Silicon Valley fa dotze anys i, des d'aleshores, la seva carrera en el món de la lingüística computacional no ha fet més que créixer. Va venir a Barcelona al març de la mà de la Mobile World Capital com a conferenciant al Talent Arena, el congrés paral·lel al Mobile que es va celebrar a Montjuïc. La carrera de Manchón no ha estat lineal, i en una conversa amb l'Empreses explica com va arribar fins on és ara i què pot aportar el món de la IA en el llenguatge.
"Quan vaig entrar a la universitat, vaig entrar a físiques, però vaig tenir un accident esportiu i em vaig quedar fora d'òrbita", relata. Per a Manchón, aquest accident va suposar un abans i un després i va decidir marxar a Anglaterra a estudiar anglès. "Sempre m'havien agradat els idiomes, i aleshores vaig decidir que no faria física, faria filologia". Quan va arribar a l'últim curs, se'n va anar a Gant (Bèlgica) amb una beca a fer traducció i interpretació. "Allà vaig començar a veure tecnologies del llenguatge que em van semblar molt interessants, i vaig començar a descobrir una eina molt rudimentària que existia en aquella època amb la qual els traductors i intèrprets podien treballar parcialment amb tecnologia", explica.
"Vaig començar a estirar el fil, a informar-me, i em vaig posar a estudiar lingüística computacional i, al final, vaig acabar demanant una beca per fer un màster en ciència cognitiva i llenguatge natural a la Universitat d'Edimburg, on vaig aprendre a programar", relata Manchón. "La meva tesi de màster va ser sobre les tecnologies del llenguatge, bàsicament sobre com fer que la síntesi de veu fos molt més natural. I després em vaig ficar en un doctorat europeu, on la meva tesi doctoral va ser sobre la intel·ligència en sistemes de diàleg multimodals", detalla l'experta. En acabat, a través d'una beca Fulbright va anar a la Universitat de Stanford. Quan va acabar, va tornar a Sevilla a acabar el doctorat, i es va adonar que la tecnologia en la qual estaven treballant en el seu grup de recerca de la tesi doctoral era "molt superior" a les que havia utilitzat a Amèrica.
Davant d'això, Manchón i el seu professor de tesi van acabar tirant endavant una empresa amb aquesta tecnologia. "Deu anys després vam aconseguir portar-la a escala internacional, i competir amb altres empreses del sector. Tot va culminar quan vam conèixer Intel; els vam agradar molt, tant que van voler invertir en nosaltres. En aquell moment feia pocs anys que havia sortit Siri (l'assistent de veu d'Apple). Llavors, Intel estava a punt de llançar el seu propi telèfon i volien que tingués la seva pròpia Siri, i van decidir comprar la nostra empresa amb l'objectiu de convertir-la en la Siri d'Intel", explica. Finalment, però, Intel no va llançar el seu telèfon, però aquesta és la història de com els van adquirir, i de com Manchón va acabar a Silicon Valley. D'això ja fa 12 anys. "Vaig treballar diversos anys per a Intel, després per a Amazon. Més tard vaig estar un any i escaig amb Roku, una empresa d'estríming i de dispositius de televisió. I ara fa ja cinc anys i mig que estic amb Google".
Confiança en la màquina
A Google, Manchón es dedica principalment a la recerca aplicada en el camp del llenguatge computacional, que serveix, sobretot, per generar confiança en la màquina. "Jo soc experta en comunicació amb una màquina, i sempre he estat molt interessada en tots els temes que tenen a veure amb la confiança. Com desenvolupem confiança? Des d'un punt de vista cognitiu, amb entitats intel·ligents que ens poden parlar. Jo m'he dedicat a desenvolupar projectes en els quals hem vist com evoluciona la confiança entre una persona humana i una entitat intel·ligent i quins són els punts clau en aquesta recerca", explica Manchón. Això es trasllada a construir interfícies de veu, interfícies més naturals, amb diferents àrees de producte dins de Google. "També hem entrat en temes d'optimització en els processos d'incidència en els grans models. En traducció, per exemple, s'estan fent coses amb intel·ligència artificial generativa. I, en els últims temps, més temes de factualitat, que és assegurar-te que els models diguin la veritat, o també alineament amb valors humans", apunta.
La IA per a les llengües minoritàries
Com a experta en lingüística computacional, Manchón defensa que la IA pot ser un gran salvavides per a les llengües minoritàries. "Un dels grans avantatges d'aquestes tecnologies és que una vegada tens un model preentrenat per traduir, per exemple, d'un idioma a un altre, tens una base molt forta perquè amb molt poquetes dades el model aprengui un altre idioma", explica. "Hi ha alguns idiomes dels quals tenim molts recursos, com l'anglès, l'espanyol o el xinès. Però hi ha molts altres idiomes al món, uns 7.000, i molts d'ells tenen molt pocs recursos si els compares amb els idiomes majoritaris. L'avantatge que t'ofereix aquest tipus de tecnologia és que amb pocs recursos pots aconseguir un grau molt alt de sofisticació, que abans no podies aconseguir perquè necessitaves més recursos dels que existeixen en aquell idioma. I ara, precisament amb aquestes tècniques, amb un model preentrenat, pots utilitzar aquests pocs recursos per tenir un grau de rendiment molt alt. A Google ja ho hem fet amb fins a 1.000 idiomes", apunta l'experta.
El català ha estat un dels idiomes més reivindicats pels usuaris en agents de veu, com l'Alexa d'Amazon, i encara no hi ha data perquè l'Alexa parli català. Segons Manchón, això és un tema de necessitats del mercat: "Des del punt de vista de Google, el que fem és fer tots els idiomes que podem el més ràpid possible, però també d'acord amb unes prioritats de mercat i producte. Jo entenc que l'Alexa deu fer una cosa semblant", diu. "Quan et toca de prop perquè és el teu idioma o és la teva llengua, per a tu és prioritari, però des del punt de vista d'un mercat global, potser no", apunta. "Hi ha moltes solucions per a aquesta mena de coses. Hi ha molts recursos gratuïts. Hi ha molts models de lliure distribució. Si hi ha molt d'interès en un idioma, qualsevol, en el món acadèmic, qualsevol universitat, qualsevol investigador, qualsevol entitat pública, pot desenvolupar el seu propi model i generar l'idioma que sigui, si vol", rebat.