català español english
 
Inici Qui som? Línies de recerca Tesis Publicacions Projectes Recursos Descàrregues Intranet Mapa
 
   

    Corpus

    Eines per a la correcció i la traducció

    Gramàtiques

    Recursos lèxics i semàntics

    • Bases de dades verbals amb informació sintàctico-semàntica
      En aquestes bases de dades es descriuen les diverses construccions en què pot aparèixer un mateix verb.

    • Xarxes semàntiques
      S´ha treballat en les actualitzacions del WordNet de l´espanyol i el català. Les actuacions sobre aquestes xarxes semàntiques han estat diverses i estan integrades en el Multilingual Central Repository (MCR). El MCR inclou, a més, les versions de l´anglès, l´euskera i el gallec i ha estat construït conjuntament amb els grups TALP, IXA, IULA i U.de Vigo. 

    • Altres

      • Diccionari Català-Alemany  
        Aquest diccionari ha estat creat pel Dr. Jaume Tió. Els tipus de consulta van des de mots i locucions fins a paradigmes de flexió, anàlisis sintàctiques i fragments finals i inicials de locucions o entrades canòniques.

      • Diccionari de Marcadors del discurs prototípics  
        Aquest és un lèxic de marcadors del discurs utilitzat en la tesi de Laura Alonso: Representing discourse for automatic text summarization via shallow NLP techniques. Els marcadors discursius inclosos aquí són la font principal per a dibuixar mapes semàntics amb la finalitat d´obtenir un inventari de significats discursius bàsics. Aquest lèxic és també la base per a la implementació d´un segmantardor discursiu i per a l´anàlisi del discurs explotats pel resumidor d´e-mails Carpanta. El lèxic és paral·lel en tres idiomes: català, espanyol i Anglès. Per tant, en aquesta versió només hem inclòs els marcadors discursius que tenen un quasisinònim en una de les altres llengües. Els marcadors que no tenen un sinònim s´han inclòs en la versió ampliada del lèxic creat per tècniques de bootstrapping aplicades a partir d´aquest lèxic. El lèxic està format per 84 marcadors discursius, en representació dels diferents significats discursius. Alguns marcadors discursius s´han assignat a més d´un significat per dimensió, perquè són ambigus o no especificats.

      • Diccionari trilingüe de perífrasis verbals: espanyol-->romanès/català  
        Aquesta eina s´ha creat a partir dels resultats de la tesi realitzada per Mihaela Topor. Es tracta de la descripció de 44 complexos verbals de l´espanyol que han estat considerats perífrasis verbals incloent-hi la traducció al romanès i al català. Entre les 44 perífrasis s´han establert diferents graus de gramaticalització. Cada complex verbal està descrit semànticament amb una definició i amb l´adscripció a un dels dos grups possibles (aspectual o modal). A més, també s´especifiquen la subclasse semàntica i, si és possible, altres perífrasis equivalents (sinònimes o quasi-sinònimes). La descripció conté també restriccions d´ús de diferents tipus: accional, temporal, recursivitat i tipus semàntic del subjecte. L´usuari pot consultar un conjunt d´exemples d´ús extrets de corpus i referències bibliogràfiques específiques per a cada perífrasi.
        + informació

      • Terminology Extraction Suite  
        El programa Terminology Extraction Suite és una aplicació d´extracció automàtica de terminologia. L´objectiu d´aquesta eina és proporcionar una utilitat d´extracció de terminologia eficaç i fàcil de fer servir. El programa està escrit en Perl. Amb el codi Perl es pot executar l´aplicació sota Linux, Windows i Mac. El programa fa servir una metodologia estadística d´extracció automàtica de terminologia i permet tant extreure candidats a terme en una llengua com cercar automàticament els seus equivalents de traducció en un corpus paral·lel.

   
 
Darrera actualització: 14/11/2017