català español english
 
Inici Qui som? Línies de recerca Tesis Publicacions Projectes Recursos Descàrregues Intranet Mapa
 
   

  Corpus

  Eines per a la correcció i la traducció

  Gramàtiques

  Recursos lèxics i semàntics

  • Bases de dades verbals amb informació sintàctico-semàntica
   En aquestes bases de dades es descriuen les diverses construccions en què pot aparèixer un mateix verb.

   • SenSem Espanyol  
    En aquesta base de dades lèxica es descriuen els 250 verbs més freqüents de l´espanyol des del punt de vista sintàctic i semàntic a partir de la informació extreta d´un corpus periodístic de més de 700.000 mots i d´un de literari de menors dimensions complementari. Cada lema està organitzat en sentits i s´indica la representació de cadascun d´aquests sentits en el corpus. Per a cada sentit s´indiquen les propietats semàntiques bàsiques, com l´Aktionsart, els rols semàntics, el synset corresponent d´EuroWordNet i les frases del corpus associades. Les frases es presenten organitzades segons els diferents patrons sintàctics que representen i de cada patró s´indica la freqüència.
    + informació

   • Volem Espanyol  
    Per a la construcció d’aquest recurs s’ha partit del diccionari espanyol inclòs en el diccionari multilingüe VOLEM. Aquest nou lèxic inclou més entrades, així com més nombre de construccions.

   • Volem Multilingüe  
    Aquest diccionari és un recurs verbal multilingüe (espanyol-català-francès-basc). Per a cada verb s’especifiquen els esquemes de subcategorització i la semàntica associada a aquests esquemes, a més dels rols semàntics i exemples d’ús.

   • SenSem Català  
    En aquesta base de dades lèxica es descriuen uns 250 verbs del català des del punt de vista sintàctic i semàntic a partir de la informació extreta d´un corpus periodístic de més de 700.000 mots. Cada lema està organitzat en sentits i s´indica la representació de cadascun d´aquests sentits en el corpus. Per a cada sentit s´indiquen les propietats semàntiques bàsiques, com l´Aktionsart, els rols semàntics, el synset corresponent d´EuroWordNet i les frases del corpus associades. Les frases es presenten organitzades segons els diferents patrons sintàctics que representen i de cada patró s´indica la freqüència.
    + informació

  • Xarxes semàntiques
   S´ha treballat en les actualitzacions del WordNet de l´espanyol i el català. Les actuacions sobre aquestes xarxes semàntiques han estat diverses i estan integrades en el Multilingual Central Repository (MCR). El MCR inclou, a més, les versions de l´anglès, l´euskera i el gallec i ha estat construït conjuntament amb els grups TALP, IXA, IULA i U.de Vigo. 

  • Altres

   
 
Darrera actualització: 12/06/2018