català español english
 
Inici Qui som? Línies de recerca Tesis Publicacions Projectes Recursos Descàrregues Intranet Mapa
 
   

    Corpus

    Eines per a la correcciķ i la traducciķ

    Gramātiques

    • Desambiguaciķ automātica de construccions  
      Aquest sistema és un recurs dissenyat per desambiguar formalment frases pronominals ambigües i proposa la interpretació semàntica més plausible (passiva, anticausativa, reflexiva, etc.)

    • Esquemes de subcategoritzaciķ verbals (Espanyol-Catalā)  
      En aquest recurs es poden consultar els llistats d´esquemes de subcategorització general per a la llengua espanyola i catalana extrets dels corpus SenSem respectius. En visualitzar els resultats s´indica la freqüència de l´esquema segons la font utilitzada i la distribució segons textos periodístics o literaris. Els esquemes contenen, per defecte, les categories sintagmàtiques, però l´usuari pot demanar  també la visualització de les funcions sintàctiques i/o semàntiques que hi estan associades, amb les freqüències respectives de cada un d´aquests subesquemes. Per últim, es pot accedir des del patró esquematitzat al llistat d´oracions del corpus que s´hi corresponen.
      Aquest recurs es pot descarregar a "Descàrregues".

    • Gramātica HPSG de l´espanyol   
      La Spanish Resource Grammar (SRG) és una gramàtica de codi obert de gran cobertura per a l´espanyol. Està basada en el marc teòrio de HPSG i utilitza Minimal Recursion Semantics (MRS) per a la representació semàntica. La SRG està implementada en el sistema Linguistic Knowledge Builder (LKB), a partir dels components bàsics de la gramàtica Matrix del projecte LinGO.

    • Gramātiques de dependčncies del catalā , espanyol i anglčs  
      EnTxala, EsTxala i CaTxala són gramàtiques de dependències de codi  obert implementades a l´entorn FreeLing, una llibreria d´eines de Processamient del Llenguatge Natural. Aquestes gramàtiques s´han dissenyat com un recurs per a les aplicacions de PLN que requereixen una representació sintàctica profunda i robusta en l´anàlisi automàtic del llenguatge natural. Es tracta de tres gramàtiques d´àmplia cobertura lingüística que proporcionen un únic arbre de dependencies per cada oració d´entrada, per mitjà de l´especificació de les ramificacions de qualsevol estructura sintàctica i l´assignació de funcions sintàctiques a cada arc de l´arbre. Aquests dos processos es duen a terme a través d´un conjunt de regles escrites a mà i basades en coneixement lingüístic (2.954 regles a EnTxala, 4.447 regles a EsTxala i 3.011 regles a CaTxala).

    • ParTes: Test suite per a l`avaluaciķ d`analitzadors sintāctics  ParTes és el primer test suite en català i castellà per a l`avaluació qualitativa d`analitzadors sintàctics. Aquest recurs és una jerarquia de fenòmens representatius en relació amb l`estructura sintàctica i l`ordre d`arguments. ParTes proposa una simplificació de l`avaluació qualitativa per mitjà de l`automatització de les tasques d`avaluació. La versió actual es distribueix amb el mòdul de test suite, en el qual es classifiquen els fenòmens sobre l`estructura sintàctica i els esquemes d`ordre argumental, i el mòdul de dades de test, en el qual estan disponibles la versió en text pla de les dades i la versió anotada en dependències sintàctiques de les dades.

    • Representaciķ semāntica de preguntes (ReSim)  
      ReSim és un motor que, donada una oració interrogativa, proposa una representació semàntica d´aquesta. La representació es basa en les estructures lèxico-conceptuals de Jackendoff 1990. Aquest sistema s´ha desenvolupat per a un domini restringit.

    Recursos lčxics i semāntics

   
 
Darrera actualització: 28/04/2017