Lematización de Euskera y Catalán basado en Snowball de Porter

Que los ordenadores entiendan lo que decimos parece sencillo, pero en tan complejo como entenderse entre humanos.
El procesamiento del lenguaje natural es uno de los retos más interesantes y complejos, para ello contamos con herramientas y estrategias que nos facilitan el procesamiento del lenguaje.
Una de esas herramientas es el lenguaje snowball, un lenguaje diseñado por Martin Porter, para poder hacer lematizadores que basándose en un conjunto de algoritmos permita encontrar las raíces de las palabras y por extensión todas sus variantes morfológicas (de genero, número, etc.).
La nota de hoy es para anunciar que, en colaboración con Martin Porter, he liberado las versiones en catalán y euskera de los algoritmos de lematización basados en snowball. Estos algoritmos han demostrado su nivel de calidad y eficiencia, en varios proyectos.

Comentarios

Entradas populares de este blog

Cross Compiling Freeling

Como intentan robar las mafias utilizando AutoScout24

4 Errores muy comunes de las webs y su estrategia "mobile"