Analizadores morfológicos aplicados al lenguaje natural, aplicaciones para búsqueda de información

Submitted by gwolf on Mon, 02/04/2008 - 04:43.
Written in...: 
2005

Almost everybody has faced the need to store a large amount of human-generated information (specifically, extense texts) and later ease the need to search on it. There are many techniques we can use, but we often miss the most powerful ones.
Human spoken or written language is known as natural language. In this talk I present some techniques that allow us to process it to make it easier and simpler its analysis, and make more efficient searching on it, specially based on the Snowball project and its application to databases through PostgreSQL's TSearch2 module.

Resumen: 

Casi todos nosotros nos hemos topado con la necesidad de almacenar una gran cantidad de información generada por humanos (me refiero principalmente a textos extensos) y facilitar posteriormente la búsqueda sobre de ella. Hay muchas técnicas a las que podemos recurrir - pero no siempre acudimos al lugar correcto para buscarla.
El lenguaje hablado o escrito por un ser humano se conoce como lenguaje natural. En esta plática presentaré algunas técnicas que nos permiten procesarlo para hacer más simple y efectivo su análisis y más eficaces las búsquedas sobre de él, específicamente basándome en el proyecto Snowball y su aplicación a las bases de datos a través del módulo TSearch2 de PostgreSQL.

Post new comment

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <br> <b> <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <blockquote> <img> <h1> <h2> <h3> <tt> <pre> <strike>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. Beside the tag style "<foo>" it is also possible to use "[foo]".

More information about formatting options

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
  _   _   _____   _____   ____    _   _   _ 
| | | | |_ _| |_ _| | _ \ | \ | | / |
| | | | | | | | | | | | | \| | | |
| |_| | | | | | | |_| | | |\ | | |
\___/ |_| |_| |____/ |_| \_| |_|
Enter the code depicted in ASCII art style.