Information Extraction
Una buena práctica al finalizar y entregar un proyecto es revisar lo aprendido. Preguntarse qué podría facilitar el abordaje de nuevas tareas similares. Information Extraction surge de esa manera.
Softwares existentes en el area del Procesamiento del Lenguaje Natural (NLP) como Spacy permiten el reconocimiento de entidades y la clasificación de textos. Otras herramientas como Doccano facilitan (hasta cierto punto) el etiquetado de los textos. Pero quedan varios aspectos sin trabajar. Los resultados obtenidos por estas herramientas y otros posibles features que se consideren adecuados pueden ser la puerta a realizar conexiones más profundas y mejorar la extracción de información. Esas conexiones se realizan en muchos casos “software adentro”.
Cada proyecto que aborda estas problemáticas (como fue nuestro caso) hace lo necesario para incorporar dentro de su software nuevas ideas, orientadas a la resolución de un problema concreto.
Information Extraction representa un sólido framework de NLP capaz de relacionar las partes que intervienen y proveer interfaces claras para conectar modelos. Cuenta con herramientas de visualización de resultados y métricas globables personalizadas.