Apache UIMA (dall'inglese Unstructured Information Management Architecture) è un framework, sviluppato nei linguaggi di programmazione Java e C , per il trattamento e l'analisi di informazioni semi-strutturate, e l'estrazione di informazioni da esse.

Fa parte dei software sviluppati dalla Apache Software Foundation.

UIMA definisce un'interfaccia per le varie componenti di analisi (Analysis Engine) che lo sviluppatore può implementare (ad esempio, conversione di file binario in testo, annotazione di concetti o di nomi propri, conversione in formato XML...).

In sintesi, una volta definiti dei descriptors (file in formato XML) per i diversi componenti (che indicano tra l'altro i dati in entrata ed in uscita) ed un descriptor che definisce la pipeline completa (sequenza ordinata di trattamenti ad effettuare), tramite una semplice API è possibile lanciare il trattamento dei dati.

Note

Altri progetti

  • Wikimedia Commons contiene immagini o altri file su Apache UIMA

Collegamenti esterni

  • Sito ufficiale, su uima.apache.org.
  • Repository sorgenti di Apache UIMA, su svn.apache.org.
  • Sito di segnalazione bug, su issues.apache.org.
  • (EN) Apache UIMA, su Free Software Directory.

Apache UIMA Introduction

Uima on Behance

Apache UIMA Getting Started Writing My First Apache UIMA Annotator

Apache UIMA Introduction

Apache UIMA Apache UIMA