Class WDM

java.lang.Object
it.unisa.diem.wordageddon_g16.models.WDM

public class WDM extends Object
La classe WDM (Word Document Matrix) rappresenta l'associazione tra un documento e la mappa delle frequenze delle parole significative in esso contenute. Permette di analizzare un documento escludendo le stopword, costruendo così una struttura utile per analisi lessicali e generazione di domande basate sui contenuti testuali.
  • Field Details

    • document

      private final Document document
      Il documento analizzato.
    • words

      private final Map<String,Integer> words
      Mappa delle parole significative e delle rispettive frequenze nel documento. La chiave è la parola, il valore è il numero di occorrenze.
  • Constructor Details

    • WDM

      public WDM(Document document, Map<String,Integer> words)
      Costruisce un oggetto WDM associando direttamente una mappa di frequenze a un documento. Questo costruttore è utile quando l'analisi è già stata eseguita e le frequenze sono note.
      Parameters:
      document - il documento di riferimento
      words - la mappa delle parole e delle loro frequenze
    • WDM

      public WDM(Document doc, Set<String> stopWords)
      Costruisce un oggetto WDM eseguendo l'analisi del contenuto testuale di un documento. Vengono escluse le parole presenti nella lista di stopword. Il contenuto viene letto dal file associato al documento tramite la classe Resources.
      Parameters:
      doc - il documento da analizzare
      stopWords - l'insieme delle parole da ignorare durante l'analisi
      Throws:
      RuntimeException - se si verifica un errore durante la lettura del contenuto del documento
  • Method Details

    • getWords

      public Map<String,Integer> getWords()
      Restituisce la mappa delle parole significative e delle loro frequenze.
      Returns:
      la mappa parola, frequenza
    • getDocument

      public Document getDocument()
      Restituisce il documento associato a questa analisi.
      Returns:
      il documento analizzato