Class WDM
java.lang.Object
it.unisa.diem.wordageddon_g16.models.WDM
La classe WDM (Word Document Matrix) rappresenta l'associazione tra un documento
e la mappa delle frequenze delle parole significative in esso contenute.
Permette di analizzare un documento escludendo le stopword, costruendo così una struttura utile
per analisi lessicali e generazione di domande basate sui contenuti testuali.
-
Field Summary
Fields -
Constructor Summary
Constructors -
Method Summary
-
Field Details
-
document
Il documento analizzato. -
words
-
-
Constructor Details
-
WDM
Costruisce un oggetto WDM associando direttamente una mappa di frequenze a un documento. Questo costruttore è utile quando l'analisi è già stata eseguita e le frequenze sono note.- Parameters:
document
- il documento di riferimentowords
- la mappa delle parole e delle loro frequenze
-
WDM
Costruisce un oggetto WDM eseguendo l'analisi del contenuto testuale di un documento. Vengono escluse le parole presenti nella lista di stopword. Il contenuto viene letto dal file associato al documento tramite la classeResources
.- Parameters:
doc
- il documento da analizzarestopWords
- l'insieme delle parole da ignorare durante l'analisi- Throws:
RuntimeException
- se si verifica un errore durante la lettura del contenuto del documento
-
-
Method Details
-
getWords
-
getDocument
Restituisce il documento associato a questa analisi.- Returns:
- il documento analizzato
-