classifier
Class Classifier

java.lang.Object
  |
  +--classifier.Classifier

public class Classifier
extends java.lang.Object

Algoritmo di catalogazione. Utilizza le classi TabellaCategorie per creare la tabella dei termini, la matrice delle categorie. Legge inoltre il file contenente gli intorni dei termini e costruisce la tabella degli intorni TI. Espone metodi per la classificazione di un Contesto e di una frase (String).


Constructor Summary
Classifier()
          Creates a Classifier.
 
Method Summary
 MatriceCategorie analyze(Contesto context)
          Classifies the text of a context.
 MatriceCategorie analyze(java.lang.String s, float fattoreMoltiplicativo, java.util.Vector keyPhrases)
          Analyzes text.
 void analyze(java.util.Vector phrase, MatriceCategorie MC, float fattoreMoltiplicativo, Language language, java.lang.String np, java.util.Vector keyPhrases, java.util.Vector tags, int startTag)
          Analyzes a noun phrase.
 void classificaPagina(Contesto root, UrlInfo urlInfo, Site site, Transazione transazione)
          Classifica gli URLs presenti nel contesto (di una pagina).
Gli URLs interni al sito sono aggiunti alla lista degli URLs da visitare.
 void classify(Contesto root, Site site, Transazione transazione, java.net.URL baseUrl, UrlInfo urlInfo)
          recursively visit a context and classifies URL present in it.
 void classifyURLs(Contesto context, Site site, Transazione transazione, java.net.URL baseURL, java.lang.String fromURL, float[] history)
           
 TabellaCategorie getTabellaCategorie()
           
static void main(java.lang.String[] args)
          Classifies a sentence supplied in the command line.
 void storeURL(Transazione transazione, Site site, java.lang.String url, float[] degree, java.lang.String anchor, Contesto context, java.lang.String fromURL)
          Store URL data either among internal or external pages.
 
Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

Constructor Detail

Classifier

public Classifier()
Creates a Classifier. This object implements the classification algorithm.
Method Detail

getTabellaCategorie

public TabellaCategorie getTabellaCategorie()
Returns:
la tabella delle categorie.

classificaPagina

public void classificaPagina(Contesto root,
                             UrlInfo urlInfo,
                             Site site,
                             Transazione transazione)
Classifica gli URLs presenti nel contesto (di una pagina).
Gli URLs interni al sito sono aggiunti alla lista degli URLs da visitare.

Parameters:
root - is the root contest for the page to be analyzed
See Also:
Parser

classify

public void classify(Contesto root,
                     Site site,
                     Transazione transazione,
                     java.net.URL baseUrl,
                     UrlInfo urlInfo)
recursively visit a context and classifies URL present in it.

classifyURLs

public void classifyURLs(Contesto context,
                         Site site,
                         Transazione transazione,
                         java.net.URL baseURL,
                         java.lang.String fromURL,
                         float[] history)

storeURL

public void storeURL(Transazione transazione,
                     Site site,
                     java.lang.String url,
                     float[] degree,
                     java.lang.String anchor,
                     Contesto context,
                     java.lang.String fromURL)
Store URL data either among internal or external pages.

analyze

public MatriceCategorie analyze(Contesto context)
Classifies the text of a context.
Returns:
MatriceCategorie contenente i risultati della catalogazione. Side-effect: context.keyPhrases is filled with pairs of phrases and respective vectors of matching categories

analyze

public MatriceCategorie analyze(java.lang.String s,
                                float fattoreMoltiplicativo,
                                java.util.Vector keyPhrases)
Analyzes text.
Parameters:
s, - the text to analyze.
keyPhrases, - output Vector filled with pairs of
Returns:
MatriceCategorie contenente i risultati della catalogazione.

analyze

public void analyze(java.util.Vector phrase,
                    MatriceCategorie MC,
                    float fattoreMoltiplicativo,
                    Language language,
                    java.lang.String np,
                    java.util.Vector keyPhrases,
                    java.util.Vector tags,
                    int startTag)
Analyzes a noun phrase. At most sequences of max words are considered. If a match is found with the sequence of words or one of its variants, the matrix of categories is updated. startTag is the index within tags of the first word in the phrase. tag0, tag1, tag2, tag3, ..., tagn start = 1 phr0, phr2

main

public static void main(java.lang.String[] args)
Classifies a sentence supplied in the command line.