You are here: Home -  Felpe Hollister Bambino Un grave problema di testo categorizzazione

Felpe Hollister Bambino Un grave problema di testo categorizzazione

Felpe Hollister Bambino

Categorizzazione testo è ampiamente utilizzata nella organizzazione di documenti in forma digitale. A causa del numero crescente di documenti in forma digitale, la categorizzazione automatica di testo è diventato più promettenti negli ultimi dieci anni. Un grave problema di testo categorizzazione è il suo gran numero di caratteristiche. La maggior parte di questi sono rumore irrilevanti che possono indurre in errore il classificatore. Pertanto, la selezione funzione viene spesso utilizzata nel testo categorizzazione per ridurre la dimensionalità dello spazio delle caratteristiche e per migliorare le prestazioni. In questo studio, viene utilizzata la selezione delle funzioni a due stadi ed estrazione di caratteristiche per migliorare le prestazioni del testo di categorizzazione. Nella prima Felpe Hollister Bambino fase, ogni termine all'interno del documento è classificato a seconda della loro importanza per la classificazione secondo il metodo di guadagno di informazioni (IG). Nella seconda fase, algoritmi genetici (GA) e analisi delle componenti principali (PCA), funzioni varie ed estrazione delle caratteristiche metodi sono applicati separatamente per i termini che sono elencati in ordine decrescente di importanza, e una riduzione delle dimensioni viene effettuata. In tal modo, durante la categorizzazione del testo, termini di minore importanza vengono ignorate, e metodi di selezione funzione e di estrazione vengono applicati i termini della massima importanza; pertanto, il tempo di calcolo e la complessità della categorizzazione è ridotto. Per valutare l'efficacia dei metodi di riduzione delle dimensioni del nostro modello di purposed, gli esperimenti sono condotti con il vicino di casa k-vicino (KNN) Magliette Hollister e l'algoritmo di albero decisionale C4.5 su Reuters-21578 e classic3 set di dati di raccolta per il testo categorizzazione. I risultati sperimentali mostrano che il modello proposto è in grado di ottenere un'elevata efficacia categorizzazione misurata con specificità, sensitività e F-misura.
0 Commenti


Parlare la vostra mente