NLP ITALIA

Ultimi Articoli

Come allenare un modello Word2Vec per l’italiano

28 Ottobre 20221 Novembre 2022

Leggibilità di un testo: l’indice di Gulpease

22 Ottobre 202222 Ottobre 2022

Analisi del sentiment con la regressione logistica

12 Ottobre 202223 Ottobre 2022

TF – IDF: quali parole sono importanti?

9 Ottobre 202222 Ottobre 2022

Senza categoria

Come allenare un modello Word2Vec per l’italiano

nlpitalia 28 Ottobre 20221 Novembre 2022

In questo tutorial vedremo come trainare un modello Word2Vec per la lingua italiana sul corpus di Wikipedia. Esistono moltissimi modelli pretrainati per l’italiano (ad esempio ce ne sono diversi inclusi in Spacy), ma penso che, almeno una volta, possa essere…

NLP classica

Leggibilità di un testo: l’indice di Gulpease

nlpitalia 22 Ottobre 202222 Ottobre 2022

Nel post di oggi parleremo dell’indice di Gulpease, un indice di leggibilità dei testi per…

sentiment analysis

Analisi del sentiment con la regressione logistica

nlpitalia 12 Ottobre 202223 Ottobre 2022

In questo articolo vedremo come creare un primo, semplice, modello di NLP per l’analisi del…

preprocessing dei testi

TF – IDF: quali parole sono importanti?

nlpitalia 9 Ottobre 202222 Ottobre 2022

Spesso gli algoritmi di NLP lavorano su corpora che contengono decine (se non centinaia) di…

preprocessing dei testi

Stemming e Lemmatizzazione

nlpitalia 7 Ottobre 202216 Ottobre 2022

Nel post precedente, abbiamo visto come segmentare un testo in token. Nel caso di gran…

preprocessing dei testi

Tokenizzazione

nlpitalia 5 Ottobre 202228 Ottobre 2022

Con il termine tokenizzazione si intende la riduzione di un testo in unità semantiche fondamentali chiamate tokens. Nella stragrande maggioranza delle applicazioni i token corrispondono alle parole (word tokenization), ma in casi particolari possono essere anche sillabe, frasi, paragrafi o…

NLP ITALIA

Ultimi Articoli

Come allenare un modello Word2Vec per l’italiano

Leggibilità di un testo: l’indice di Gulpease

Analisi del sentiment con la regressione logistica

TF – IDF: quali parole sono importanti?

Come allenare un modello Word2Vec per l’italiano

Leggibilità di un testo: l’indice di Gulpease

Analisi del sentiment con la regressione logistica

TF – IDF: quali parole sono importanti?

Stemming e Lemmatizzazione

Tokenizzazione

Come allenare un modello Word2Vec per l'italiano

Leggibilità di un testo: l'indice di Gulpease

Analisi del sentiment con la regressione logistica

TF - IDF: quali parole sono importanti?