Prétraitement de texte NLP : Vectorisation du texte
Pour que le traitement du langage naturel (NLP) fonctionne, il faut toujours transformer le langage naturel (texte et audio) en forme numérique. Les techniques de vectorisation de texte, à savoir le sac de mots et la vectorisation tf-idf, qui sont des choix très populaires pour les algorithmes traditionnels d'apprentissage automatique, peuvent aider à convertir le texte en vecteurs de caractéristiques numériques.