Réponse 1:

Sac de mots et espace vectoriel font référence aux différentes approches de catégorisation du corps du document.

Dans Sac de mots, vous pouvez extraire uniquement les mots unigrammes pour créer une liste non ordonnée de mots sans balisage syntaxique, sémantique et POS. Ce tas de mots représente le document.

Dans le modèle d'espace vectoriel, il s'agit d'un modèle algébrique utilisé pour représenter des documents sous forme de vecteurs. à partir du sac de mots donné, vous pouvez créer un vecteur de document d'entité où chaque entité est un mot et sa valeur est le poids du terme.

Dans TF-IDF, c'est le terme poids qui est représenté dans le modèle d'espace vectoriel.

Ainsi, le document entier est un vecteur d'entités. qui pointe vers un point dans l'espace vectoriel de telle sorte qu'il y ait un axe pour chaque terme dans notre sac.

Cela peut vous aider >> Sac de mots vs modèle d'espace vectoriel?