<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=164424454490051&amp;ev=PageView&amp;noscript=1">
2 temps de lecture

Qu'est-ce que l'analyse sémantique ?

01/10/19 14:16

Analyse sémantique définition

Au début, il y avait l'Analyse textuelle (et c'était... pas bon)

Au début d'AdTech, les gens écrivaient des programmes qui pouvaient gratter d'énormes quantités de données et chercher des mots et des phrases qui se répétaient fréquemment. (Vous vous souvenez des nuages de mots ?) Ce qui sous-entendait que la fréquence était un signal important. Même si nous oublions cette hypothèse erronée pendant une minute, il y a encore quelques lacunes flagrantes. Premièrement, quelqu'un doit examiner ces résultats et déterminer pourquoi ce mot revient plus souvent et ce qu'il signifie pour eux. Bien sûr, il est très difficile de le faire avec des mots sortis de leur contexte, surtout quand les mots peuvent avoir tant de significations et de connotations différentes :

fouet (fouet cool, fouet, fouet, fouet intelligent, fouet fantôme sur le fouet)

jaguar (plus d'informations sur cet exemple ci-dessous)

run, take, break, pomme, pomme, grue, date, foil (la liste est longue)

Et puis il y a eu le balisage...

L'étiquetage était essentiellement une tentative d'utiliser la compréhension nuancée du contenu par un humain pour créer un système qu'une machine pourrait propager à grande échelle. Nous choisissons quelques mots (hors contexte !) qui, nous l'espérons, donneront un sens à un lecteur. Les erreurs s'accumulent sur les étiquettes à redondance rapide, les étiquettes mal orthographiées, les étiquettes appliquées de manière incohérente, les surétiquettes, et sont multipliées par chaque personne utilisant le système. Au fur et à mesure que les systèmes commençaient à s'améliorer, au moins nous avons vu des gens utiliser le comportement de recherche pour guider les taxonomies de balises, mais nous ne faisons encore que deviner comment un utilisateur individuel va conceptualiser ou rechercher un élément de contenu.

(Nous ne disons pas que vous ne devriez pas baliser votre contenu. Les balises sont une composante importante de la compréhension sémantique, et elles servent aussi à d'autres fins (voir notre article sur les balises graphiques ouvertes). Il suffit d'avoir une taxonomie qui fait autorité, guidée par les données, pour vos balises ou au moins un ensemble défini de règles.)

L'analyse sémantique du contenu en langage naturel commence par la lecture de tous les mots du contenu pour saisir le sens réel de tout texte. Il identifie les éléments de texte et les assigne à leur rôle logique et grammatical. Il analyse le contexte dans le texte environnant et il analyse la structure du texte pour désamorcer avec précision le sens propre des mots qui ont plus d'une définition.

La technologie sémantique traite la structure logique des phrases pour identifier les éléments les plus pertinents du texte et comprendre le sujet discuté. Il comprend également les relations entre les différents concepts du texte. Par exemple, il comprend qu'un texte traite de "politique" et d'"économie" même s'il ne contient pas les mots mêmes mais des concepts connexes tels que "élection", "démocrate", "président de la Chambre", "budget", "taxe" ou "inflation".

L'analyse sémantique et le traitement du langage naturel peuvent aider les machines à comprendre automatiquement le texte, ce qui permet d'atteindre l'objectif encore plus vaste de la traduction de l'information - cet élément potentiellement précieux de rétroaction des clients ou d'aperçu dans un tweet ou dans une connexion au service client - dans le domaine de la Business Intelligence pour le support client, la veille stratégique ou la gestion du savoir.

Thématique SEO
Marc Sauvage

Ecrit part Marc Sauvage

Consultant Inbound marketing, spécialisé en SEO

Featured