L’âge des sondages tire-t-il à sa fin ? La prolifération des médias sociaux (Facebook, Twitter, blogues…) offre aux entreprises une occasion d’évaluer en temps réel ce qui se dit de nombreux produits. Bienvenue dans le monde de l’analyse des sentiments.
Il devient ainsi possible d’analyser des tendances comportementales dans plusieurs domaines, pas seulement commercial, mais des intérêts, émotions, goûts et dégoûts. Comment analyser des dizaines de milliers de gazouillis (tweets) ?
Pour identifier et répartir les tweets positifs et négatifs, puis leur donner un sens, une nouvelle science a été créée de toutes pièces : l’analyse des sentiments. L’étude automatisée des sentiments et des opinions exprimés dans des documents non structurés a donné naissance depuis cinq ans à des centaines de firmes, certaines offrant des outils gratuits, comme SocialMention, par exemple.
Un Symposium sur l’analyse des sentiments qui s’est tenu à New York, en mai dernier a permis de constater que les enjeux sont importants. L’analyse des sentiments est utilisée aujourd’hui pour le choix des titres boursiers, la lutte contre la criminalité, l’évaluation des déclarations d’assurance et, bien sûr, pour la compétitivité des entreprises, leur service à la clientèle et les études de marketing.
L’analyse du sentiment permet de traquer le mensonge, de dévoiler les humeurs, de cerner des enjeux et de prévenir des crises. En résumé, il permet d’extraire la substance du web mais aussi d’engager la conversation avec l’internaute. C’est un outil de gestion polyvalent et extrêmement puissant.
Moissonnage numérique
Les données captées sur le web peuvent provenir aussi bien des documents écrits, que photographiques ou vidéos mis en ligne dans les médias sociaux, les courriels et sites web. Il suffit que l’information soit accessible sur Internet. Les capacités d’analyse ont évolué au cours des dernières années et vont au-delà des simples catégories quantitatives comme « positif », « négatif » et « neutre ».
À présent, les moteurs d’analyse ou inforobots qui moissonnent le web (en anglais, web scraping) peuvent évaluer si la personne est triste, excédée, heureuse, pressée ou simplement fatiguée. Au moyen d’algorithmes sophistiqués, l’inforobot établit un constat en analysant le contexte de la phrase. Plus la matière à analyser est brève, comme un tweet, par exemple, plus la tâche d’analyse est ardue. Comme la majorité des informations aujourd’hui proviennent de Twitter ou d’applications encore plus laconiques (Foursquare, Epinions, MouthShut…), les outils d’analyse des sentiments ont tendance à devenir de plus en plus puissants.
Le taux de fiabilité
Les estimations sur le niveau de fiabilité des systèmes varient. Certains estiment qu’environ 60% des textes sont analysés correctement. Un des leaders de l’industrie, la firme Crimson Hexagon, de Boston, avance même le chiffre de 90%.
Pourtant, tout n’est pas si simple. De tels résultats peuvent être atteints dans des situations « idéales » : population culturellement et linguistiquement homogène, thèmes bien circonscrits, etc. Dans la pratique, de telles conditions sont rarement réunies.
Presque tous les systèmes d’analyse ont été construits en fonction de la langue anglaise. Or, le web est mondial et, même si le thème visé par la recherche est limité à une région précise, il y aura souvent des individus qui utiliseront des langues différentes. Il n’est que songer à Montréal où bien des gens utilisent tour à tour l’anglais et le français (dans le cas d’immigrants, une troisième langue vient parfois pimenter le tout). Il y a mieux : le même individu peut utiliser des mots français et anglais dans le même texte.
Toutes les firmes d’analyse de sentiment, sans exception, prétendent offrir un service multilingue. Or, la majorité des systèmes qui analysent le français ont de pauvres performances. Par exemple, si le tweet est écrit en français mais qu’il comporte ne serait ce qu’un mot anglais, il est classé dans la catégorie anglaise avec les résultats d’analyse que l’on peut imaginer. Le fait de conclure un tweet par “bye” n’en fait pas un document de langue anglaise…
Au défi du multilinguisme s’ajoute celui de la construction des phrases bancales (les règles de grammaire sont rarement respectées par les rédacteurs de tweets, voire même de blogues). Le recours au sarcasme demeure un obstacle majeur, spécialement dans les tweets, où le contexte textuel est inexistant.
Prenons au hasard un tweet du printemps québécois : « J’aime le doux son des casseroles tellement plus juste que Charest et les libéraux #manifencours #ggi ». Les mots positifs « doux » et « juste » sont accolés au nom de Premier ministre et du parti politique au pouvoir. Pourtant l’intention est tout sauf positive, comme n’importe quel être humain comprend immédiatement, mais pas forcément la machine.
Les émotions bien qu’universelles se déclinent dans des environnements linguistiques aux frontières flottantes, ainsi que dans modes culturels à plusieurs niveaux où certains mots utilisés renvoient à des contenus sémantiques opposés à leurs énoncés de motif usuels – sarcasme, ironie ou simple métonymie : « la confiance règne! »
Le grand débat
Le Symposium de New York a fait ressortir deux tendances parmi les firmes d’analyse de sentiment. Face aux subtilités toujours changeantes de l’expression humaine, certaines misent tout sur l’intelligence artificielle. Pour elles, l’analyse de sentiment carbure aux mathématiques pures. Comme on l’a vu, il ne suffit pas de répertorier les mots en fonction de leur sens usuel. Il faut analyser les mots en fonction de leur nature (verbe, nom, adjectif…), de leurs différents sens et de leur position dans la phrase, afin de les répartir dans une structure préétablie. À partir de cette structure, il devient possible de retracer l’intention contenue dans les mots, leur degré d’intensité, etc.
Une étape plus avant, Michael Tupanjanin, président de la firme Metavana, affirme avoir mis au point le système infaillible. Au lieu d’utiliser le traitement automatique du langage naturel, le système Metavana s’inspire des principes de la théorie du chaos. Le système est totalement automatisé et ses résultats atteindraient un haut niveau de fiabilité.
L’autre tendance, qui avait le vent en poupe à New York, mise sur le crowdsourcing. Ces entreprises estiment qu’il est moins coûteux et plus efficace de recourir à des personnes pour analyser des grands volumes de données. Max Yankelevitch de CrowdControl affirme avec force que chaque personne est un ordinateur. Le crowdsourcing, cependant, a ses limites: impossible de faire réaliser des tâches complexes, ou de contrôler le manque d’attention ou d’engagement des sous-traitants lors de la réalisation des tâches, hétérogénéité des résultats…
Au bout du processus, il faut quand même combiner l’intelligence artificielle au crowdsourcing pour assurer un monitorage constant de la qualité et en cela CrowdControl rejoint certains des processus employés par ses concurrents de l’analyse automatique des sentiments.
Pourquoi choisir l’analyse des sentiments ?
Quelque soient les difficultés méthodologiques, l’analyse des sentiments est une discipline en plein essor. Les entreprises y voient la seule façon de face au déluge croissant de données numériques qui concernent leurs produits, leur image et les aspirations du public en général. Encore faut-il qu’elles apprivoisent ce nouvel outil. Frank Cotignola, responsable du marketing chez Kraft Foods, a fait ressortir le malentendu qui prévaut encore dans la plupart des services de marketing. « La grande erreur que commettent les entreprises est d’être à l’écoute des seules conversations qui portent sur leur marque. Or, il faut au contraire porter le plus grand soin à l’écoute de ce qui se dit à la périphérie et puis tenter d’adapter la marque aux conversations. »
La grande leçon du Symposium de New York est que l’analyse des sentiments est en passe de métamorphoser des relations avec la clientèle. La conversation est devenue un mode irréversible de structuration des relations clients et, de manière peut-être moins visible mais tout aussi déterminante, des structures administratives de l’entreprise. Le cloisonnement sectoriel et hiérarchique doit céder la place à une espace collaboratif qui lui-même doit entrer en conversation avec les clients. L’analyse de sentiment est à la pointe des transformations économiques et sociales engendrées par Internet sous sa forme actuelle.