La grande force de Microsoft, c’est son innovation. Qu’elle provienne de ses équipes de recherche ou qu’elle soit le fruit de sa stratégie d’Open Innovation et de croissance externe, Microsoft enrichit constamment sa suite collaborative cloud Office365. Après le rachat de Linkedin en Juin 2016 pour la somme de 26,2 milliards de dollars, Microsoft dope Office 365 avec une dose d’intelligence artificielle nommée Genee. Cette start-up d’à peine 2 ans pratique le text mining afin de simplifier l’organisation de réunions, tâches, déjeuners etc…

Qu’est-ce que le text mining ? Comment Genee pourrait-il changer nos habitudes ?

Le text mining ou fouille de textes désigne un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité dans des textes produits par des humains pour des humains. Dans la pratique, cela revient à mettre en algorithme un modèle simplifié des théories linguistiques dans des systèmes informatiques d’apprentissage et de statistiques.

Le text mining peut servir à classifier automatiquement des documents, à avoir un aperçu du contenu d’un document, à alimenter automatiquement des bases de données, à traiter plus facilement des ensembles documentaires volumineux ou encore à enrichir l’index d’un moteur de recherche pour améliorer la pertinence des résultats. Nous pouvons penser également à des interactions homme-machine plus naturelles grâce à la création de bots. C’est sur ce terrain que Genee s’est développée.

Les règles de base du text mining sont la reconnaissance des unités de langage, les mots, la prise en compte de la ponctuation et de la mise en page. Il doit ensuite interpréter les formes lexicales et grammaticales et enfin la lemmatisation i.e le regroupement de mots en une forme canonique et ses déclinaisons.

L’analyse peut ensuite être faite suivant une approche statistique et/ou sémantique. Le principal avantage de l’approche statistique est son faible coût d’entretien. Elle est en revanche peu efficace pour un volume de données réduit et ne prend pas en compte la spécificité d’un texte. Des textes scientifiques ou commerciaux sont traités de manière identique. L’approche sémantique prend en compte ces spécificités et peut même effectuer des traitements répondant à un besoin. En revanche, elle présente des coûts de maintien élevés et le temps de traitement peut être très long sur des corpus importants. Il est heureusement possible de combiner les deux pour obtenir des résultats optimaux.

Genee est un assistant, il analyse les phrases contenues dans vos messages électroniques email ou sms mais également Skype et Facebook Messenger. Il interprète ensuite cette analyse afin de réaliser une action qui doit vous faire gagner du temps.

Pour communiquer avec Genee, rien de plus simple. Créez un mail, indiquez vos destinataires et écrivez votre message « Bonjour à tous, cette semaine j’aimerais organiser … ». Pour que Genee vous assiste il vous suffit de le mettre en copie et de s’adresser à lui dans votre message : « Genee, aide-nous à planifier un déjeuner la semaine prochaine ». Il se chargera de trouver des créneaux arrangeant pour l’ensemble des destinataires du message et de vous les proposer. Vous pouvez lui commander des actions bien plus précises comme de vous planifier un rendez-vous, tel jour à telle heure et à tel endroit ou bien de rappeler à l’ensemble des participants de la réunion de 16h qu’ils doivent apporter leur support de présentation.

Microsoft enrichit donc sa suite Office365 pour la rendre plus intelligente et offrir toujours plus de services à ses utilisateurs. Nous ne savons pas encore à quel(s) outil(s) Genee sera greffé mais il est difficile de se prononcer sur son réel intérêt au sein des clients professionnels de Microsoft. Genee deviendra-t-il un précieux assistants de notre quotidien, ou un gadget inutile que l’on s’empressera de désactiver ? Comme beaucoup d’outils se basant sur l’IA, Genee devra faire ses preuves avant de faire partie de notre univers de performance.