Information pour les hommes et données pour les machines ?

Cet article fait partie d'une série.

L'information constitue généralement l'objectif recherché par un être humain lorsqu'il pose une
question. Cette information passe par un support qui doit pouvoir être interprété par un homme : son ou parole, écrit ou image.

L'intelligence humaine exploite le contexte pour interpréter les questions et les réponses. L'échange :
A: "Quel est le prochain train pour aller au Château Versailles ?",
B: "Quai 2, dépêchez vous il part dans 5 minutes"
B apporte à A une information complète qui répond à son besoin. Mais cette information est liée à un contexte : lieu, jour et heure précise qui n'est connu des deux interlocuteurs.

Ce contexte et nos capacités de déduction, permettent aussi de comprendre que le voyageur souhaite se rendre en train jusqu'à la gare de Versailles puis au Château probablement à pied et non "en train jusqu'au Château de Versailles".

Les machines ne disposent pas de nos capacités d'interprétation et sont, en général, totalement incapable de comprendre une information contextuelle conçue pour un homme. C'est évidemment le cas pour une phrase, cela l'est aussi pour une fiche horaire, un document word, un fichier excel.

Au final, l'information échangée par nos deux voyageurs contient des données : numéro du quai, toponymie, durée... Beaucoup de documents d'information : fiches horaires, plans, feuille de route... regorgent de données, mais elles ne peuvent être exploitées que par une intelligence disposant d'éléments de contexte. Un effort particulier est nécessaire pour extraire des données structurées utiles pour une machine à partir d'information utile pour un homme.

Post suivant : Comment produire des données utiles pour une machine ?

Aucun commentaire: