"Data Driven" un e-book sur la culture de la donnée

Je suis, de longue date, un "follower" de Hillary Mason data scientist, fondatrice des Fast Forward Labs. J'apprécie ses conférences et son blog et je me suis donc précipité sur son petit e-book gratuit, sur la culture de la donnée et les organisations "data driven". Le livre est co-écrit avec DJ Patil. et publié chez O'Reilly
Voici ce que j'en retiens et que cela nous vous dissuade pas de le lire vous même !

Après avoir rappelé que la technologie est toujours moins importante que les gens qui s'en servent, les auteurs reviennent sur la définition des data scientists. Ils combinent plusieurs compétences dans trois domaines :
  • maths et stats,
  • développement informatique et maîtrise d'un ou plusieurs langages, 
  • communication et capacité à donner à leur travaux un impact sur les opérations... 
Mais ils doivent surtout être bien intégrés dans le management de l'entreprise (je dirai dans le "métier"), pour disposer des bons éléments de contexte. Au niveau du comité de direction l'expertise sur les données est fournie par le chief data officer complémentaire du CIO et du CTO.

Après un chapitre sur ce qu'est une organisation "data driven", les auteurs abordent un point essentiel : l'accès à la donnée. 
Leur recommandation est claire : dans une organisation, chacun doit avoir accès à toute l'information disponible (dans les limites légales). Cette pratique me semble encore minoritaire en France, ou le "besoin d'en connaitre" reste prévalant. Bien entendu, l'accessibilité nécessite la diffusion de compétences et d'outils, y compris pour les fonctions traditionnellement les moins techniques de l'entreprise.

On passe ensuite en revue quelques points importants de méthode avant de s'intéresser à l'organisation et au process. Sur ce dernier sujet, un chapitre est consacré aux tableaux de bord et deux autres aux réunions d'analyses des données.

Le livre se conclue par deux chapitres, l'un sur les outils et l'autre sur la culture... Je vous laisse méditer cette citation :
"The secret of great data science is that the tools are almost irrelevant.", 
qui est, naturellement, nuancée dans le texte, mais qui a le mérite de dissiper la fascination qu'on peut avoir à propos des outils en particulier dans le domaine de la data....

iBeacon dans les transports

Une visite chez Milky, une agence d'innovation digitale qui expérimente notamment iBeacon m'a permis de me mettre à jour sur cette technologie. 

iBeacon, c'est, essentiellement :
  • Un format d'information émis par des balises Bluetooth Low Energy (BLE). Le coût des balises est faible (de l'ordre de 10€), leur portée paramétrable est d'une dizaine de mètres et et leur autonomie d'une dizaine de mois sur batterie L'information diffusée est "statique" et se limite, en gros, à un identifiant de la balise.
  • Une fonctionnalité de iOS qui permet des interactions : notification ou "réveil" d'une application, lorsque le mobile est suffisamment proche d'une balise.
Les applications sont nombreuses dans le domaine du marketing "mobile to mortar", visant à inciter les utilisateurs de mobiles à consommer dans des boutiques. Ces services reposent sur l'exploitation d'informations contextualisés grâce à l'identifiant de la balise. 
C'est intéressant, notamment parce que c'est beaucoup plus simple que des mécanismes existant de type "flashcode" ou cibles NFC, le geste client est beaucoup plus simple et la technologie BLE est présente sur la majorité des téléphones. 
La vidéo ci dessous donne quelques bons exemples de services :


Exemples pour les transports  : 
  • vous entrez dans un bus, un train, une gare et votre téléphone vous propose une notification qui vous donne accès aux prochains arrêts desservis ou les horaires des prochains trains au départ,
  • vous faites la queue devant un automate ou un guichet et on vous propose des solutions alternatives :autres guichets ou automates moins fréquentés, services en lignes...
  • vous oubliez votre bagage, dès que vous vous éloignez de plus de 10 mètres, votre téléphone vous alerte...
  • dans un souterrain ou un espace dans lequel le GPS ne fonctionne pas, les balises iBeacon peuvent vous permettre de vous localiser...    
J'ai pu poser quelques questions aux experts de Milky :
  • Cela fonctionne t il avec des téléphones Androïd ? Oui, Android peut aussi fonctionner avec toutes sortes de formats provenant de balises BLE. En revanche, les notifications sur iOS ne peuvent être déclenchées que par du iBeacon.Google propose d'ailleurs, sous le nom de physical web, un concept prometteur utilisant le BLE pour interfacer le "monde réel" et votre portable.Ce concept prend le contre pied de iBeacon sur les notifications.
  • Quid de la sécurité ? les signaux publics diffusés par iBeacon ne sont pas sécurisés. On peut donc les copier et les reproduire ailleurs (spoofing). Le résultat obtenu est que les applications peuvent être "trompées" par une fausse balise. Elle vont se réveiller ou proposer une notification dans un contexte qui n'est pas forcement celui imaginé au départ. On peut aussi imaginer que votre concurrent paramètre son application pour qu'elle se réveille à proximité de vos beacons. Par exemple pour proposer des services concurrents. Il existe déjà des "cartes" de iBeacon qui permettent de récupérer les informations nécessaires.
  • N'y a t il pas un risque lié à la protection de la vie privée ? Les apps lorsqu'elles se réveillent peuvent "pinger" le serveur avec l'identifiant du client et laisser une trace de son passage sans que cela ne corresponde à une action consciente de sa part. Avec la multiplication des balises,  et l'apparition probable d'opérateurs de iBeacon opérant pour plusieurs marques, il peut y avoir un risque...

Bitcoin, agents ou entreprises distribués autonomes et mobilité

(N.B. Cet article a été mis à jour le 31/12/2014 pour clarifier le mécanisme "scellant" le blockchain)
On a beaucoup parlé de Bitcoin et souvent pour de mauvaises raisons : son caractère spéculatif (voir l'évolution du cours ci dessous), les trafics qui peuvent y recourir.


Cours du Bitcoin en $ (source Google)

D'après Google Trends on en parle moins, mais on a peut être tord aussi. En effet, les mécanismes qui sous tendent Bitcoin, en particulier BlockChain ont des vertus dont on est loin d'avoir imaginé toutes les conséquences.

L'objectif général est de sécuriser les transactions numériques. Classiquement, elles fonctionnent de la façon suivante :
  • au départ vous disposez d'une valeur, 
  • un acheteur se présente, vous vous mettez d'accord sur un contrat qui, en général, définit que vous transférez la propriété de la valeur une fois reçu un paiement de l'acheteur. 
  • L'acheteur, procède à un paiement électronique via un système dans lequel vous avez confiance. Plus précisément, il obtient que sa banque vous remette un certificat sécurisé attestant que la transaction est faite.
  • En cas de litige ou d'escroquerie, le tiers de confiance peut être saisi et dans certains cas il assumera financièrement une partie des pertes.
Une des innovations principales de BitCoin est le BlockChain. Il s'agit d'un registre sécurisé des transactions qui garantit l'authenticité des transactions sans recourir à un tiers de confiance.
Le registre est au contraire très largement diffusé, accompagné d'un sceau numérique (en anglais hash, et en français : "hachage") garantissant l’intégrité du registre. Lorsque vous disposez du sceau et du registre il est facile de vérifier si ils correspondent ou pas grâce à un algorithme rapide.
Dans le cas du BlockChain, la construction d'un sceau correspondant à un registre est, volontairement, très coûteuse en temps de calcul.
Entre deux versions du registre, les nouvelles transactions sont transmises à l'ensemble des dépositaires du registre. Chaque dépositaire vérifie que ces transactions sont légitimes (ie : que le compte de l'acheteur est solvable et  permet bien de réaliser la transaction).
Périodiquement, le calcul de chaque nouveau sceau pour chaque nouvelle version du registre est assuré par un grand nombre de contributeurs qui offrent une puissance de calcul suffisante.
Au début, la communauté est réduite, les sceaux sont plus faciles à calculer et les contributeurs sont rémunérés. Plus la communauté grandit moins les contributeurs sont rémunérés et plus le coût de caclcul des sceau augmente. Mais ceux qui disposent de BitCoins, ont de plus en plus intérêt à contribuer à la protection de leur pactole.
En régime de croisière, BitCoin oppose la puissance de calcul de la communauté "légitime" à celle d'un éventuel hacker ou plus probablement à une communauté d'attaquants. La description complète du mécanisme est disponible en anglais ici.
Ces mécanismes permettent de bénéficier des avantage suivants :
  • La confiance dans un tiers n'est pas nécessaire, seule compte la taille de la communauté.Ces systèmes dits "trustless" échappent ainsi aux vulnérabilités inhérentes aux tiers de confiance. Dans un monde où les technologiques, économiques et géopolitiques évoluent rapidement, cette caractéristique a de quoi séduire...
  • Le système est réparti et est à l'abri de la défaillance d'un de ses participants ou d'un attaque locale c'est plus sûr que les espèces ou qu'un compte en banque.
  • Les utilisateurs sont anonymes. Le registre des transactions est publique, mais l'identité des intervenants reste secrète. Le lien entre la transaction et les parties qui la réalisent n'est pas accessible sans l'accord des parties elles mêmes.Dans un mécanisme bancaire classique, les transactions sont aussi secrètes, mais le protection du secret dépend d'un tiers de confiance. 
  • Dans un système qui n'a plus à gérer l'établissement de relation de confiance, les coûts de transaction restent faibles, potentiellement nuls, ce qui n'est ni le cas des espèces, ni celui des monnaies bancarisées,
  • Les transactions sont facilement programmables, ce qui pourrait sans doute être le cas des monnaies bancarisées, mais qui est en quelque sorte "natif" pour Bitcoin. Des contrats sophistiqués peuvent être signés, qui donneront lieu à des transactions conditionnelles. Un exemple est donné par Simulfunding : il permet à des participants à une collecte d'indexer le montant de leur donation sur la donation des autres. Certains imaginent déjà de véritables entreprises "programmées" qui produiraient des services payant, en rémunérant ses sous traitants, sans autre intervention humaine que leur programmation initiale. 
    • Les plateformes de services de mobilité, qui rapprochent la demande et l'offre et qui sous traitent à des conducteurs et vendent à des passagers ou à des chargeurs, sont des candidats pour ces agents autonomes et programmés.
    • Un autre exemple "classique" imagine un futur proche ou lles automobiles les plus pressées proposeraient de micro-payer automatiquement celles qui leur laissent la priorité.
  • Enfin, ces mécanismes sont génériques, ils peuvent s'appliquer à une monnaie, mais ils peuvent aussi être mis en oeuvre pour d'autres schémas qui ne fonctionnent, pour le moment, que via un "tiers de confiance". C'est aujourd'hui le cas de la grande majorité des services numériques. Ils reposent sur des échanges bilatéraux entre un client local et un "serveur central". Cette relation est asymétrique. Le serveur est le seul à voir "toutes les transactions", il est seul garant de la confidentialité et de la sécurité du service. On peut imaginer une nouvelle génération de service dont la sécurité (confidentialité et intégrité des données des utilisateurs, intégrité du service) sont garanties par une vaste communauté activement impliquée dans l'utilisation du service. 
Cette généralisation du blockchain semble être un des objectifs d'Etherum une plateforme qui fera peut être l'objet d'un prochain article, mais dont on parle déjà beaucoup : içi, là en français, ou .
Pour ceux qui doutent encore du sérieux des "crypto monnaies", je suggère la lecture d'un rapport du sénat français