L’édito de GNU/Linux Magazine n°204 !

Il est parfois édifiant de constater à quel point une idée simple peut nous faciliter la vie. Cette idée apparaît comme par enchantement et l’on se demande comment on a pu vivre jusque-là sans elle… et surtout comment on a fait pour ne pas l’avoir avant, cette satanée idée ! Prenons un exemple tout simple : lorsque l’on travaille sur un Raspberry Pi et que l’on écrit un article sur un PC, on a deux claviers, deux souris et deux écrans. Immanquablement, lorsque l’on souhaite écrire sur le Raspberry Pi on utilise le clavier… du PC ! Ce qui conduit à des résultats quelque peu aléatoires… Lorsque l’on souhaite déplacer la souris du PC, on utilise la souris du Raspberry Pi ce qui l’amène généralement, de rage, à prendre son envol sur quelques dizaines de centimètres (ce qui permet de comprendre l’utilité du câble qui relie la souris à l’ordinateur…), etc. Alors qu’en fait, on pourrait utiliser un bête commutateur USB et un commutateur HDMI qui existent depuis bien longtemps (les plus fortunés pouvant mÍme se tourner directement vers des switchs KVM pour Keyboard-Video-Mouse) ! Il fallait juste avoir l’idée au bon moment…

Les machines ne peuvent malheureusement (ou plutôt heureusement) pas anticiper, prédire ces idées qui nous font défaut. Par contre, il est possible statistiquement de déterminer le prochain mot auquel vous allez penser. En effet, en analysant un ensemble de documents, on peut calculer la probabilité pour un mot d’apparaître connaissant le mot précédent (ou les n précédents). La qualité des documents utilisés pour « l’apprentissage » est donc essentielle ! Vous n’obtiendrez pas la même précision suivant que vous allez employer :

  • des documents hétérogènes avec par exemple des textes en anglais du XVIIIe siècle, des textes en français du XVIe siècle et des textes en italien du XVe siècle ;

  • ou des documents homogènes issus de la même époque et du même domaine.

Dans le premier cas, vous allez réaliser une « grosse soupe » en mélangeant des époques, des langues et certainement des domaines (articles de presse, poésie, théâtre, etc.) et vous allez l’utiliser pour déterminer le prochain mot d’une phrase en français du XXIe siècle : un tirage purement aléatoire vous demandera moins de travail pour un taux de réussite à peu près équivalent.

Par contre dans le second cas, en travaillant de manière précise à l’élaboration de la base de documents, vous pourrez obtenir des résultats intéressants qui ne devront rien au hasard.

Ce mois-ci nous vous proposons d’étudier ce processus de prédiction dans son ensemble, depuis la création de la « base d’apprentissage » jusqu’à la proposition d’un mot devant compléter une phrase.

Vous pourrez également découvrir dans ce magazine comment réceptionner et décoder des trames RDS (mais oui, le RDS : les données numériques transmises sur les ondes FM), comment fonctionne le mécanisme d’allocation mémoire aléatoire du kernel et bien d’autres choses encore !

Je vous laisse prendre connaissance de ce contenu assez dense, je vous souhaite une bonne (lecture | année | soirée | journée)* et je vous retrouverai avec plaisir le mois prochain !

* Avec certains historiques de mots (comme « je vous souhaite une bonne »), la prédiction peut être difficile à effectuer… 😉

Tristan Colombo

Retrouvez GNU/Linux Magazine n°204 chez votre marchand de journaux, sur notre boutique en ligne et sur notre plateforme de lecture en ligne Connect

Laisser un commentaire