mardi 29 novembre 2011

La visualisation des données

La "Visualisation des données"

Quelques "mot-clés" de la visualisation des données : Cartographies, schémas, représentations graphiques, lecture immédiate, attractivité, réseaux/médias sociaux (Facebook, Twitter, Flickr, Google+...), outils infographiques (Gephi,...), graphisme, communautés, liens, interactivité...


Un zoom efficace sur les réseaux sociaux et leur utilité :

Le blog d'Aref JDey (Demain la veille/ La valeur ajoutée de la visualisation de données) aborde le sujet ainsi "la représentation graphique des données (statistiques ou autres) permet d'améliorer la compréhension des problématiques liées aux médias sociaux mais aussi de synthétiser différents aspects de leurs usages et évolution". 5 exemples complémentaires de cartographies mettent ainsi en évidence les liens, les comportements, les usages et l'utilisation des réseaux sociaux (The Social Media Effect, Social Marketing Compass, Word of Mouth Visualized, What people are doing (Creator, Critics, Collectors, Joiners, Spectators, Inactives), The social Landscape) : une étude sociale et aussi commerciale intéressante à décrypter...


Une exercice d'esthète :


Certaines cartographies très développées, en 3D parfois, entrent dans la catégorie "Beaux-Arts"/ Art graphique : je vous recommande "la visualisation" des catalogues Data Flow : Design graphique et visualisation d'information (3 volumes existant à l'heure actuelle).


Une approche universitaire :


La cartographie sémantique par Christophe Tricot qui la définie ainsi :
On peut définir la cartographie sémantique comme étant la cartographie d’un espace informationnel basée sur sa sémantique. Et la cartographie est l’ensemble des opérations qui interviennent en vue de l’élaboration d’une carte et de son utilisation. En d’autres termes, la cartographie sémantique est le recours à des représentations graphiques d’un ensemble d’informations (des cartes) pour partager et créer des connaissances. L’objectif des cartes est d’aider à facilement appréhender des ensembles d’informations complexes.

La cartographie sémantique est une activité essentielle à la gestion des connaissances, qui permet de tirer parti de toute la richesse des informations des organisations.



Sources :

liens : http://www.demainlaveille.fr/2010/05/04/5-cartographies-pour-comprendre-les-medias-sociaux





Le cloud dans les entreprises françaises

Lors de la présentation du plan numérique de la France pour 2020, le cloud computing a été mis en avant et plus précisément son développement dans les entreprises.

Le cloud computing est un concept qui prend de plus en plus d'ampleur dans les entreprises françaises et posent question pour les décideurs informatiques que sont les DSI (sécurisation des données, migration des données, gestion des données, accès ...)

Une étude de Markess International (cabinet d’études spécialisé dans l'analyse de la modernisation des organisations avec les technologies de l’information) sur le développement du cloud computing en France 2011-2013, indique que les décideurs informatiques s'orienteront de plus en plus vers une solution externe pour l'hébergement de leur serveur.

A noter que ce sont en général les petites entreprises qui s'orientent vers le cloud et principalement pour la sauvegarde et l'archivage.

La tendance en France s'oriente donc vers le cloud mais quels sont les moyens et les outils à disposition des entreprises ? Quelles sont les garanties pour les entreprises de pouvoir accéder à leur données ?...

Au cours de la conférence CA World 2011 qui a eu lieu en novembre aux Etats-Unis, la société CA Technologies a présenté des solutions pour les entreprises afin de les aider dans la migration, la gestion, l'accès à leurs données...

Les offres de cloud augmentent. D'autres sociétés proposent des solutions de cloud tels que : Amazon, Econocom, Microsoft, Open Wide Sourcing, EMC...

Pour en savoir plus :
Article sur le plan numérique de la France pour 2020 :
http://www.journaldunet.com/solutions/acteurs/france-numerique-2020-cloud-et-informatisation-tpe-1111.shtml
Article sur les DSI et le cloud privé :
http://www.journaldunet.com/solutions/dsi/hebergement-et-cloud-prive-externe-1111.shtml
Aticle sur les offres cloud de CA Technologies:
http://www.journaldunet.com/solutions/systemes-reseaux/ca-world-2011-iam-et-migration-cloud-1111.shtml
Article sur les principaux fournisseurs de stockage en ligne :
http://pro.01net.com/editorial/533485/les-principaux-fournisseurs-de-stockage-en-ligne/

jeudi 24 novembre 2011

La DUA approuvée !

La DUA, Késako ?... En fait, il s'agit de la Déclaration Universelle des Archives. Elle a été approuvée par l'UNESCO en session plénière le 10 novembre dernier. Vous en conviendrez, l' information est passée inaperçue pour la plupart d'entre-nous, et pourtant, pour les archives c'est l'avancée la plus significative ces dernières années au niveau international !

Quelques petits rappels historiques...

Cette Déclaration a été initiée en 2007 au Québec et rédigée par des archivistes soucieux de vouloir mettre en valeur leur métier aux yeux du monde. Ils ont été soutenus par un groupe de travail international, la Section des Associations Professionnelles de l'ICA (SPA) pour que la Déclaration Universelle des Archives puisse toucher une audience universelle : prise en compte des différences de langage, de culture et de tradition archivistique.
Non sans mal le texte est approuvé par le Conseil International des Archives (ICA) en Septembre 2010.
Ce n'est qu'à la suite d'une forte mobilisation de la communauté archiviste internationale mais aussi grâce au travail remarquable de Papa Momar Diop, ambassadeur du Sénégal à l'UNESCO et ancien Archiviste National du Sénégal que cette déclaration a finalement pu être approuvée.

Que va changer cette Déclaration pour le métier ?

Elle va permettre de :
- favoriser la compréhension des archives par un plus grand nombre,
- sensibiliser le grand public et les décideurs importants à la cause des archives,
- donner une reconnaissance des archives dans la société moderne,
- mettre en valeur le rôle majeur que jouent les archives dans la transparence administrative, la responsabilité démocratique ainsi que dans la préservation de la mémoire sociale collective,...

Pour
en savoir plus :
Et pour les polyglottes la DUA est disponible en 20 langues...












Google Panda: du positif des utilisateurs aux impacts sur les sites web

Google n'est jamais à court d'idées ! La nouvelle version d'un de ses petits derniers, Google Panda, vient de connaître sa quatrième réplique le 22 novembre dernier, alors qu'il a été lancé en France le 12 août 2011! Les "mini-panda", comme les a nommé Olivier Andrieu (d'Abondance Actualité), sont des modifications du Google Panda d'origine, conçu par Google afin de fiabiliser les recherches sur son site. Pour de plus amples informations concernant l'algorithme de Panda, je vous renvoie à l'article de mon collègue, M. Jérémie Brudieux, "Google Panda : algorithme d'une domination pertinente", du 27 octobre 2011, dans ce blog UniVersDoc. Dans ce document, je vais tenter de démontrer à la fois les avantages de Panda pour les utilisateurs de Google en tant que moteur de recherche, mais également les faces cachées de celui-ci pour les sites Internet.


Les utilisateurs du moteur de recherche, étaient exténués de devoir faire face à de nombreux sites publicitaires ou trop "vieux". Devant cette lassitude et l'habitude du phénomène "première page" (consistant à ne regarder les réponses d'un moteur de recherche ne se situant que sur la première page de réponses) de nombreux utilisateurs, Google s'est vu contraint de reformuler son algorithme afin de proposer des résultats plus pertinents. En effet, selon l'article "Google améliore encore son algorithme: 35% des requêtes impactées" du Journal du Net, Panda de Google permettrait de placer en première page des résultats les sujets d'actualité ; pour les termes récurrents (des élections, des évènements annuels...), la date la plus récente sera proposée en premier ; il en sera de même pour les sujets fréquemment mis à jour (notamment dans le secteur informatique, le matériel hi-tech...). Si ce nouvel algorithme permettra aux utilisateurs de voir plus clair à travers la toile et de trouver plus rapidement les résultats de leur recherche, qu'elles pouvaient-être les faces cachées de la création de Panda par Google ?


Dans un premier temps, il est possible de supposer que devant le flux de publicité et le manque de pertinence de certaines réponses que proposait Google, les utilisateurs pouvaient se lasser. Or, pour Google, annoncer une solution pour pallier à ce problème lui permettait de garder ses utilisateurs et, ainsi, sa place dominante aux seins des moteurs de recherche. Cependant, si certaines personnes allaient tirer du bénéfice de ce changement, il n'en est pas de même pour tous les sites Internet.

Il est ici intéressant de se positionner en tant qu'observateur dans les forums de discussion et d'analyser ce que les propriétaires de sites Internet peuvent dire de ce changement. En effet, on peut y lire, sur Abondance Actualité : "Moi, j'ai été impacté. Le site d'e-commerce pour qui je travail a perdu 12% du trafic issu du référencement naturel depuis hier (lundi)" (22/11/2011), "L'un de mes sites à perdu 50% de visiteur depuis dimanche..., 230 visiteurs samedi, 124 visiteurs dimanche" (23/11/2011).
Il est également intéressant de constater que des plaintes ont été déposées par des sites Internet contre Google, en l'accusant notamment de concurrence déloyale. C'est le cas du comparateur de prix Twenga ou encore "Wikio.fr, Ciao.fr ou leguide.com [qui] ont enregistré des pertes de visibilité de l’ordre de 60 et 80%" d'après la rédaction de ZDnet.fr. D'après ces sites, les pertes financières sont fortes, sauf pour Google Shopping qui arriverait dans la première page de réponse. Google s'est bien entendu défendu contre toutes les accusations auxquelles il doit faire face (en France et dans le monde entier) en argumentant que la disparition de certains sites dans les premières pages est due à l'algorithme (pour faire clair, si les sites ne sont pas référencés c'est qu'ils ne possèdent pas de bons critères) et en aucun cas à une volonté de Google d'affirmer son territoire et de vouloir "manger le monde"1.
Cependant, pour contrer ce phénomène de sites qui pourraient disparaître des réponses du Géant du web, celui-ci a d'ailleurs mis en place un formulaire dans lequel n'importe quel utilisateur peut demander à ce qu'un site puisse être ré-indexé, en stipulant son nom, son adresse mail et, bien sûr, la raison pour laquelle il pense que ce site a été supprimé par Panda de manière absurde.
De plus il paraîtrait que les sites de e-commerce aient été peu impactés en ce qui concerne leur trafic, même si leur référencement sur Google a chuté, d'après Virgile Juhan (il ne faut pas confondre fréquentation et référencement, puisque les utilisateurs de ces sites peuvent connaître les adresses URL et n'ont donc plus besoin de passer par un moteur de recherche pour consulter ces sites).


Aux vues de ces différents sons qui parviennent à mes oreilles, je pense pouvoir conclure que si la plupart des utilisateurs du moteur de recherche Google seront ravis de cette épuration faite par Panda, qui leur apportera moins de publicité et plus de documents "neufs" dans ce monde de l'Internet où l'ancien devient très vite obsolète, les possesseurs de sites Internet, par contre, sont fortement mitigés sur la question, et il a été mis en place sur la toile de véritables forums et salons, voire même des articles dans le but d'être ré-indexés par Panda et de retrouver au plus vite une bonne place sur le moteur de recherche.
Cependant, avec Panda et ses multiples versions, je pense que nous ne sommes pas au bout de nos surprises et que ce Panda va être à surveiller pendant encore un certain temps...


Bibliographie (dans l'ordre du document):
ANDRIEU Olivier, "Mini-réplique de Panda lancée par Google", in Abondance Actualité, 22/11/2011, http://actu.abondance.com/2011/11/mini-replique-de-panda-lancee-par.html
BRUDIEUX Jérémie, "Google Panda: algorithme d'une domination pertinente", in UniVersDoc, 27/10/2011, http://bloguniversdoc.blogspot.com/search?updated-max=2011-11-03T18:22:00%2B01:00&max-results=7
La rédaction, "Google améliore encore son algorithme: 35% des requêtes impactées", in Journal du Net, 03/11/2011, http://www.journaldunet.com/solutions/moteur-referencement/mise-a-jour-google-1111.shtml
Commentaires du site Abondance Actualité, 22 et 23/11/2011, http://actu.abondance.com/2011/11/mini-replique-de-panda-lancee-par.html
La rédaction, "Google Panda: le comparateur de prix Twenga passe à l'offensive", in ZDNet.fr, 02/11/2011, http://www.zdnet.fr/actualites/google-panda-le-comparateur-de-prix-twenga-a-l-offensive-39765284.htm
La rédaction, "Concurrence déloyale: Google plaide non coupable", in ZDNet.fr, 21/09/2011, http://www.zdnet.fr/actualites/concurrence-deloyale-google-plaide-non-coupable-39764130.htm
JUHAN Virgile, "Google Panda: les plus fortes baisses de visibilité en France", in LeJournalduNet, 17/10/2011, http://www.journaldunet.com/solutions/moteur-referencement/google-panda-l-impact-en-france/panda-les-plus-fortes-baisses-en-france.shtml
1 : référence à l'ouvrage de ICHBIAH Daniel, Comment Google mangera le monde, 2010.

mardi 22 novembre 2011

Vers une TVA à 7% pour le livre numérique ?

Alors que Nicolas Sarkozy s'engage à appliquer le taux de TVA de 7% sur les livres numériques, la Commission européenne a un autre avis sur l'affaire.

Reprenons les faits - le livre papier bénéficie aujourd’hui d'un taux de TVA réduit à 5,5% (7% au 1er janvier 2012). Cette exception ne s’applique pas au livre numérique qui s'est vu infliger le taux de base - 19,6%. La situation paraît absurde et a fait l'objet de longs débats sur les spécificités du livre numérique par rapport au livre papier qui justifieraient (ou non) les différent taux appliqués. Du côté de la loi française, l’alignement de la la taxe a été prévu il y a un an, par une législation qui devait entrer en vigueur au 1er janvier 2012. Le long délai devait servir à négocier ces termes avec la Commission européenne, mais apparemment, les négociations n’ont pas abouti et la France risque de se retrouver en infraction au 1er janvier. Indépendamment des réflexions sur la nature spécifique de ce produit, l'e-book ne figure par sur la liste de secteurs qui peuvent bénéficier de la TVA réduite. Une telle décision exige l'unanimité des États membres et on est loin de là.

Alors que l’alignement de la TVA paraît logique, une question se pose sur ce produit qui en fonction de son support ne retombe pas dans la même catégorie d’objets. Certes, un livre n’est pas un produit comme les autres, mais qu’est-ce qui devrait alors décider de sa classification : son contenant ou son contenu ? Le livre électronique est-il tout simplement un livre ou plutôt un logiciel, un jeu vidéo, une base de données... ? La distinction, pourtant flagrante (mise en avant dans le rapport Zelnik sur la création et Internet) entre le livre homothétique (copie numérique du livre papier) et le livre enrichi, semble complexifier le paysage quand employé dans le contexte de la TVA ou de la loi sur le prix unique. La tendance du législateur serait plutôt à faire le distinguo entre le livre papier et le livre électronique homothétique d’un côté et le livre enrichi de l’autre. Et pourtant les enjeux du numérique se situent plutôt du côté de l’enrichi.

Il sera sans doute intéressant d’observer cette situation et son impact sur le marché de l’édition électronique en France. A suivre !

Sources :

http://actu-des-ebooks.fr/2011/11/22/tva-7-pour-cent-sur-le-livre-numerique-pourquoi-ca-coince/
http://bibliobs.nouvelobs.com/numerique/20101217.OBS4922/tva-reduite-pour-le-livre-numerique.html
http://www.lesechos.fr/entreprises-secteurs/tech-medias/actu/0201736882150-la-tva-reduite-sur-le-livre-numerique-dans-la-ligne-de-mire-de-bruxelles-247028.php
http://aldus2006.typepad.fr/mon_weblog/2011/11/sarkozy-tva-%C3%A0-7-pour-le-livre-num%C3%A9rique.html

E-reader : un succès attendu qui pourrait faire bouger les "lignes" du marché des tablettes


Face à l'arrivée des tablettes sur le marché de l'e-book, on aurait pu craindre la disparition de la "liseuse" ou "livrel", comme la nomme certains. Il n'en a rien été, bien au contraire. L'expérience très proche de celle du papier qu'offre aujourd'hui la technologie d'E-Ink avec ses écrans e-paper et la nette baisse des prix chez les distributeurs annoncent de belles perspectives pour ces appareils dédiés à la lecture...


Petit rappel historique

Si le Kindle, le lecteur de livres d'Amazon, est lancé en novembre 2007, la lecture sur appareil mobile débute dix ans auparavant. On lit d'abord sur son ordinateur - portable ou non - avant de lire sur les agendas électroniques. Suivent ensuite les premiers smartphones de Nokia et Sony Ericsson. Parallèlement, on voit l'émergence de tablettes de lecture dédiées.
Les premières sont le Rocket eBook, ou le Gemstar eBook, et ne durent pas. Après une période morose, des tablettes plus légères gagnent en puissance et qualité d'écran, par exemple le Cybook ou le Sony Reader, auquel s'ajoute le Kindle d'Amazon en novembre 2007. L'écran LCD laisse enfin la place à un écran tactile, utilisant la technologie E Ink, sans rétro-éclairage permettant un confort visuel fabuleux.


Des évolutions spectaculaires en terme de vitesse, d'écrans et de tactile

Il y a encore peu de temps, le "reader" était confronté à la complexité des menus, à un manque de performance dans l'affichage avec des saccades régulières, sans parler du téléchargement fastidieux des ebooks via un câble USB... oubliez tout ça !
Les appareils aujourd'hui proposés sur le marché sont impressionnants de souplesse dans l'interface : changement de police en un instant, fonctionnalités de recherche pleinement abouties, sauts de pages quasi-instantanés. Sans parler de leur finesse et de leur légèreté : seulement 170 grammes par exemple pour le dernier Kindle...

La distinction avec les tablettes ne s'arrête pas là. Aujourd'hui proposé à 99 euros, le Kindle d'Amazon devient très abordable. A grand renfort de marketing et de communication sur toutes ces innovations, l'hypothèse des 70 à 90 millions de readers sur le marché en 2017 (chiffre donné la semaine dernière par le site PrintedElectronicsWorld) pourrait devenir réalité.


Le passage à la couleur, une nouvelle étape

La couleur arrive, certes pour l'instant limitée, mais elle est là. Couplée à la vitesse qui est désormais correcte, on peut élargir la lecture à de nouveaux types de contenus : magazines, livres illustrés, livres pour enfants. Le premier modèle de cette génération d'écrans sera commercialisé au mois de décembre aux Etats-Unis.

De nouvelles technologies sont aussi en préparation et sont des concurrentes très sérieuses à l'encre électronique. On trouve par exemple l'entreprise Qualcomm et son écran Mirasol, très attendu et qui commencera à être commercialisé au 2nd semestre 2012, ainsi que la technologie Liquavista de Samsung.


N'en déplaise à Frédéric Beigbeder, si les éditeurs et les libraires numériques savent en saisir l’opportunité, cette évolution représenterait un environnement technologique et culturel au sein duquel les livres numériques, sous des formes variées, peuvent devenir un mode naturel d’accès à la lecture pour toute une génération...



Sources:
http://cnetfrance.fr/blog/l-ecran-mirasol-fait-sa-premiere-apparition-sur-un-e-reader-39765891.htm
Marie Lebert, Une courte histoire de l'e-book, , Dossiers du NEF
http://actu-des-ebooks.fr/
http://www.e-reader-info.com/



vendredi 18 novembre 2011

Ressources éducatives libres : quelques grands acteurs

Dans le domaine de la formation, il existe maintenant de nombreux cours en ligne gratuits. Ainsi, dans le domaine qui m’intéresse (l’enseignement des langues et la linguistique), je découvre régulièrement des sites proposant des cours, des échanges linguistiques, des entrainements linguistiques sous différentes formes.
Dans ce paysage, ce qu’on appelle les Ressources Éducatives Libres, occupent une place spécifique.Elles s’inscrivent dans le courant « WIKI », elles s’appuient toujours sur une notoriété (même acquise récemment), elles ont un mode de financement spécifique (financement par la communauté via des dons par exemple, produits dérivés, mécénat public ou privé).

La première d’entre elle, Wikipedia, définit ce concept de la façon suivante :
« L'expression Ressources Éducatives Libres (REL) (de l'anglais « Open Educational Resources ») désigne un mouvement mondial initié par des fondations, universités, enseignants et pédagogues visant à créer et distribuer via internet des ressources éducatives (cours, manuels, logiciels éducatifs, etc.) libres et gratuites. »
http://fr.wikipedia.org/

Voici 3 exemples à découvrir (ou redécouvrir) :

Le plus connu : Wikimedia

Wikimedia est une marque de la Wikimedia Foundation et le nom qui chapeaute les projets que soutient cette fondation ; il s'agit du projet d'encyclopédie en ligne Wikipédia, que nous connaissons tous.
Il existe d'autres projets, avec la même philosophie. A titre d'exemple, voici deux projets liés au langage :

WIkiquote : un projet libre de collecte de citations. De nombreuses catégories d’hommes célèbres y sont répetoriées. Dans la catégorie Chanteur, cela va par exemple de Akhenaton à Frank Zappa
http://fr.wikiquote.org/

Le Wiktionnaire, branche francophone du projet Wiktionary. C'est un dictionnaire libre et gratuit que chacun peut améliorer.Le site annonce actuellement 2 097 040 articles décrivant en français les mots de plus de 900 langues (et le site invite à s’entrainer à rédiger des articles dans le « bac à sable »).
http://fr.wiktionary.org/wiki/Wiktionnaire


Celui qui vise le plus à l’accès à la connaissance pour tous : Open Training Platform de l’Unesco


Un petit rappel, l’acronyme UNESCO signifie : United Nations Educational Scientific and Cultural Organization.
La plateforme s’inscrit donc dans la philosophie de cet organisme. “UNESCO facilitates a collaborative access to existing free training courses and promotes open licensed resources to specialized groups and local communities for development.” Elle offre un espace collaboratif structuré pour partager les formations déposées par les utilisateurs.
A ce jour, la plateforme annonce 3508 cours, 293 catégories, 6052 membres.
Un bref passage dans la catégorie langage, permet de voir la diversité des ressources proposées : initiation au polonais, langue cree, phonétique de l’anglais, etc.
http://opentraining.unesco-ci.org/


Le plus prestigieux : OpenCourseWare du MIT

Cette plateforme existe depuis 2001. Elle repose sur l’accord des enseignants volontaires pour publier l’ensemble de leurs matériaux de cours. Ils proposent aujourd’hui plus de 2000 unités d’enseignement.
Leur mot d’ordre : « Unlocking Knowledge,Empowering Minds.”
Et le contenu est annoncé de façon claire, dès la première page : « Free lecture notes, exams, and videos from MIT.No registration required.”
http://ocw.mit.edu/index.htm

Marie-Pierre Geron



Source :

Olivier Ertscheid. Les enseignants, la formation en ligne et les ressources éducatives libres : quel mode de financement ? Documentaliste - Sciences de l'information - 2011, vol.48, n°3.