jeudi 4 novembre 2010

Blekko, une alternative à Google ?


Blekko , tout juste lancé en version bêta le 1er novembre 2010, se propose comme une alternative à Google, le géant sur le marché des moteurs de recherche (65% de part du marché).




Ce moteur de recherche nouvelle génération se fonde sur le "crowd sourcing", c'est-à-dire sur la contribution des internautes eux-mêmes
.


Un moteur de recherche participatif

Le participatif est une recette qui marche, pourquoi ne pas l'appliquer à un moteur de recherche ? C'est ce que s'est dit Rich Skrenta son fondateur en 2008.

Blekko est bien un moteur de recherche full web, avec des analyses régulières de l'ensemble des pages Web. Mais, sachant qu'il ne peut battre Google à ce niveau, il se différencie en offrant aux utilisateurs de nouveaux outils de recherche. Il s'agit alors d'aller au-delà des modèles mathématiques utilisés par des moteurs de recherche tel que Google, qui fait notamment un classement des pages web les plus consultées, et d'utiliser plutôt la contribution des internautes. Ce modèle collaboratif, à l’instar du modèle wiki, permet, selon le président et fondateur de Blekko, de “trouver de la signification dans les milliards de pages du Web”.

Les objectifs de ce moteur de recherche nouvelle génération

Le moteur Blekko répond à plusieurs grands principes, énoncés par son fondateur :

1. La recherche est ouverte à tous
2. Les résultats de la recherche doivent impliquer les utilisateurs
3. Les classements des données ne doivent pas être tenus secrets
4. Les données sur le Web doivent être facilement accessibles
5. Il ne doit pas y avoir une approche unique pour la recherche
6. Le mode "recherche avancée" doit-être accessible
7. Les moteurs de recherche doivent disposer d'outils ouverts à tous
8. La recherche et la communauté doivent évoluer main dans la main
9. Il faut lutter contre les spams et les sites pollués par l'abondance de liens
10. Il faut s'assurer que la confidentialité des utilisateurs ne sera pas violée


Une nouvelle fonctionnalité : les slashtags

La principale caractéristique de différenciation de Blekko, par rapport aux moteurs de recherche classiques, repose sur une nouvelle fonctionnalité : l'utilisation de slashtags. Des contributeurs volontaires attachent un "/" à des mots-clés qu'ils trouvent dans des pages web qu'ils jugent intéressantes et informatives. Ces "slashtags", comme les hashtags de Twitter, permettent de catégoriser les informations, afin qu'elles soient repérées ensuite par le moteur de
recherche.

L'internaute dispose de slashtags prédéfinis pour chercher tout de suite, et n'importe qui possédant un compte peut en créer. Des exemples de slashtags populaires : /date, /map, /people, /blogs, et pour chercher également dans des sites : /Twitter /Amazon /flickr. Ainsi, pour illustrer, pour faire une recherche sur le jaguar, l'animal, il faudra chercher jaguar/animals et pour la jaguar la voiture, il faudra chercher jaguar/car. L'objectif est d'éviter l'affichage de résultats non pertinents et ainsi circonscrire la recherche.


Des avantages, mais des inconvénients majeurs

Par rapport à Google, Blekko veut privilégier la qualité des réponse à la quantité et il cherche à réduire le spam. Lorsque l'on tape le nom de domaine d'un site, Blekko fournit des liens spécifiques affichant de nombreuses informations intéressantes pour le référencement comme les backlinks, les stats de crawl, le duplicate content identifié sur le site,... etc. Il propose donc des atouts SEO (search engine optimization) intéressants pour le référencement.

Toutefois, il demeure certains inconvénients majeurs : l'interface et les slashtags sont uniquement en anglais, il faut être inscrit et se logger pour créér des slashtags et la performance de la recherche d'information reste à étudier.

Source : http://actu.abondance.com.


Un moteur qui pose la question de la participation des internautes : une utopie ?

Selon Rick Skrenta " Il n'y a pas besoin que tout le monde participe : la plupart des gens n'éditent pas Wikipédia, et pourtant cela a donné une vaste encyclopédie qui dépasse depuis longtemps l'encyclopédie fermée Britannica".


Pour conclure, Blekko n'a pas vocation à remplacer Google, mais il se présente
comme un moteur de recherche différent et innovant disposant de gadgets attractifs.



mercredi 3 novembre 2010

La BNF et le numérique

La Bibliothèque Nationale de France s'est souvent illustrée comme innovatrice dans l'ère des nouvelles technologies et de la documentation. Son fonds documentaire est immense depuis son ouverture. Un tel lieu se devait de le faire partager au plus grand nombre grâce aux nouvelles technologies : elle devint pour cela une des pionnières à créer une "bibliothèque numérique".

Gallica
Depuis 1997, la BNF a mis en place Gallica, un fonds documentaire entièrement numérique. Les équipes de documentalistes répertorient, indexent et mettent à disposition de nombreuses ressources accessibles à tous (imprimés, périodiques, documents visuels ou sonores, cartes, etc.) dans des domaines très divers, allant de l'histoire à l'économie, en passant par les sciences, la littérature ou même le droit.
Le grand intérêt de ce système est la gratuité de son accès. Cependant, il est toujours utile de préciser que le fonds ne se compose que de documents libres de droits d'auteur ; pour tout autre ouvrage, la bibliothèque traditionnelle existe toujours et les rend consultables sur place.Il faut également ajouter que nombre de documents sont indexés sur Gallica mais ne sont pas disponibles directement depuis le site. Ceux-ci appartiennent aux partenaires de la bibliothèque, dont les fonds furent jugés complémentaires, et leur consultation est spécifique à chacun d'entre eux.
Depuis quelques mois, Gallica s'est également tourné vers les plus jeunes avec la "Bibliothèque numérique des enfants", reprenant le système d'accès gratuit à des ouvrages enfantins en plus d'autres rubriques : la salle de lecture, le cabinet des curiosités et la salle des jeux, pour faire évoluer les enfants dans le monde littéraire tout en s'amusant, ainsi que le coin des parents et le coin des enseignants, pour se documenter sur l'univers enfantin (source : Archimag). Ce projet illustre la volonté de la BNF de diffuser la documentation à tous les publics et non pas simplement aux chercheurs, enseignants et étudiants.

Partenariat avec Microsoft
Le 7 octobre 2010, la BNF et Microsoft officialisent leur partenariat pour l'accès au fonds documentaire de la bibliothèque par le biais du moteur de recherche Bing (Microsoft). Cet accord va permettre de rendre plus accessible les ressources déjà numérisées de la BNF. Environ 1.2 millions de documents, tout support et tout type confondus, sont concernés, toujours ceux libres de droits d'auteur (Source : Archimag)
Ce partenariat suit la logique des objectifs fixés par les deux parties : la BNF veut augmenter son accessibilité à Gallica, avec certainement une volonté d'être parmi la référence en matière de ressources numériques sur ce marché déjà concurrentiel ; Microsoft veut améliorer la popularité et l'utilisation de son moteur de recherche Bing, toujours devancé par Google (celui-ci ayant déjà un accès à des ressources numériques par le biais de son application Google Books).
"Cet accord avec la BnF [...] marque une étape décisive dans la concrétisation de notre vision de la recherche sur internet en France : la collaboration avec les institutions et partenaires français dans le respect de leur identité, de la propriété intellectuelle et du développement de la société de la connaissance" explique Steve Ballmer, président de Microsoft (source : BNF).

Serait-ce le début de véritables collaborations entre les moteurs de recherche et les centres de ressources ? Cet accord tente à apporter de l'optimisme quant à ce sujet : rendre une grande partie, peut-être même l'intégralité, des ressources disponibles par les différents centres de documentation français visibles sur Internet. Le passage vers l'ère numérique s'illustre de plus en plus, en espérant qu'il ne fera pas oublier l'importance de ces lieux physiques où sont stockés ces documents.

mardi 2 novembre 2010

Le cloud computing : quels enjeux pour le records management ?

Le "cloud computing" ou "infonuagique" est "un modèle informatique qui, par l'entremise de serveurs distants  interconnectés par Internet, permet un accès réseau, à la demande, à un bassin partagé de ressources informatiques configurables, externalisées et non localisables, qui sont proposées sous forme de services, évolutifs, adaptables dynamiquement et facturés à l'utilisation." (D'après le Grand dictionnaire terminologique  de l'office québècois de la langue française http://www.granddictionnaire.com/BTML/FRA/r_Motclef/index800_1.asp)

Actuellement, de nombreuses applications sont disponibles autant pour les particuliers que pour les professionnels. Elles offrent de nombreux services tels que la mise à disposition de logiciels de messagerie, de bureautique, ou encore d'archivage (software), que des capacités de calculs et de stockage via des serveurs (hardware).

Cette technologie en expansion pourra être à l'avenir un outil quotidien au traitement de l'information, et va notamment donner la possibilité aux entreprises d'externaliser les données qu'elles stockent.

Cloud computing et Records Management....

Le records management, ou archivage, est "l'organisation et le contrôle de la constitution, de la conservation et de la destination finale des documents d'une administration, d'une entreprise ou d'un organisme." (D'après le JO de la République française n°0094 page 6949 texte n°83 du 22 avril 2009).

Dans son activité le records manager pourrait être amené à utiliser des zones de stockage externalisés. Cela permettrait entre autre de réduire les coûts de logiciel ou de serveurs pour une entreprise, puisque ce type de dépenses ne se limiteraient alors qu'à l'achat d'accès aux services d'archivage.

Même si le Records Management fait l'objet d'une norme internationale (ISO 15489), il semble que de nombreuses interrogations demeurent, quant à la question de l'archivage électronique, et à l'utilisation de ces services, comme peuvent l'attester les groupes de travail de l'Association pour le développement de l'informatique juridique sur le Cloud computing (ADIJ).

Le cloud computing, une révolution contractuelle? Atelier organisé par l'ADIJ, 25 octobre 2010.
Le cloud computing, révolution ou évolution informatique? Atelier organisé par l'ADIJ, 23 septembre 2010.

Actuellement, ces groupes réfléchissent sur les aspects juridiques de l'emploi de ces technologies comme: l'authenticité, la confidentialité, la sécurité des données des utilisateurs, la garantie de ces services et sur le droit auquel est soumis leur utilisation.

Autrement dit, quel niveau de sécurité peut-être garanti aux utilisateurs de ces technologies?
Qui peut avoir accès aux données? Où sont-elles stockées? Est-il possible de retirer les données d'un cloud pour les transférer vers un autre? Une fois les données retirées, toutes les copies sont-elles détruites au sein du cloud?

En cas de clash informatique, quelle est la garantie apportée pour la récupération des données? En cas de problème quel recours juridique a l'utilisateur?

Bien que cette technologie puisse proposer de nombreux avantages, celle-ci demande encore une bonne connaissance et une vigilance lors de son utilisation. En effet, le cadre d'utilisation ne semble pas encore totalement stabilisé.


Livres numériques : casse-tête économique pour les bibliothèques

En date du 2 novembre 2010 le quotidien Le Parisien annonçait que la bibliothèque départementale des Yvelines et le MOTIF (observatoire du livre et de l'écrit en Ile-de-France) allaient mettre à disposition de six bibliothèques municipales des liseuses électroniques jusqu'au 30 avril 2011.

D'autres villes comme Issy-les-Moulineaux, Grenoble, ou Nîmes ont déjà passé le cap de l'expérimentation pour intégrer complètement le livre numérique dans leurs bibliothèques municipales.

Ces bibliothèques ont décidé de voir le livre numérique comme un service en plus à proposer à leur public, quitte à compliquer leur gestion budgétaire. En effet, la TVA à taux réduit qui s'applique aux livres (5,5%) ne concerne que le format papier, le format numérique étant taxé à hauteur de 19,6%. Certes, les éditeurs concèdent des ristournes, mais celles-ci ne compensent pas l'écart entre les deux taux de TVA.

Malheureusement, la décision du Sénat de rejeter la TVA à 5,5% sur les livres numériques (source : site Archimag) , risque de freiner ce mouvement d'intégration de ce format dans l'offre proposée par les bibliothèques municipales qui ont souvent un budget limité.

Dans son dossier sur le livre numérique, Documentaliste Sciences de l'information explique d'ailleurs que la TVA est le frein principal au développement du numérique dans les bibliothèques, et ce au niveau européen.

Il semble donc urgent que la Commission européenne se penche sur ce problème, qui ne peut avoir que des effets négatifs sur le long terme sur la diffusion auprès du public du savoir et de la culture.

mercredi 6 octobre 2010

Millésime 2010 du Blog UniVersDoc

Les futurs chefs de projet en ingénierie documentaire formés à l'INTD vont se relayer à partir du mardi 2 novembre 2010 pour vous offrir leur vision de l'actualité en Information-Documentation.

Etudiants, professionnels de l'information, enseignants en Info-Doc n'hésitez pas à nous faire part de vos commentaires !

A très bientôt.

dimanche 4 juillet 2010

Qu'est ce qu'une ontologie ?

Terme grec créé au XVIIè siècle, l'ontologie est définie comme la théorie de l'être en tant qu'être. C'est à dire l'étude des propriétés générales de tout ce qui est. Le mot ontologie est considérablement plus récent que la discipline qu'il désigne. Les Grecs qui ont inventé la question de l'être, n'ont pas appelé ontologie la discipline qu'ils constituaient. Aristote désigne de façon indirecte comme "la science que nous cherchons" la théorie de l'être en tant qu'être. Le travail sur l'ontologie consiste donc à déterminer ce qui est universel d'un être, par delà ses représentations particulières. [Encyclopédie Universalis]

...à l'ingénierie des connaissances
L'ontologie est utilisée depuis plusieurs années dans l'ingénierie des connaissances et dans l'intelligence artificielle pour structurer les concepts d'un domaine.
Une ontologie définit un vocabulaire commun pour la recherche et le partage de l'information dans un domaine. Elle contient des définitions lisibles en machine des concepts de base de ce domaine et de leurs relations.
Elle est aujourd'hui devenue une composante dans bon nombre d'applications et est appelée à jouer un rôle central dans la construction du Web des données.
Comme les autres catégories d'outils langagiers tels que le thésaurus et autres nomenclatures, les ontologies associées à des bases de connaissances constituent une couche sémantique qui améliore le rendu de la recherche et les langages de navigation tout en assistant l'utilisateur. La BNF propose sur son site un guide (à télécharger) pour élaborer une ontologie ainsi que les logiciels libres s'y afférant.

Ontologies et thésaurus
Dans l'univers du traitement automatique de l'information, les ontologies informatiques peuvent être considérées comme les successeurs logiques des thésaurus, l'étape supérieure du point de vue linguistique. Elles contribuent à l'amélioration de la recherche documentaire, à l'automatisation de l'indexation ou encore à l'accessibilité et à la visibilité du produit sur le Web. L'étendue des applications est relativement vaste. En revanche, il est encore relativement difficile de savoir ce qu'il est possible de faire de plus avec une ontologie par rapport à ce que l'on est déjà capable de faire avec un thésaurus.
Les applications ne savent pas encore bien exploiter l'apport des ontologies du point de vue de la rigueur de leur structuration. Le thésaurus a évidemment les défauts et les qualités inverses. Il est souple et facile à utiliser. Cependant, son utilisation est vite empêchée par le manque de rigueur dans la structuration des termes et dans leur organisation.
Il est davantage adapté à l'utilisation par un humain, comme un documentaliste ou un ingénieur. L'ontologie sera davantage utilisée par des machines, dans des systèmes informatiques dans lesquels on sera capable de spécifier une exploitation automatique.
Synthèse de l'entretien de Bruno Bachimont, directeur scientifique de l'INA et enseignant-chercheur à l'Université de Compiègne. 2006

jeudi 27 mai 2010

Art & Doc

Croisé lors de l'exposition La Force de l'Art 02, Julien Prévieux est jeune artiste contemporain qui se sert notamment de l’organisation des savoirs et l’accumulation des connaissances comme base de réflexion pour la conception de ses installations en y ajoutant une dose d’absurde. Ainsi cette bibliothèque en forme de cercle (qui n'est pas sans rappeler la Tour de Babel) composée uniquement d'ouvrages désuets qui donne à voir un savoir et/ou des postures intellectuelles désormais révolus, prenant ainsi le contrepied de la posture du documentaliste.
Autre exemple de détournement, La Somme de toutes les peurs, cartographie élaborée à partir d’un logiciel de Data Mining. Outil « d’aide à la décision », le Data Mining se propose d'utiliser un ensemble d'algorithmes issus de disciplines scientifiques diverses (statistiques, intelligence artificielle, base de données) pour extraire, à partir d'un important volume de données brutes, de connaissances originales auparavant inconnues en mettant à jour des corrélations entre les données. L’objectif ainsi poursuivi est de mieux comprendre les liens entre des phénomènes en apparence distincts et d'anticiper des tendances encore peu discernables. En l’appliquant au scénario d’un film catastrophe (dont l’œuvre est éponyme), l’artiste aboutit à un « arbre de décision » qui prend la forme d’un immense graphique aux méandres infinis, imbroglio de lignes et de termes qui se croisent en quelques nœuds significatifs. Utilisé ici en contre-emploi, la tentative de clarification produit paradoxalement une grande confusion, sorte d’ultime scénario paranoïaque.