Enseignement
Recherche d'Information, Thesaurus, ontologies et Web sémantique
La RI, le modèle vectoriel et ses extensions
PageRank de Google
Thesaurus en ligne
Ontologies en ligne
Web sémantique en ligne : généralités
- quelques transparents de cours (en pdf)
- un exposé multimédia très bien, par Rose Dieng-Kuntz, une spécialiste française du domaine (décédée en 2008)
- un site de référence en français
- un tutoriel pédagogique (en anglais) qui fait la synthèse de tout ce qu'il faut savoir, fondé sur le moteur français Corese (réalisé par l'équipe dont Rose Dieng-Kuntz était responsable)
- la page officielle du web sémantique, avec des liens vers plein d'articles et d'exposés
Notation 3 et RDF
- site d'introduction à la notation 3
- exemple de fichier de présentation personnelle (minimal) en notation 3
- le site de CWM, le moteur d'inférence pour la notation 3 écrit par Tim Bernes-Lee. C'est un code source en python, le programme principal cwm.py est dans le dossier swap.
- le fichier de présentation en n3 est traduisible en RDF avec CWM avec la commande (à condition d'être dans le bon dossier) :
$ python cwm.py presentation.n3 -rdf > presentation.rdf
on obtient ce fichier en RDF
- les spécifications de RDF en français
- site du RDF validator
- quand on soumet au validator le fichier .rdf précédent, on obtient ce dessin de graphe
- un exemple de base pour l'inférence : fichier en n3 exprimant "tous les hommes sont mortels" et "Socrate est un homme". Il n'est pas traduisible en RDF car il comporte une règle. Pour en déduire "Socrate est mortel", après avoir installé CWM, lancer (depuis le bon dossier) la commande :
$ python cwm.py socrate.n3 -filter=socrate.n3
- l'exemple classique des relations familiales : un arbre généalogique en n3. Il est traduisible en RDF.
- une liste de fonctions logiques et mathématiques utilisables dans des fichiers de règles en notation 3.
- le fichier genealogie.n3 (règles en notation 3 pas traduisibles en RDF) comportant la définition des autres liens de parentés. Ce fichier joue le rôle d'une ontologie ! Pour déduire de nouveaux faits à partir de ces deux fichiers, lancer la commande :
$ python cwm.py genealogie.n3 mon_arbre.n3 -think -filter=genealogie.n3 (l'option -think permet d'itérer le chaînage avant autant que possible).
- après combinaison du fichier obtenu précédemment et du fichier original, on obtient : arbre_total.n3 (en version rdf)
- un autre exemple d'associations entre faits et règles : un fichier de faits et de règles géographiques, à partir duquel on peut faire des inférences pour obtenir ce fichier géographique complet
(et sa version rdf)
- Un fichier de localisation des personnes en n3 (version rdf).
- Un fichier qui synthétise toutes les informations en n3 des trois fichiers précédents. Il a été obtenu par cwm en appliquant la commande :
$ python cwm.py arbre_total.n3 geographie_total.n3 localisation.n3 > base_totale.n3
La version rdf correspondante (en renommant certains préfixes pour ne faire référence qu'aux fichiers .rdf)
SPARQL
- un tutoriel sur SPAQL (lire surtout les 5 premières pages) et une interface d'interrogation en ligne (vous pouvez tester les exemples du tutoriel en utilisant les fichiers de données qui y sont associés) :
- dans la zone "target graph URI", mettre l'URI complète du fichier .rdf source des données
- dans la zone de saisie centrale, taper la requête (pas de virgule pour séparer deux variables)
- des exemples de requêtes portant sur le fichiers rdf précédents (tous stockés dans le dossier fichiersn3/ de mon URI perso) et leur correction.
- DBpedia : (une partie de) Wikipédia traduit en RDF, et des liens vers plein de moyens pour explorer les informations qui y figurent !
- une adaptation de Firefox pour "naviguer" dans des fichiers RDF (intégrant SPARQL) : le Tabulator