BLOG : TOUTES CATEGORIES

Outils pour l'analyse de données textuelles issues de la recherche d'information experte

versionz - complexity

Je publie ici en pièce jointe Ergoteur 0.1, sous GPL3, un ensemble d'outils bash (avec un chouilla de perl et de python) pour l'analyse de données textuelles dans le style de Alceste. A la différence d'outils qu'on trouvera dans le CPAN de Perl, ces outils sont personnalisés et très maniables, après un peu de pratique. Les scripts créent des classes de discours à partir d'un texte (algorithme à améliorer cependant), le divise en sections, font de l'analyse de fréquence de mots. Des exemples de textes sont inclus, il s'agit d'une interview que j'ai réalisé auprès d'étudiants de l'INSA dans le cadre d'une recherche experte. Une documentation a minima est fournie, contactez-moi pour le support.

On trouvera ici 4 documents :


LICENSES
Attention, seul le code source est sous license GPL3, less autres documents suivent la license du blog Creative Commons Paternité 2.0 France License.
Les dictionnaires de fréquences sont issus de documents produits par la Direction générale de l'Enseignement scolaire.
Le dictionnaire de lemmes est issu du projet SnowBall.
Bien que les auteurs de ces deux projets diffusent actuellement ces documents sur leur site, ils n'ont pas actuellement donné leur accord au 3/9/2009 pour une autre diffusion ; si vous souhaitez utiliser ces dictionnaires, utilisez les liens ci-dessus !

Photo : Versionz, Complexity.

2011-08-05 13:35:20

Alerte aux traces !

alerte aux traces CNIL, mai 2009

La CNIL continue de produire sa campagne d'information sur les traces sur Internet, sur la route ou sur les transports. Je cite :


“Dans un monde largement informatisé, la loi du 6 janvier 1978 prévoit de solides garde-fous pour protéger les personnes des dangers liés aux fichiers et aux traitements informatiques contenant des données à caractère personnel. La loi «Informatique et libertés» reconnaît aux citoyens des droits spécifiques pour préserver leur vie privée”.
2011-08-05 13:35:20

Lyon et le logiciel libre

N'étant plus à Lyon, d'autres que moi pourront profiter d'évènements organisés par l'Aldil, comme des conférences de Richard Stallman (président de la Free Software Foundation) et de Dave Neary (très bon développeur lyonnais de gnome).

geekz.co.uk_lovesraymond_wp-content_images_ep066.jpg

- Un évènement EXCEPTIONNEL, le 13 janvier à 18 h 30, réception de celui qui est considéré comme l'inventeur du logiciel libre : Richard Stallman. Il donnera une conférence en français sur le thème : “Logiciel libre. Société Libre”. Un bienfaiteur de l'humanité dont le nom est à retenir et qui a pour devise : “Liberté, égalité, fraternité”.Grand amphithéâtre de l'université Lyon 2, 18 quai Claude Bernard dans le 7e arrondissement de Lyon. http://www.aldil.org/events/conference-de-richard-stallman
- Le 7 janvier à 19 h 30 : intervention de Dave Neary destinée aux “ambassadeurs du libre” : comment présenter le logiciel libre à des personnes qui l'ignorent.Maison pour Tous / Salle des Rancy, 249 rue Vendôme dans le 3e.
http://www.aldil.org/events/jeudi-du-libre-201001/view
- Trois occasions de se mettre aux logiciels libres avec l'aide de l'ALDIL lors “d'install parties” : 9 janvier à la Maison pour Tous / Salle des Rancy, 30 janvier à la BM de la Part-Dieu et 6 février à la BM du 2e arrondissement (voir l'agenda de l'ALDIL pour les détails :
http://www.aldil.org/calendrier.
Inscription recommandée pour recevoir une aide à l'installation.A votre disposition pour toute information.Cordialement.– Jean-Yves ROYER Secrétaire de l'ALDIL http://www.aldil.org
2009-12-30 14:26:49 · Thibaud Hulin
blog/start.txt · Dernière modification: 2012-02-14 12:18:16 (modification externe)
[unknown link type]Haut de page
GNU Free Documentation License 1.3
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0