Pas encore inscrit ? Creez un Overblog!

Créer mon blog
CassisEuphorique748295

CassisEuphorique748295

Tags associés : programmation

Ses blogs

La ville Marseille vue par la presse internationale

calanquesetptitstrafics.over-blog.com
CassisEuphorique748295 CassisEuphorique748295
Articles : 17
Depuis : 11/10/2013
Categorie : Emploi, Enseignement & Etudes

Articles à découvrir

Victoire!!!

Enfin, enfin! la solution pour les problème du finnois a enfin été trouvée!!! depuis le début nous n'avions pas eu besoin d'avoir à dos2unix (étant donné que nous travaillons sous cygwin), or monsieur fleury a eu la bonne idée de nous faire exécuter la commande cat -a sur notre fichier d'url en finnois, et c'est la que nous nous sommes re
Un peu de style ne nuit pas ...

Un peu de style ne nuit pas ...

Depuis le début nous nous sommes contentées d'avoir une page très minimaliste, sans séparation entre les tableaux, sans couleurs, bref, rien. je me suis donc penchée un peu sur le problème pour que cela soit visuellement plus acceptable. pour commencer, je me suis occupée du titre. j'ai définis un style h1 que j'allais ensuite appliqué au
Le Trameur

Le trameur

Dernière analyse possible sur nos corpus d’articles, le trameur. alors, parce que ce n’est pas forcément évident, un trameur, qu’est-ce que c’est ? un trameur est un logiciel, un peu comme une « moulinette », qui va analyser notre texte en nous donnant la fréquence de chaque mot puis dans quel contexte il s’inscrit, cela veut dire q
Trameur – Round 2 (Français, Anglais, Espagnol)

Trameur – round 2 (français, anglais, espagnol)

Après une petite discussion avec mr. fleury, nous nous sommes rendues compte que les graphs du trameur et les analyses que nous avons faites jusqu’à présent … ne sont pas forcément très justes. enfin, « justes » n’est pas le mot, disons plutôt « adapté ». donc on efface (presque) tout et on recommence ! avant toutes explications su
Trameur – Round 2 (Finnois)

Trameur – round 2 (finnois)

Tout d'abord, nous constatons que lorsque "marseille" est évoqué dans la presse finlandaise c'est essentiellement associé au sport. en effet, les termes "anchelotti", "fanien psg" (fan du psg), "manchester united", "pelaajat" (joueurs) et "0" (qui est relatif aux résultats de matchs) sont en lien avec le millieu sportif, le football plus partic

Des trous, des trous, oui mais maintenant on sait pourquoi!

Comme nous l'avions précisé dans le dernier billet, nous avions quelques problèmes sur les erreurs soit en aspiration de pages, soit en dump. et bien nous avons désormais la réponse, ou plutôt les réponses. la première inconnue était de savoir pourquoi le tableau sautait 10 lignes pour les articles en anglais. après une rapide recherche,
Préparation du site

Préparation du site

Bien qu'il nous reste encore à faire tourner le trameur sur nos contextes globaux et à analyser le résultat que nous donnera ce dernier, nous devons dès maintenant nous concentrer sur la création du site que nous allons devoir fournir à la fin! pour cela, le plus simple est de trouver un squelette de site (gratuit ou non, tout dépend de votr
Nuages de mots

Nuages de mots

Après avoir fait toutes nos recherches pour pouvoir produire ces tableaux, maintenant il faut bien les utiliser ! dans un premier temps nous allons faire des nuages de mots. pour cela, nous allons utiliser nos dumps contextes globaux pour pouvoir créer un nuage de mots et donc voir quels mots ressortent le plus. plus le mot est gros dans le nuage
Phase 1 - Les Tableaux - Bientôt la fin!!!

Phase 1 - les tableaux - bientôt la fin!!!

La fin du travail sur les tableaux est proche! en effet! dans les dernières étapes, nous devions ajouter une colonne de contextes, ajouter une colonne d'index et concaténer tous les dumps et les contextes dans un fichier unique. encore une fois, prenons les choses dans l'ordre. pour ce qui est du contexte, l'idée est de trouver une expression r
Treecloud

Treecloud

En dernier lieu de notre travail, nous avons maintenant sur le trameur et les treeclouds. alors ça, qu’est-ce que c’est ?! les treeclouds sont des mots disposer sous forme d’arbre et qui sont regroupé par leur proximité dans le texte. en utilisant le logiciel sur ce site http://www.lirmm.fr/~gambette/progtreecloud.php, on a également une