Enfin, enfin! la solution pour les problème du finnois a enfin été trouvée!!! depuis le début nous n'avions pas eu besoin d'avoir à dos2unix (étant donné que nous travaillons sous cygwin), or monsieur fleury a eu la bonne idée de nous faire exécuter la commande cat -a sur notre fichier d'url en finnois, et c'est la que nous nous sommes re
CassisEuphorique748295
/image%2F0796222%2F201310%2Fob_2c9ac248b841c2bc6f22aeb3f1b3a82b_marseille.jpg)
CassisEuphorique748295
Ses blogs
/image%2F0796222%2F201310%2Fob_2c9ac248b841c2bc6f22aeb3f1b3a82b_marseille.jpg)
La ville Marseille vue par la presse internationale
calanquesetptitstrafics.over-blog.com
/image%2F0796222%2F201310%2Fob_2c9ac248b841c2bc6f22aeb3f1b3a82b_marseille.jpg)
Articles :
17
Depuis :
11/10/2013
Categorie :
Emploi, Enseignement & Etudes
Articles à découvrir
/image%2F0796222%2F201312%2Fob_74bfb57a279bea63f91b3631dda0d527_tableau-avec-style.png)
Depuis le début nous nous sommes contentées d'avoir une page très minimaliste, sans séparation entre les tableaux, sans couleurs, bref, rien. je me suis donc penchée un peu sur le problème pour que cela soit visuellement plus acceptable. pour commencer, je me suis occupée du titre. j'ai définis un style h1 que j'allais ensuite appliqué au
/image%2F0796222%2Fob_cf2ef8_trameur-marseille-anglais.jpg)
Dernière analyse possible sur nos corpus d’articles, le trameur. alors, parce que ce n’est pas forcément évident, un trameur, qu’est-ce que c’est ? un trameur est un logiciel, un peu comme une « moulinette », qui va analyser notre texte en nous donnant la fréquence de chaque mot puis dans quel contexte il s’inscrit, cela veut dire q
/image%2F0796222%2Fob_8bdcad_trameur-anglais-contexte-marseille.jpg)
Après une petite discussion avec mr. fleury, nous nous sommes rendues compte que les graphs du trameur et les analyses que nous avons faites jusqu’à présent … ne sont pas forcément très justes. enfin, « justes » n’est pas le mot, disons plutôt « adapté ». donc on efface (presque) tout et on recommence ! avant toutes explications su
/image%2F0796222%2Fob_37edf4_trameur-finnois-contexte-marseille.jpg)
Tout d'abord, nous constatons que lorsque "marseille" est évoqué dans la presse finlandaise c'est essentiellement associé au sport. en effet, les termes "anchelotti", "fanien psg" (fan du psg), "manchester united", "pelaajat" (joueurs) et "0" (qui est relatif aux résultats de matchs) sont en lien avec le millieu sportif, le football plus partic
Comme nous l'avions précisé dans le dernier billet, nous avions quelques problèmes sur les erreurs soit en aspiration de pages, soit en dump. et bien nous avons désormais la réponse, ou plutôt les réponses. la première inconnue était de savoir pourquoi le tableau sautait 10 lignes pour les articles en anglais. après une rapide recherche,
/image%2F0796222%2Fob_d6962d_code-html.png)
Bien qu'il nous reste encore à faire tourner le trameur sur nos contextes globaux et à analyser le résultat que nous donnera ce dernier, nous devons dès maintenant nous concentrer sur la création du site que nous allons devoir fournir à la fin! pour cela, le plus simple est de trouver un squelette de site (gratuit ou non, tout dépend de votr
/image%2F0796222%2F201312%2Fob_a05c754be4bfad6e5b922509e6c149ec_worditout-esp-wrong.png)
Après avoir fait toutes nos recherches pour pouvoir produire ces tableaux, maintenant il faut bien les utiliser ! dans un premier temps nous allons faire des nuages de mots. pour cela, nous allons utiliser nos dumps contextes globaux pour pouvoir créer un nuage de mots et donc voir quels mots ressortent le plus. plus le mot est gros dans le nuage
/image%2F0796222%2F201312%2Fob_b0881790b5580a0e962a4e93843f9be9_tableau-fin.png)
La fin du travail sur les tableaux est proche! en effet! dans les dernières étapes, nous devions ajouter une colonne de contextes, ajouter une colonne d'index et concaténer tous les dumps et les contextes dans un fichier unique. encore une fois, prenons les choses dans l'ordre. pour ce qui est du contexte, l'idée est de trouver une expression r
/image%2F0796222%2Fob_755f88_treecloud-anglais.jpg)
En dernier lieu de notre travail, nous avons maintenant sur le trameur et les treeclouds. alors ça, qu’est-ce que c’est ?! les treeclouds sont des mots disposer sous forme d’arbre et qui sont regroupé par leur proximité dans le texte. en utilisant le logiciel sur ce site http://www.lirmm.fr/~gambette/progtreecloud.php, on a également une