[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[Hitweb-dev] Nouveau dmoz francophone_medecin
From: |
Brian FRAVAL |
Subject: |
[Hitweb-dev] Nouveau dmoz francophone_medecin |
Date: |
Fri, 24 Oct 2003 16:18:15 +0200 |
User-agent: |
Mutt/1.5.4i |
Maurice,
voici le nouveau fichier concernant les catégories de
DMOZ francophone sur la médecine :
Le fichier que je récupère fait 1,3Go.. quand il
est décompressé..
-rw-r--r-- 1 brian brian 1,3G 2003-10-24 13:35 content2.rdf.u8
Ensuite pour récupérer la partie médecine francophone,
j'ai réalisé un petit script francophone_medecin... Il
est basé sur un script en PERL du moteur de recherche
Ecila développé par Loic Dachary et l'ancienne équipe
du moteur de recherche Ecila.
Il parcours donc les 1,3 Go et créé un fichier rdf plus
petit..
address@hidden:~/cvs/gwadm/etk-dmoz-maj$ time ./francophone_medecin
content2.rdf.u8 medecin_dmoz_new.rdf
je viens de trouver la partie Francaise
j enregistre la partie Francaise
FIN
real 1m38.147s
user 1m24.230s
sys 0m6.120s
Le tout est réalisé en moins de 2 minutes..
Il faut a tout pris que le script que nous allons
réaliser pour insérer les données dans la base de hitweb
soit optimisé..
--
Brian FRAVAL
address@hidden
http://brian.fraval.org/
[Prev in Thread] |
Current Thread |
[Next in Thread] |
- [Hitweb-dev] Nouveau dmoz francophone_medecin,
Brian FRAVAL <=