hitweb-dev
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[Hitweb-dev] Nouveau dmoz francophone_medecin


From: Brian FRAVAL
Subject: [Hitweb-dev] Nouveau dmoz francophone_medecin
Date: Fri, 24 Oct 2003 16:18:15 +0200
User-agent: Mutt/1.5.4i

Maurice, 
voici le nouveau fichier concernant les catégories de 
DMOZ francophone sur la médecine :

Le fichier que je récupère fait 1,3Go.. quand il
est décompressé.. 

-rw-r--r--    1 brian    brian        1,3G 2003-10-24 13:35 content2.rdf.u8

Ensuite pour récupérer la partie médecine francophone,
j'ai réalisé un petit script francophone_medecin... Il
est basé sur un script en PERL du moteur de recherche 
Ecila développé par Loic Dachary et l'ancienne équipe
du moteur de recherche Ecila. 

Il parcours donc les 1,3 Go et créé un fichier rdf plus
petit.. 

address@hidden:~/cvs/gwadm/etk-dmoz-maj$ time ./francophone_medecin 
content2.rdf.u8 medecin_dmoz_new.rdf 
je viens de trouver la partie Francaise
j enregistre la partie Francaise
FIN

real    1m38.147s
user    1m24.230s
sys     0m6.120s

Le tout est réalisé en moins de 2 minutes.. 

Il faut a tout pris que le script que nous allons
réaliser pour insérer les données dans la base de hitweb
soit optimisé.. 


-- 
Brian FRAVAL
address@hidden
http://brian.fraval.org/




reply via email to

[Prev in Thread] Current Thread [Next in Thread]