Thanks, we will work on a test version.<br>Samuel, about cross linking between corpus, the zeno:// urls make it possible, though there is no fallback for missing corpus yet. A page in a missing corpus is a blank page :) It&#39;s something to work on.<br>
<br><div class="gmail_quote">On Mon, Feb 9, 2009 at 9:12 PM, Chris Ball <span dir="ltr">&lt;<a href="mailto:cjb@laptop.org">cjb@laptop.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi Fabien, SJ,<br>
<div class="Ih2E3d"><br>
&gt; Ok. But the zeno with all articles from wikipedia &#39;es&#39; takes about 1GB, just<br>
&gt; for texts. Does the Peruvian selection consist of all articles once removed<br>
&gt; those in <a href="http://dev.laptop.org/%7Ecjb/eswiki/blacklist3" target="_blank">http://dev.laptop.org/~cjb/eswiki/blacklist3</a> ?<br>
<br>
</div>The status of our eswiki builds is:<br>
<br>
build 1: for XO, 80M for most popular 30k articles, plus 20M for 3000 images<br>
build 2: for server, 622M for all 1M articles, plus 230M for 220k images<br>
<br>
(the images in both cases are downsampled to lower quality so that we<br>
can include more of them)<br>
<br>
Fabien, if you&#39;d like to try out the full build 2, here are instructions<br>
that should work on a 32-bit x86 Linux machine:<br>
<br>
* wget <a href="http://dev.laptop.org/%7Ecjb/spanish_wikiserver_full.tgz" target="_blank">http://dev.laptop.org/~cjb/spanish_wikiserver_full.tgz</a><br>
* tar zxf spanish_wikiserver_full.tgz<br>
* cd wikiserver/es_PE<br>
* wget <a href="http://dev.laptop.org/%7Ecjb/eswiki/images.tar.gz" target="_blank">http://dev.laptop.org/~cjb/eswiki/images.tar.gz</a><br>
* tar zxf images.tar.gz<br>
* cd ..<br>
* python server.py es_PE/eswiki-20090124-pages-articles.xml.bz2 8000<br>
* browse to http://&lt;IP address&gt;:8000/<br>
<br>
Thanks,<br>
<div><div></div><div class="Wj3C7c"><br>
- Chris.<br>
--<br>
Chris Ball &nbsp; &lt;<a href="mailto:cjb@laptop.org">cjb@laptop.org</a>&gt;<br>
</div></div></blockquote></div><br>