[Wikireader] Fw: Reducir tamaño Wikipedia en XS

Samuel Klein sj at laptop.org
Thu Feb 5 12:12:28 EST 2009


Fabien,

It would be useful to see an Okawix of the Peruvian selection, as you
suggest, for a size/speed/interface comparison.

Many XO users have access to 1GB USB sticks in S. America, so that's
also a useful size limit for selections.


>> Another interesting feature is that Okawix can be run either embeded on an external
>> device (cd, usb key) or installed on one's system, with the ability to move a corpus
>> from embeded to the local Okawix.

Can you say more about this?  I'm not quite sure how it would work.

SJ


2009/1/27 Samuel Klein <sj at laptop.org>:
> Fabien,
>
> This seems like it would be of great value to Peru; and they are
> looking for a solution for a server-size wikireader that is relatively
> fast for all of their server-enabled schools.
>
> Martin L, what is needed to include a reader in the XS image -- would
> you recommend a separate download that is made once locally, before
> making a local peruvian master XS image?  &c.
>
> Somtehing to discuss on both the XS and the wikireader lists; but I
> wanted to bring this up here first to the extent that it is of
> short-term importance to peruvian deployments.
>
> SJ
>
>
> 2009/1/27 Fabien Coulon <fabien.coulon at gmail.com>:
>> Hello Samuel,
>>  We are about to release a new version of our offline reader (formerly
>> Kiwix). Its name is changing for Okawix. There will be some major
>> improvements compared to Kiwix 0.5 : zeno format for articles and images,
>> and the search engine that is now the one used in wikiwix.com. Another
>> interesting feature is that Okawix can be run either embeded on an external
>> device (cd, usb key) or installed on one's system, with the ability to move
>> a corpus from embeded to the local Okawix.
>>  We already have the zeno files ready for the whole wikipedia es, together
>> with the search engine indexes. 674MB for the articles, 256MB for indexes,
>> and 4GB for the images. This will be releasable soon. The size of the image
>> archive could of course be reduced by loosing resolution.
>>  Having a customized selection of articles, based on an explicit list of
>> articles, will be soon possible too.
>>  We would be glad to provide an Okawix based on the Peruvian selection.
>>
>>  Fabien Coulon
>>  Linterweb
>>
>> 2009/1/26 Martin Pascal <pmartin at linterweb.com>
>>>
>>> Cordialement
>>> Martin Pascal
>>> tel : 02 32 40 23 69, fax : 02 32 61 45 26
>>> gsm : 06 13 89 77 32
>>> ----- Original Message ----- From: "Samuel Klein" <sj at laptop.org>
>>> To: "Chris Ball" <cjb at laptop.org>
>>> Cc: "C. Scott Ananian" <cananian at gmail.com>; "Martin Langhoff"
>>> <martin at laptop.org>; "Hernan Pachas" <hernan.pachas at gmail.com>; "Offline
>>> Wikireaders" <wikireader at lists.laptop.org>
>>> Sent: Monday, January 26, 2009 6:58 PM
>>> Subject: Re: [Wikireader] Reducir tamaño Wikipedia en XS
>>>
>>>
>>> I copy the wikireader mailing list.
>>>
>>> Here is a request from Peru, currently the world's largest deployer of
>>> the reader with roughly 100,000 XOs using it.
>>>
>>> SJ
>>>
>>>
>>> 2009/1/22 Chris Ball <cjb at laptop.org>:
>>>>
>>>> Hola,
>>>>
>>>> Estos son los pasos necesarios para que la XS wikislice con todos los
>>>> artículos de Wikipedia en español:
>>>>
>>>> * tener la lista de artículos completos
>>>> * revisar y eliminar los artículos inapropiado
>>>> * construir el archivo que contiene estos artículos
>>>> * determinar cuáles / cuántas imágenes para incluir
>>>>
>>>> Puedo hacer el archivo de mi parte la construcción, pero necesito ayuda
>>>> con la revisión de los contenidos inapropiados, toma mucho tiempo.
>>>>
>>>> Para empezar, yo sugiero que tratemos de construir la lista de artículos
>>>> inadecuado mediante la búsqueda de términos inapropiados en wikipedia y
>>>> la creación de una lista de artículos que excluir.
>>>>
>>>> Aquí está la lista de artículos que estamos excluidos de los más
>>>> pequeños XO wikislice:
>>>>
>>>>  http://dev.laptop.org/~cjb/eswiki/blacklist3
>>>>
>>>> Una manera de empezar podría ser la búsqueda de artículos como los que
>>>> en la lista negra en la Wikipedia en español del sitio principal, y dime
>>>> los nombres de los que excluye.
>>>>
>>>> Martin, si me dan una cuenta en un XS puedo configurar el wikiserver
>>>> demonio en él para probar; sería ideal si el servidor es en el Perú y
>>>> el equipo de Hernán pueden experimentar también..
>>>>
>>>> ¿Alguna otra pregunta? Mi español es llegar a ser demasiado destrozado
>>>> comprensible, en cuyo caso podría volver a Inglés?
>>>>
>>>> Gracias,
>>>>
>>>> - Chris.
>>>> --
>>>> Chris Ball   <cjb at laptop.org>
>>>>
>>>
>>> Hola Hernan,
>>>
>>>  > Por ejemplo, para el wikislice del XO, el presupuesto se puso en
>>>  > 100MB, y entraron 35 000 articulos. Si pones un presupuesto de 1GB
>>>  > para el XS, seguramente van a entrar entre 300 y 400 mil articulos.
>>>
>>> El conjunto completo de artículos de la Wikipedia en español (cada
>>> artículo) es de 1,4 millones de páginas y 885MB. Por el 100MB wikislice,
>>> hemos reservado 20M para las imágenes; podríamos reserva 115MB para las
>>> imágenes para el artículo completo conjunto a fin de que el conjunto de
>>> 1GB.
>>>
>>> (La diferencia en el numero de artículos porque los articulos menos
>>> populares tambien son mas pequeños.)
>>>
>>> Yo sería feliz de ayudar con la creación de la versión XS de la
>>> wikislice.
>>>
>>> Saludos,
>>>
>>> - Chris.
>>> _______________________________________________
>>> Wikireader mailing list
>>> Wikireader at lists.laptop.org
>>> http://lists.laptop.org/listinfo/wikireader
>>
>>
>


More information about the Wikireader mailing list