<html>
  <head>
    <meta content="text/html; charset=ISO-8859-1"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    <div class="moz-cite-prefix"><br>
      I took the 5 projects (Glucose, Honey, website, terminology and
      olpc software), downloaded all zipped directories, unpacked them
      all in one place, ran pocompendium, then po2csv.<br>
      <br>
      The resulting file had 5819 strings. This seems a lot less then
      when adding up the wordcount on the individual projects  as shown
      on the translaton site.<br>
      <br>
      Is this because of many repeating strings? The resulting file does
      have a column 'location' where sometimes many locations are shown,
      and in the 'target' column sometimes I see 2 or more 'versions' of
      the same word, so I guess these are merged.<br>
      <br>
      I then took the source column, removed all [".:] and %s, replaced
      spaces with newlines, and sorted uniq. The resulting file has all
      source WORDS (not strings) and this comes to 6079 words.<br>
      <br>
      Is that about right accordig to your experience and estimates?<br>
      <br>
      Also, the first 1000 words or so are all names of places and towns
      from the geography activity.<br>
      <br>
      To me this seems a lot less words that I expected based on the
      wordcount in Pootle. Can you confirm this is the right number?<br>
      <br>
      Ace<br>
      <br>
      <br>
      <br>
      On 05/20/2013 09:39 PM, Chris Leonard wrote:<br>
    </div>
    <blockquote
cite="mid:CAHdAatZRaqjj_LWqRH_bUxWwDgZ70weGz-eqrE1Jod_GdSgyQw@mail.gmail.com"
      type="cite">
      <div dir="ltr"><br>
        <div class="gmail_extra"><br>
          <br>
          <div class="gmail_quote">On Mon, May 20, 2013 at 5:45 PM, Ace
            Suares <span dir="ltr"><<a moz-do-not-send="true"
                href="mailto:ace@suares.com" target="_blank">ace@suares.com</a>></span>
            wrote:<br>
            <blockquote class="gmail_quote" style="margin:0px 0px 0px
              0.8ex;border-left:1px solid
              rgb(204,204,204);padding-left:1ex">
              <div bgcolor="#FFFFFF" text="#000000"> <font
                  face="Helvetica, Arial, sans-serif">Hi There,<br>
                  <br>
                  For a project sponsored by UNESCO, we have the
                  opportunity to continue the work that was started by
                  the Dutch/Papiamento team led by Urso Wieske some
                  while ago.<br>
                  <br>
                  For a quick estimatie how many words need to be
                  translated in the first round, the translators have
                  asked for an 'Excel' file with the following
                  charcteristics:<br>
                  <br>
                  - projects: Glucose, Honey, Terminology, OLPC PR
                  Website, OLPC Software<br>
                  - source languages: English, Dutch, Portuguese,
                  Spanish, Papiamento<br>
                  <br>
                  I've found <a moz-do-not-send="true"
href="http://docs.translatehouse.org/projects/translate-toolkit/en/latest/guides/using_csv2po.html"
                    target="_blank">http://docs.translatehouse.org/projects/translate-toolkit/en/latest/guides/using_csv2po.html</a>
                  so I am confident I could make .csv out of .po files,
                  but can't find where to download the .po files.<br>
                </font></div>
            </blockquote>
            <div><br>
              <br>
            </div>
            <div>Drill down to the project level and you'll find
              download "zip of directory" as an option near the top of
              the page on the Translate tab.<br>
              <br>
            </div>
            <div>e.g.<br>
              <br>
              <a moz-do-not-send="true"
                href="http://translate.sugarlabs.org/pap/fructose/edit.html">http://translate.sugarlabs.org/pap/fructose/edit.html</a>
              <br>
            </div>
            <div><br>
              <br>
              <br>
            </div>
            <div>cjl</div>
          </div>
          <br>
        </div>
      </div>
    </blockquote>
    <br>
  </body>
</html>