Hi,<br><br>Can you please try both options with also the following ones:<b> -ftree-vectorize -funroll-loops -m3dnow</b><br><br>Also, it may be a good idea to test both geode and i586 with <b>-m3dnow </b>and <b>-mno3dnow</b>, since the compiler may be causing problems while vectorizing.<br>
Another option is to test also with i486 compilations, as per what I had already found in this thread:<br><br><a href="http://geode.insideo.net/info-linux_archives/msg00396.html">http://geode.insideo.net/info-linux_archives/msg00396.html</a><br>
<font style="font-family: arial,helvetica,sans-serif;" size="2"><br></font><blockquote><pre><font style="font-family: arial,helvetica,sans-serif;" size="2">Let me underscore my colleague's statement.  Do not use the 586 target.<br>
In testing we've found that the 586 "optimized" version can be up to 3x<br>slower vs. the 386/486 versions on the Geode LX.</font><br></pre></blockquote><br>This should be due to Geode LX not being a superscalar processor (while the i586 is) may be causing problems even with the i586 march.<br>
<br>Best regards,<br>                          Tiago Marques<br><br><br><br><div class="gmail_quote">On Fri, Feb 20, 2009 at 2:23 PM, Benjamin M. Schwartz <span dir="ltr"><<a href="mailto:bmschwar@fas.harvard.edu">bmschwar@fas.harvard.edu</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="Ih2E3d">-----BEGIN PGP SIGNED MESSAGE-----<br>
Hash: SHA1<br>
<br>
</div><div class="Ih2E3d">Tomeu Vizoso wrote:<br>
> On Fri, Feb 20, 2009 at 06:41,  <<a href="mailto:quozl@laptop.org">quozl@laptop.org</a>> wrote:<br>
>> On Fri, Feb 20, 2009 at 12:28:42AM -0500, Benjamin M. Schwartz wrote:<br>
>>> GCC 4.3 evidently does not do a very good job of optimizing for geode.<br>
>> What percentage of CPU time was spent in libtheora?<br>
<br>
</div>100%.  The encoder was operating in a continuous loop.<br>
<div class="Ih2E3d"><br>
> Yeah, both X and jffs2 seem to use a lot of cpu on the XO, so if they<br>
> were involved during your tests, you may have seen little of theora<br>
> itself.<br>
<br>
</div>Neither X nor jffs2 was involved.  The input file (y4m or ogv) was cached<br>
in memory, and the output stream (ogv or y4m) was being sent directly to<br>
/dev/null, and not displayed.<br>
<br>
The only action being taken in X was to display, in the Terminal activity,<br>
a text-only progress bar, rendered by the encoder_example, or dump_video<br>
command.  These commands are part of libtheora, and were recompiled with<br>
it, so the point remains.<br>
<div class="Ih2E3d"><br>
- --Ben<br>
-----BEGIN PGP SIGNATURE-----<br>
Version: GnuPG v2.0.9 (GNU/Linux)<br>
<br>
</div>iEYEARECAAYFAkmevNoACgkQUJT6e6HFtqR6tACeO1ZzMrBs/u1RZiGLqS19AJEv<br>
RD4An26lFRgJ1sRxktsSlG18WjVQ92d7<br>
=eIOq<br>
-----END PGP SIGNATURE-----<br>
<div><div></div><div class="Wj3C7c">_______________________________________________<br>
Devel mailing list<br>
<a href="mailto:Devel@lists.laptop.org">Devel@lists.laptop.org</a><br>
<a href="http://lists.laptop.org/listinfo/devel" target="_blank">http://lists.laptop.org/listinfo/devel</a><br>
</div></div></blockquote></div><br>