Hi all,<br>


<br>


I have scoured the web for a solution to this and I am stumped.&nbsp; I have an xml file with elements like:<br>


<br>


&lt;pr type=&quot;US&quot;&gt;&amp;stress1;r&amp;aelig;bit
<div id="mb_1">&lt;/pr&gt;<br>
<div>
<br>
When reading this in through the SAXbuilder, I get question marks and strange characters instead of the actual text.<br>
<br>
Here is the code I am currently using, I figured it was an issue of encoding but it's not doing the trick:<br>
<br>
<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; SAXBuilder sb = new SAXBuilder(&quot;org.apache.crimson.parser.XMLReaderImpl&quot;);<br>
&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; <br>
&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; InputSource is = new InputSource(&quot;<a>file:///d:/workspace/OACD/OACD_rz.xml&quot;)</a>;<br>
&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; is.setEncoding(&quot;UTF-8&quot;);<br>
&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; sb.setEntityResolver(new EntityResolver() {<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
public InputSource resolveEntity(String publicId, String systemId)
throws SAXException, IOException {<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
return new
InputSource(&quot;<a>file:///d:/workspace/oup-character-entities.ent&quot;)</a>;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; });<br>
&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; document = sb.build(is);<br>
<br>
and the xml header is:<br>
<br>
&lt;?xml version='1.0' encoding='UTF-8'?&gt;<br>
&lt;?xml-stylesheet type='text/xsl' href=&quot;<a>http://somestyle.xsl&quot;</a>?&gt;<br>
&lt;!DOCTYPE dictionary SYSTEM &quot;dictionary.dtd&quot;&gt;<br>
&lt;dictionary xml:space='preserve'&gt;<br>
<br>
What I get back when I do a getText() on the element pr is &quot;?r?bit&quot;<br>
<br>
I assume I am missing something obvious, pointing me to the
right section of the documentation would be sufficient.<br>
<br>
Thank you,<br><span>
<br>
Luke Majewski</span></div></div>