1

我正在尝试从 Google Weather API 读取天气信息。

我的代码与此类似:

            String googleWeatherUrl = "http://www.google.de/ig/api?weather=berlin&hl=de";
    InputStream in = null;
    String xmlString = "";
    String line = "";
    URL url = null;
    try {
        url = new URL(googleWeatherUrl);
        in = url.openStream();
        BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(in, UTF_8));
        while ((line = bufferedReader.readLine()) != null) {
            xmlString += line;
        }
    } catch (MalformedURLException e) {
    } catch (IOException e) {
    } 

    DocumentBuilder builder = null;
    Document doc = null;
    try {
        builder = DocumentBuilderFactory.newInstance().newDocumentBuilder();
        InputSource source = new InputSource(new StringReader(xmlString));
        doc = builder.parse(source);

    } catch (ParserConfigurationException e) {} 
              catch (FactoryConfigurationError e) {} 
              catch (SAXException e) {} catch (IOException e) {}

基本上它就像一个魅力,但是当返回的数据包含变音符号(ö,ü,ä,...)时,这些字符将无法正确显示。在 Eclipse 以及浏览器或相应的源代码中,它们显示为矩形(或类似奇怪的东西)。

实际上,变量 xmlString 已经包含损坏的变音符号。

有人对此有想法吗?

谢谢和最好的问候, 保罗

4

1 回答 1

3

欢迎来到字符编码的神奇世界。请把你的理智留在门边的架子上……

您很可能需要source.setEncoding(encoding)为网页使用并指定正确的字符编码——如果幸运的话,编码可能实际上是在标题中指定的。

将输入流的编码更改为“Latin1”,如下所示:

BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(in, Charset.forName("Latin1")));

在我的机器上测试时,这会返回正确的德语字符:

<current_conditions><condition data="Meistens bewölkt"/>

于 2012-01-06T12:48:08.343 回答