0

我正在使用 Android 从网上阅读文档,令人惊讶的是我在这里写信是因为我有一个问题。对于很多网站我都没有问题,但对于某些网站,android 中的 xml 解析器是“脾气暴躁的”。我怀疑这与字符编码有关,但我不确定到底是什么。特别是如果我用“wget”下载文件并将其提供给android,它工作正常......

Android 的错误信息,03-23 21:54:47.383: ERROR/xml(9062): org.apache.harmony.xml.ExpatParser$ParseException: At line 1, column 62: syntax error

我下载时的xml似乎很好。

<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
    <channel>
    ...

我的示例 android 应用程序....

package com.example.android.helloactivity;

import java.net.URL;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import android.app.Activity;
import android.os.Bundle;
import android.util.Log;
import android.widget.Toast;

public class HelloActivity extends Activity {

    class EnclosureHandler extends DefaultHandler {
        @Override
        public void characters(char[] ch, int start, int length)
                throws SAXException {
        }

        @Override
        public void endElement(String uri, String localName, String name)
                throws SAXException {
        }

        @Override
        public void startElement(String namespaceURI, String localName,
                String qName, Attributes atts) throws SAXException {
            Log.i("xml", "lname is : " + qName);
        }
    };

    @Override
    public void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.hello_activity);

        try {
            SAXParserFactory spf = SAXParserFactory.newInstance();
            SAXParser sp = spf.newSAXParser();
            InputSource is = new InputSource(new URL(
                    "http://www.hbo.com/podcasts/billmaher/podcast.xml")
                    .openStream());
            sp.parse(is, new EnclosureHandler());
        } catch (Throwable t) {
            Log.e("xml", t.toString());
            Toast.makeText(getApplicationContext(), t.toString(),
                    Toast.LENGTH_LONG).show();

        }

    }
}
4

1 回答 1

0

事实证明,字符编码不是问题。HBO.com 网站根据 USER-AGENT: 标头返回不同的内容。因此,如果您使用 Android 与 hbo.com 网站交谈,他们会返回一条消息,告诉您如何使用自己的 android 客户端访问该网站。他们可能正试图帮助人们使用网络浏览器。更改 USER-AGENT 然后导致上述程序获得正确的(并且可解析的)xml 文档。

于 2011-03-25T01:51:50.507 回答