在07-4-12,hutuworm <hutuworm at gmail.com> 写道: > > 把HTML标签如<.*>等滤掉就是文本了 > 然后再做一些处理 不见得有这么简单,标准xhtml还好 还有转义一类的字符 dive into py好象有这方面的例子,要求不高的情况下HTMLParser.py完全够用 -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20070412/c8aa31ad/attachment.html