Tag: ascii

Jsoup中的属性值的字符集

我使用Jsoup,我需要以ascii编码的方式获取html文档中所有标签的属性值,而不用转换它们。 所以,我有以下的HTML文件 0, à vs è”> 3 > 2, 1 > 0 我想用Jsoup来解析。 我需要完全按照原样提取title属性的值: 2 > 1, 1 > 0, à vs è 2 > 1, 1 > 0, à vs è 。 我创建了一个Document对象doc如下(这是在Kotlin,但我不认为这很重要): val charset = Charset.forName(“ascii”) val doc = Jsoup.parse(File(“test.html”).readText(charset)) doc.outputSettings().charset(charset) 当我打印出的文件的方式 println(doc.toString()) 我得到以下字符串 1, 1 > 0, à vs è”> 3 > […]