设置 | 登录 | 注册

作者共发了1篇帖子。

Jsoup text()保留换行符

1楼 巨大八爪鱼 2025-8-16 15:02
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Document.OutputSettings;
import org.jsoup.safety.Whitelist;
import org.jsoup.nodes.Element;

public class Test2 {
    public static void main(String[] args) {
        Document document = parse("<div id=\"test\">  A\nB  </div>");
        System.out.println(document.body());
        System.out.println("-------------------------");
        
        Element div = document.getElementById("test");
        System.out.println(getTextContent(div));
    }
    
    public static Document parse(String html) {
        Document document = Jsoup.parse(html);
        OutputSettings outputSettings = new OutputSettings();
        outputSettings.prettyPrint(false);
        document.outputSettings(outputSettings);
        return document;
    }
    
    public static String getTextContent(Element element) {
        String html = element.html();
        OutputSettings outputSettings = new OutputSettings();
        outputSettings.prettyPrint(false);
        return Jsoup.clean(html, "", Whitelist.none(), outputSettings);
    }
}


程序运行结果:

<body><div id="test">  A
B  </div></body>
-------------------------
  A

内容转换:

回复帖子
内容:
用户名: 您目前是匿名发表。
验证码:
看不清?换一张
©2010-2025 Purasbar Ver3.0 [手机版] [桌面版]
除非另有声明,本站采用知识共享署名-相同方式共享 3.0 Unported许可协议进行许可。