設置 | 登錄 | 註冊

作者共發了1篇帖子。

Jsoup text()保留换行符

1樓 巨大八爪鱼 2025-8-16 15:02
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Document.OutputSettings;
import org.jsoup.safety.Whitelist;
import org.jsoup.nodes.Element;

public class Test2 {
    public static void main(String[] args) {
        Document document = parse("<div id=\"test\">  A\nB  </div>");
        System.out.println(document.body());
        System.out.println("-------------------------");
        
        Element div = document.getElementById("test");
        System.out.println(getTextContent(div));
    }
    
    public static Document parse(String html) {
        Document document = Jsoup.parse(html);
        OutputSettings outputSettings = new OutputSettings();
        outputSettings.prettyPrint(false);
        document.outputSettings(outputSettings);
        return document;
    }
    
    public static String getTextContent(Element element) {
        String html = element.html();
        OutputSettings outputSettings = new OutputSettings();
        outputSettings.prettyPrint(false);
        return Jsoup.clean(html, "", Whitelist.none(), outputSettings);
    }
}


程序运行结果:

<body><div id="test">  A
B  </div></body>
-------------------------
  A

內容轉換:

回覆帖子
內容:
用戶名: 您目前是匿名發表。
驗證碼:
看不清?換一張
©2010-2025 Purasbar Ver3.0 [手機版] [桌面版]
除非另有聲明,本站採用知識共享署名-相同方式共享 3.0 Unported許可協議進行許可。