您的位置:首頁技術文章
文章詳情頁

在Java中輕松將HTML格式文本轉換為純文本的方法示例(保留換行)

瀏覽:86日期:2022-09-02 18:42:15

第一步:引入Jsoup和lang和lang3的依賴:

Jsoup是HTML解析器lang和lang3這兩個包里有轉換所需的工具類

<dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.3</version></dependency><dependency><groupId>commons-lang</groupId><artifactId>commons-lang</artifactId><version>2.6</version></dependency><dependency><groupId>org.apache.commons</groupId><artifactId>commons-lang3</artifactId><version>3.4</version></dependency>

第二步:直接使用即可:

import org.apache.commons.lang.StringEscapeUtils;import org.apache.commons.lang3.StringUtils;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.safety.Whitelist;/** * @author Piconjo */public class Html2PlainText { public static String convert(String html) { if (StringUtils.isEmpty(html)) { return ''; } Document document = Jsoup.parse(html); Document.OutputSettings outputSettings = new Document.OutputSettings().prettyPrint(false); document.outputSettings(outputSettings); document.select('br').append('n'); document.select('p').prepend('n'); document.select('p').append('n'); String newHtml = document.html().replaceAll('n', 'n'); String plainText = Jsoup.clean(newHtml, '', Whitelist.none(), outputSettings); String result = StringEscapeUtils.unescapeHtml(plainText.trim()); return result; }}

使用測試:

在Java中輕松將HTML格式文本轉換為純文本的方法示例(保留換行)

在Java中輕松將HTML格式文本轉換為純文本的方法示例(保留換行)

到此這篇關于在Java中輕松將HTML格式文本轉換為純文本的方法示例(保留換行)的文章就介紹到這了,更多相關Java HTML轉換為純文本內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Java
相關文章:
国产综合久久一区二区三区