java--提取富文本中的图片和纯文本

java

    private static Pattern p_image= Pattern.compile("<img.*src\\s*=\\s*(.*?)[^>]*?>",Pattern.CASE_INSENSITIVE);

private static Pattern r_image=Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)");

/**

* 提取富文本中纯文本

*/

public static String getText(String richText) {

String regx = "(<.+?>)|(</.+?>)";

Matcher matcher = Pattern.compile(regx).matcher(richText);

while (matcher.find()) {

// 替换图片

richText = matcher.replaceAll("").replace(" ", "");

}

return richText;

}

/**

* 提取富文本中图片地址

*/

public static List<String> getImgStr(String richText) {

List<String> list = new ArrayList<>();

Matcher pMatcher = pImage.matcher(richText);

while (pMatcher.find()) {

// 得到<img />数据

String img = pMatcher.group();

// 匹配<img>中的src数据

Matcher rMatcher = rImage.matcher(img);

while (rMatcher.find()) {

list.add(rMatcher.group(1));

}

}

return list;

}

以上是 java--提取富文本中的图片和纯文本 的全部内容, 来源链接: utcz.com/z/390357.html

回到顶部