java利用POI实现读取Word并获取指定样式的文本

java

import org.apache.poi.hwpf.HWPFDocument;

import org.apache.poi.hwpf.model.StyleDescription;

import org.apache.poi.hwpf.model.StyleSheet;

import org.apache.poi.hwpf.usermodel.Paragraph;

import org.apache.poi.hwpf.usermodel.Range;

import java.io.*;

public class WordToDB {

public static void main(String[] args) throws Exception {

String filePath = "***.doc";

printWord(filePath);

}

public static void printWord(String filePath) throws IOException {

InputStream is = new FileInputStream(filePath);

HWPFDocument doc = new HWPFDocument(is);

Range r = doc.getRange();// 文档范围

// System.out.println("段落数:"+r.numParagraphs());

for (int i = 0; i < r.numParagraphs(); i++) {

Paragraph p = r.getParagraph(i);// 获取段落

        

int numStyles = doc.getStyleSheet().numStyles();

int styleIndex = p.getStyleIndex();

if (numStyles > styleIndex) {

StyleSheet style_sheet = doc.getStyleSheet();

StyleDescription style = style_sheet.getStyleDescription(styleIndex);

String styleName = style.getName();// 获取每个段落样式名称

// 获取自己理想样式的段落文本信息

String styleLoving = "级别2:四号黑体 20磅 前18 后12 左对齐";

if (styleName != null && styleName.contains(styleLoving)) {

String text = p.text();// 段落文本

System.out.println(text);

}

}

}

doc.close();

}

}

 

以上是 java利用POI实现读取Word并获取指定样式的文本 的全部内容, 来源链接: utcz.com/z/390468.html

回到顶部