* 首先介紹excel2007文件的格式,這里單只工作表文件,不包括加載宏的以及其他格式的,即.xlsx擴展名的
* 你可以把Book1.xlsx這個文件用解壓縮文件打開,這是office2007的新格式,所有的該版本的文件都可以用
* 解壓縮文件打開。
* 在解壓到的文件夾里主要用到的是xl這個文件夾,這里也只介紹這個文件夾里的部分文件,其他信息可以在微軟
* 的msdn上找到。
*xl文件夾下有sharedStrings.xml,styles.xml,workbook.xml三個文件,第一個是放共享字符的,在msdn上說
*在這里可以定義各種語言的字符,然后在sheet.xml里引用這個來達到國際化,而不用為每種語言建立一個excel,styles
* 可能是樣式吧,workbook.xml是表的總體情況,有幾個sheet等等。
*接著是該文件夾下的worksheets文件夾,里面放的是每個sheet的具體內(nèi)容,比如在workbook.xml定義有3個sheet,那么
* 在這里你就能看到三個文件,文件名對應workbook.xml中sheet節(jié)點的name屬性,但是這里要注意大小寫
* 打開一個sheet1.xml文件,可以看到這里定義了該sheet中的行和列的信息,具體在程序里有介紹。
* 讀取簡單的工作表文件的內(nèi)容基本上用到這些,如果還要對文件進行操作的話,可能還可以修改字體,樣式什么的。
*
import java.io.File;
import java.io.InputStream;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
public class ReadExcel2007 {
public static void main(String[] args){
try{
//解壓Book1.xlsx
ZipFilexlsxFile =new ZipFile(new File("c:\\l_f3.201004.xlsx"));
DocumentBuilderFactorydbf = DocumentBuilderFactory.newInstance();
//先讀取sharedStrings.xml這個文件備用
ZipEntrysharedStringXML = xlsxFile.getEntry("xl/sharedStrings.xml");
InputStreamsharedStringXMLIS = xlsxFile.getInputStream(sharedStringXML);
DocumentsharedString= (Document)dbf.newDocumentBuilder().parse(sharedStringXMLIS);
NodeListstr=((org.w3c.dom.Document)sharedString).getElementsByTagName_r("t");
StringsharedStrings[]=new String[str.getLength()];
for(intn=0;n<str.getLength();n++){
Element element=(Element)str.item(n);
//System.out.println(element.getTextContent());
sharedStrings[n]=element.getTextContent();
}
//找到解壓文件夾里的workbook.xml,此文件中包含了這張工作表中有幾個sheet
ZipEntryworkbookXML = xlsxFile.getEntry("xl/workbook.xml");
InputStreamworkbookXMLIS = xlsxFile.getInputStream(workbookXML);
Document doc= dbf.newDocumentBuilder().parse(workbookXMLIS);
//獲取一共有幾個sheet
NodeListnl=doc.getElementsByTagName_r("sheet");
for(inti=0;i<nl.getLength();i++){
Element element=(Element)nl.item(i);//將node轉(zhuǎn)化為element,用來得到每個節(jié)點的屬性
System.out.println(element.getAttribute("name"));//輸出sheet節(jié)點的name屬性的值
//接著就要到解壓文件夾里找到對應的name值的xml文件,比如在workbook.xml中有<sheetname="Sheet1" sheetId="1" r:id="rId1" /> 節(jié)點
//那么就可以在解壓文件夾里的xl/worksheets下找到sheet1.xml,這個xml文件夾里就是包含的表格的內(nèi)容
ZipEntrysheetXML=xlsxFile.getEntry("xl/worksheets/sheet"+element.getAttribute("sheetId").toLowerCase()+".xml");
InputStream sheetXMLIS=xlsxFile.getInputStream(sheetXML);
Document sheetdoc= dbf.newDocumentBuilder().parse(sheetXMLIS);
NodeList rowdata=sheetdoc.getElementsByTagName_r("row");
for(int j=0;j<rowdata.getLength();j++){
//得到每個行
//行的格式:
Element row=(Element)rowdata.item(j);
//根據(jù)行得到每個行中的列
NodeList columndata=row.getElementsByTagName_r("c");
for(int k=0;k<columndata.getLength();k++){
Element column=(Element)columndata.item(k);
NodeList values=column.getElementsByTagName_r("v");
Element value=(Element)values.item(0);
if(column.getAttribute("t")!=null&column.getAttribute("t").equals("s")){
//如果是共享字符串則在sharedstring.xml里查找該列的值
System.out.print(sharedStrings[Integer.parseInt(value.getTextContent())]+"");
}else{
System.out.print(value.getTextContent()+" ");
}
}
System.out.println();