下載地址:https://download.lfd.uci.edu/pythonlibs/n5jyqt7p/python_docx-0.8.10-py2.py3-none-any.whl
安裝方式:pip install python_docx‑0.8.10‑py2.py3‑none‑any.whlpython
from docx import Document #讀取文檔 doc = Document(filename) #filename爲word文檔 #獲取文檔中的表格 doc.tables #獲取文檔的表格個數 len(doc.tables) #讀取第1個表格 tb1=doc.tables[0] #獲取第一個表格的行 tb1.rows #獲取表格的行數len(tb1.rows) #讀取表格的第一行的單元格 row_cells=tb1.rows[0].cells #讀取第一行全部單元格的內容 for cell in row_cells: print(cell.text)
讀取 test.docx 文檔中的表格內容,以下:
示例代碼:web
from docx import Document filename='test.docx' doc = Document(filename) tables=doc.tables for i in range(len(tables)): tb=tables[i] #獲取表格的行 tb_rows=tb.rows #讀取每一行內容 for i in range(len(tb_rows)): row_data=[] row_cells=tb_rows[i].cells #讀取每一行單元格內容 for cell in row_cells: #單元格內容 row_data.append(cell.text) print(row_data)
結果以下:
app