python讀取word文檔中的表格內容

1. 使用到的庫 :docx(python_docx‑0.8.10‑py2.py3‑none‑any.whl)

下載地址:https://download.lfd.uci.edu/pythonlibs/n5jyqt7p/python_docx-0.8.10-py2.py3-none-any.whl
安裝方式:pip install python_docx‑0.8.10‑py2.py3‑none‑any.whlpython

2. 使用方法
from docx import Document
#讀取文檔
doc = Document(filename) #filename爲word文檔

#獲取文檔中的表格
doc.tables  #獲取文檔的表格個數 len(doc.tables)

#讀取第1個表格
tb1=doc.tables[0]

#獲取第一個表格的行
tb1.rows  #獲取表格的行數len(tb1.rows)

#讀取表格的第一行的單元格
row_cells=tb1.rows[0].cells

#讀取第一行全部單元格的內容
for cell in row_cells:
	print(cell.text)
3. 示例

讀取 test.docx 文檔中的表格內容,以下:
在這裏插入圖片描述
示例代碼:web

from docx import Document

filename='test.docx'

doc = Document(filename)

tables=doc.tables

for i in range(len(tables)):
    tb=tables[i]
    #獲取表格的行
    tb_rows=tb.rows
    #讀取每一行內容
    for i in range(len(tb_rows)):
        row_data=[]
        row_cells=tb_rows[i].cells
        #讀取每一行單元格內容
        for cell in row_cells:
            #單元格內容
            row_data.append(cell.text)
        print(row_data)

結果以下:
在這裏插入圖片描述app