python培训之如何在word中读取表格内容

发布时间:2022-12-28 09:43:51 人气:65 作者:多测师

  python如何在word中读取表格内容

  word文件看起来很复杂,不方便结构化。事实上,word文档中大概有几种内容:paragraph(段落)、table(表格)、character(字符)。我现在要分析的word文档基本都是段落和表格。本文主要讲述从word中分析表格,并将表格信息结构化的方法。

  1、为了使用python解析word文件,可以使用包docx,首先需要在python中安装它。

  pip install python-docx

  2、安装后,就可以读取word文件。

  importdocx

  fn= r'D:\长恨歌.docx'doc=docx.Document(fn)#按段落读取全部数据

python培训之如何在word中读取表格内容

  for paragraph indoc.paragraphs:print(paragraph.text)#按表格读取全部数据

  for table indoc.tables:for row intable.rows:for cell inrow.cells:print(cell.text)

  table_num=len(doc.tables)#获取文档的表格个数

  print(table_num)

  table_0=doc.tables[0]#选取第一个表

  table_rows =len(table_0.rows)#获取第一个表的行数

  print(table_rows)

  tab=doc.tables[0].rows[0].cells[0]#获取第一张表第一行第一列数据

  print(tab.text)

  par= doc.paragraphs[2]#读取第三段数据

  print(par.text)

  以上就是python在word中读取表格内容的方法,希望对大家有所帮助。更多Python学习指路:请关注多测师。https://www.e70w.com/xwzx/




返回列表
在线客服
联系方式

热线电话

17727591462

上班时间

周一到周五

二维码
线