十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
1、python-pptx模块简介
你所需要的网站建设服务,我们均能行业靠前的水平为你提供.标准是产品质量的保证,主要从事成都网站设计、成都做网站、企业网站建设、移动网站建设、网页设计、品牌网站设计、网页制作、做网站、建网站。成都创新互联公司拥有实力坚强的技术研发团队及素养的视觉设计专才。
使用python操作PPT,需要使用的模块就是python-pptx,下面来对该模块做一个简单的介绍。这里提前做一个说明:python操作PPT,最好是我们提前设计好自己的一套样式,然后利用进行python进行内容的获取和填充(最主要的功能!),最好是不用使用python代码操作PPT的格式,格式的修改肯定不如我们直接在PPT中修改方便。
这里有一点需要注意的是:安装的库是python-pptx,但是导入的时候却有点不同。
在使用python操作PPT之前,首先应该清楚PPT的结构,这个对于之后代码的编写很有帮助
结果如下:
结果如下:
结果如下:
5)获取某一页Slide中的内容
结果如下:
这个概念在下面的效果中,会得以体现。其中prs.slide_layouts[]传入0表示获取的是第一个版式,传入1表示获取的是第二个版式,以此类推下去。
效果如下:
② PPT内容的填写
效果如下:
效果如下:
② 段落的添加
效果如下:
③ 给段落设定层级关系
效果如下:
效果如下:
第一种展示:
效果如下:
第二种展示:
效果如下:
结果如下:
上面我们已经知道怎么添加文本框,现在我们需要做的就是,怎么调整文本框的位置。
结果如下:
结果如下:
结果如下:
当然这里还有一些其他样式的调整,和word很类似,就不一一叙述了。
代码如下:
结果如下:
就直接写脚本,给你举给例子:
编写工具:
1.设计目标:
首先说一下我要工具的功能:
遍历某个目录下包括其下子目录中所有指定的后缀文件,然后为这些文件的头部插入指定的字符串。
2.使用场景:
设计这样的工具起因是我最近在将之前 CSDN 中的博客搬运到自己的 Hexo 博客空间上,了解的应该知道,假如都是 Markdown 编写的话,搬运的时候只需要在文件头部加上如下的一串额外的内容:
---
title: 博客标题
date: 博客创建时间(例如:2016-09-03 17:15:22)
tags: 标签(如:[Hexo,Next],多个的话用,号隔开)
categories: 分类(如:Web)
---123456
标题 title 直接使用文件名称去掉 .md 后缀即可;
时间 date 需要通过文件库获取文件的创建时间;
标签 tags 和分类 categories ,由于我的文件会根据分类放入不同的子目录下,所以直接获取当前文件所在目录的名称即可。
此外,为了在博客首页只展示部分内容,而不是展开博客的完整内容,还需要在博客中恰当的位置插入这个标签:!--more-- ,通常加载第一段内容结束的位置。
3.实现代码:
根据上面的思路,我们在 source/_posts 目录下创建一个工具脚本,起名为 SuitFileToHexo.py ,然后依次完成以下步骤:
指定 Linux 环境下 Python 解释器目录,并指定编码方式:
#!/usr/bin/env python# -*- coding: utf-8 -*-
引入的模块:
在脚本开始的地方,最先需要做的事情就是把需要用到的模块都先引入进来,大致分析一下我们这个功能需要用到的模块:
import os.path,time
1
遍历当前目录下所有 .md 文件列表:
这就需要使用到 Python 的文件目录操作模块 os.path ,使用 os.listdir 获取目录列表,然后通过 os.path.splitext 分割文件名称和后缀名,从而筛选合格的文件:
# 获取指定目录指定后缀名的文件列表def getFileList(path,endStr):'''获取指定目录下,指定后缀的文件列表'''r_list = []
f_list = os.listdir(path) #获取目录列表for i in f_list: # 分离文件名和后缀名,过滤掉工具脚本
file_endStr = os.path.splitext(i)[1] # 判断是否是目录
if os.path.isdir(i):
f_list1 = os.listdir(path+'/'+i) for j in f_list1: # 过滤出指定后缀 endStr 后缀的文件
if os.path.splitext(j)[1] == endStr: # 为了清晰目录把文件所在目录也标识出来
r_list.append(i+'/'+j) # print j.decode("string_escape")
elif file_endStr == endStr:
r_list.append(i)return r_list
这里发现了一个问题,就是在 os.path.isdir(i) 在 2.7.11 的版本莫名其妙地返回 false,需要做如下修改才能正常:
if file_endStr == '':
i = os.path.join(path, i) #=================〉这一行很必要
# print i
# 判断是否是目录
if os.path.isdir(i):
...
获取文件的创建时间:
需要使用到 os.time 模块的功能:
# 获取文件创建时间def get_FileCreateTime(filePath):
t = os.path.getctime(filePath) return TimeStampToTime(t)# 把时间戳转化为时间: 1479264792 to 2016-11-16 10:53:12'''def TimeStampToTime(timestamp):
timeStruct = time.localtime(timestamp) return time.strftime('%Y-%m-%d %H:%M:%S',timeStruct)
获取博客标题:
其实就是从目录字符串中截掉后缀名,再截掉最后一个 / 之前的内容即可得到博客名称:
# 获取目录中去掉前面路径和后缀的文件名字def getFileSimpleName(filePath):
name = ''
# 先去掉后缀
name = os.path.splitext(filePath)[0] # 获取最后一个斜杠位置
index = name.rfind('/') # 找不到则返回 -1
if index != -1: # 截取斜杠后面到结尾内容
name = name[index+1:] # print name
return name
获取文件所在的目录名称作为页签值:
与获取博客名称思路略有相似,获取最后一个斜杠位置,截掉斜杠之后的内容,在获取一个最后一个斜杠位置,假如有则截取斜杠之后的内容即是文件所在目录的名称:
# 获得分类文件目录名称def getTypeNameByPath(filePath):fileTag = ''# 获取最后一个斜杠位置index = filePath.rfind('/')# 找不到则返回 -1if index != -1: # 截取斜杠后面到结尾内容
fileTag = filePath[:index] # 截掉前面部分
index = fileTag.rfind('/') if index != -1:
fileTag = fileTag[index+1:]# print fileTagreturn fileTag
向文件中插入内容:
调用以上方法即可分别得到我们想要的信息:
# 指定目录path = './'# 得到文件列表files = getFileList(path,'.md')
for i in files: print 'title: '+getFileSimpleName((i.decode("string_escape"))) print 'date: '+get_FileCreateTime((path+i.decode("string_escape"))) print 'tags: ['+getTypeNameByPath((i.decode("string_escape")))+']'
接下来要做的就是把这些内容按照格式插入到文件中去,当然插入之前需要先检查文件中是否已经插入过类似的内容了,可以简单地通过检查开头 40 个字符串中是否包含这个字符串来判别:
'''---
title: '''
关于展示分隔符 !--more-- 插入的位置,大致逻辑是:第一个标题后面,而且刚好插入在第二个标题之前即可,而使用 Markdown 语法撰写的博客标题使用 # 来表示的,最终的插入方法如下:
# 向文件中插入指定数据def addHeadToFile(filePath,title,date,tags):file = open(filePath,"r")
content = file.read()
index = content[:40].find('''---
title:''')# 添加if index == -1: print 'Undadded'
addContent = '''---
title: '''+title+'''
date: '''+date+'''
tags: ['''+tags+''']
categories: '''+tags+'''
hr /
'''
# 检测是否插入部分显示标签
content = addContent + content
index = content.find('''!--more-- ''') if index == -1: # 获取第一段的位置
index = content.find('''### ''') if index != -1: #print "first ### pos = ",index
# 下一个标题位置(在第二个标题之前插入即可)
pos = content[index:].find('''
#''',1) if pos != -1:
index += pos #print "second enter pos = ",index
content = content[:index]+'''
!--more--
'''+content[index:]
file = open(filePath,"w")
file.write(content)else: #print 'file head had added'# 记得要关闭文件file.close()
最后完整的调用过程:
# 指定目录path = './'# 得到文件列表files = getFileList(path,'.md')
# 声明一些全局变量title = ''date = ''tags = ''for i in files:
title = getFileSimpleName(i.decode("string_escape"))
date = get_FileCreateTime(path+i.decode("string_escape"))
tags = getTypeNameByPath(i.decode("string_escape")) print 'title: '+title print 'date: '+date print 'tags: ['+tags+']'
addHeadToFile(path+i.decode("string_escape"),title,date,tags)
使用第三方库
官方文档:pymupdf.readthedocs.io/en/latest/
提取图片的整体逻辑如下:
将每一页转换为一张张图片
安装pdf2image, github:github.com/Belval/pdf2…
安装:
使用库: github.com/2Dou/waterm…
步骤:
1.获得一个带水印pdf文件
1.1在图片添加水印,图片插入到word,word保存为pdf
1.2python处理:参考
github.com/2Dou/waterm…
mp.weixin.qq.com/s/_oJA6lbsd…
2.将水印pdf文件合并到源目标pdf文件的每一页
法1,直接在word,插入文本框,旋转,设置无边框,注意设置背景透明,然后复制多个。导出为pdf。
法2,word本身自己的增加水印,设计-水印-自定义文字或图片。缺点是只能是单个水印。
缺点是水印在内容pdf上方,如果设置过大,颜色不太透明,会遮挡内容。
解密:并不是破解,而是在已知密码的情况下解密
作者:秦与商
链接:
第一种:Robot Framework
作为最重要的python测试框架之一,Robot Framework主要被用在测试驱动类型的开发与验收中。虽然由python开发而来,但是它也可以在基于.net的Ironpython和基于Java的Jython上运行。同时,作为一个python框架,Robot还能够兼容诸如Windows、MacOS、Linux等平台。
在使用Robot Framework之前,需要先安装python2.7.14及以上版本,在这里推荐大家使用python3.6.4,以确保适当的注解能够被添加到代码段中,并能够跟踪程序的更改,同时,您还需要安装python包管理器--pip。
第二种:Pytest
适用于多种软件测试的Pytest,是另一个python类型的自动化测试框架。凭借着开源和易学的特点,该工具经常被QA团体、开发团体、个人团体以及各种开源项目所使用。鉴于Pytest具有断言重写之类的实用功能,许多大型互联网应用,如Dropbox、Mozilla,都已经从下面将要提到的unittest切换到了Pytest之上。
除了基本的python知识,用户并不需要更多的技术储备。另外,用户只需要有一台带有命令行界面的测试设备,并且安装好了python包管理器以及可用于开发的IDE工具。
第三种:UnitTest/PyUnit
受到Junit启发的UnitTest/PyUnit,也是一种标准化的针对单元测试的python类自动化测试框架。它的基类TestCase提供了各种断言方法、以及所有清理和设置的例程。因此,TestCase子类中的每一种方法都是以test作为名词点缀,以标识它们能够被作为测试用例所运行。用户可以使用load方法和TestSuite类来分组、并加载各种测试。当然,也可以通过联合使用,来构建自定义的测试运行器。正如我们使用Junit去测试Selenium那样,UnitTest也会用到unittest-sml-reporting,并能生成各种XML类型的报告。
第四种:Behave
行为驱动开发是一种基于敏捷软件开发的方法。它能够鼓励开发人员、业务参与者和QA人员,三者之间的协作。python测试框架Behave允许团队避开各种复杂的情况,去执行BDD测试。从本质上说该框架与SpecFlow和Cucumber相似,常被用于执行自动化测试。用户可以通过简单易读的语言来编写测试用例,并能够在其执行期间粘贴到代码之中。而且,那些被设定的行为规范与步骤,也可以被重用到其他的测试方案中。
第五种:Lettuce
Lettuce是另一种基于Cucumber和python的行为驱动类自动化工具。Lettuce主要专注于那些具有行为驱动开发特性的普通任务。它不但简单易用,而且能够使得整个测试过程更流畅、甚至更有趣。
您需要安装带有IDE的python2.7.14及以上版本。当然,您也可以使用pycharm或任何其他IDE工具。同时,您还需要安装python包管理器。